ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

Generate Fake Data using PySpark in 1 min

Автор: GeekCoders

Загружено: 2024-10-21

Просмотров: 689

Описание: Know more about the pyspark course: https://www.geekcoders.co.in/courses/...

import farsante
from mimesis import Person,Address,Datetime
p=Person('en')
ad=Address('en')
dt=Datetime()
df=farsante.pyspark_df([p.first_name,p.last_name,p.sex,p.age,ad.country,ad.country_code,ad.address,ad.city,ad.state,dt.year],100)
display(df)


You can use below code to generate the data using faker

from pyspark.sql import SparkSession
from pyspark.sql.functions import lit
from faker import Faker
import random

Initialize Faker and PySpark
fake = Faker()
spark = SparkSession.builder.appName("FakeData").getOrCreate()

Function to generate fake data
def generate_fake_data(num_records):
data = []
for _ in range(num_records):
data.append((
fake.name(),
fake.email(),
fake.address(),
fake.phone_number(),
fake.date_of_birth(minimum_age=18, maximum_age=90).strftime("%Y-%m-%d"),
random.randint(1000, 10000) # random salary
))
return data

Number of fake records you want
num_records = 1000

Generate the fake data
fake_data = generate_fake_data(num_records)

Create PySpark DataFrame
columns = ["Name", "Email", "Address", "Phone", "Date_of_Birth", "Salary"]
df = spark.createDataFrame(fake_data, columns)

Show some rows from the DataFrame
df.show(10, truncate=False)

Stop Spark session (optional)
spark.stop()


#pyspark #spark #bigdata #databricks

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Generate Fake Data using PySpark in 1 min

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

How to Start Coding | Programming for Beginners | Learn Coding | Intellipaat

How to Start Coding | Programming for Beginners | Learn Coding | Intellipaat

Delta Tables - Databricks Interview Question

Delta Tables - Databricks Interview Question

Ibiza Summer Mix 2025 🍓 Best Of Tropical Deep House Music Chill Out Mix 2025 🍓 Chillout Lounge

Ibiza Summer Mix 2025 🍓 Best Of Tropical Deep House Music Chill Out Mix 2025 🍓 Chillout Lounge

Create Fake Data Instantly with Python!

Create Fake Data Instantly with Python!

Building A Documentation Site with Antora UI Bundle – From Docs to Dev Portal

Building A Documentation Site with Antora UI Bundle – From Docs to Dev Portal

Learn Basic SQL in 15 Minutes | Business Intelligence For Beginners | SQL Tutorial For Beginners 1/3

Learn Basic SQL in 15 Minutes | Business Intelligence For Beginners | SQL Tutorial For Beginners 1/3

AI Agents for Data Engineers: Beyond Chatbots and Into Automation | @thedatamaster

AI Agents for Data Engineers: Beyond Chatbots and Into Automation | @thedatamaster

Самая холодная деревня в мире (Это видео стоило мне здоровья) -71°C

Самая холодная деревня в мире (Это видео стоило мне здоровья) -71°C

Andrej Karpathy: Software Is Changing (Again)

Andrej Karpathy: Software Is Changing (Again)

База по Базам Данных - Storage (Индексы, Paging, LSM, B+-Tree, R-Tree) | Влад Тен Систем Дизайн

База по Базам Данных - Storage (Индексы, Paging, LSM, B+-Tree, R-Tree) | Влад Тен Систем Дизайн

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]