Use PySpark to process a large Parquet file on Google Dataproc via JupyterLab Notebook
Автор: Codible
Загружено: 2025-04-17
Просмотров: 292
Описание:
Takes you through how to get started using PySpark on a Google Dataproc (Hadoop) cluster, using a JupyterLab Notebook. We ingest a Parquet file from the NYC Taxi Data website:
https://www.nyc.gov/site/tlc/about/tl...
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: