Use PySpark to process a large Parquet file on Google Dataproc via JupyterLab Notebook

Автор: Codible

Загружено: 2025-04-17

Просмотров: 292

Описание: Takes you through how to get started using PySpark on a Google Dataproc (Hadoop) cluster, using a JupyterLab Notebook. We ingest a Parquet file from the NYC Taxi Data website:
https://www.nyc.gov/site/tlc/about/tl...

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...

Use PySpark to process a large Parquet file on Google Dataproc via JupyterLab Notebook

Доступные форматы для скачивания:

Скачать видео

Информация по загрузке:

Скачать аудио

Похожие видео

Connect to Dataproc (Hadoop cluster) on Google Cloud Platform

Connect to Dataproc (Hadoop cluster) on Google Cloud Platform

Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности

Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

Ночные пробуждения в 3–4 часа: как найти причину и вернуть глубокий сон.

Ночные пробуждения в 3–4 часа: как найти причину и вернуть глубокий сон.

Day 14: Event Driven Architecture

Day 14: Event Driven Architecture

Как устроена База Данных? Кластеры, индексы, схемы, ограничения

Как устроена База Данных? Кластеры, индексы, схемы, ограничения

Запуск заданий Apache Spark на бессерверном Dataproc

Запуск заданий Apache Spark на бессерверном Dataproc

КАК НЕЛЬЗЯ ХРАНИТЬ ПАРОЛИ (и как нужно) за 11 минут

КАК НЕЛЬЗЯ ХРАНИТЬ ПАРОЛИ (и как нужно) за 11 минут

Где начало СХЕМЫ? Понимаем, читаем, изучаем схемы. Понятное объяснение!

Где начало СХЕМЫ? Понимаем, читаем, изучаем схемы. Понятное объяснение!

Jazz & Soulful R&B smooth Grooves Relaxing instrumental Playlist /Focus/study

Jazz & Soulful R&B smooth Grooves Relaxing instrumental Playlist /Focus/study

Учебник по Excel за 15 минут

Учебник по Excel за 15 минут

Using PySpark on Dataproc Hadoop Cluster to process large CSV file

Using PySpark on Dataproc Hadoop Cluster to process large CSV file

Kubernetes — Простым Языком на Понятном Примере

Kubernetes — Простым Языком на Понятном Примере

Краткое объяснение больших языковых моделей

Краткое объяснение больших языковых моделей

Музыка для работы за компьютером | Фоновая музыка для концентрации и продуктивности

Музыка для работы за компьютером | Фоновая музыка для концентрации и продуктивности

КАК УСТРОЕН TCP/IP?

КАК УСТРОЕН TCP/IP?

Создайте ВСЁ, ЧТО УГОДНО, с Gemini 3 | Подкаст Agent Factory

Создайте ВСЁ, ЧТО УГОДНО, с Gemini 3 | Подкаст Agent Factory

Лучший Гайд по Kafka для Начинающих За 1 Час

Лучший Гайд по Kafka для Начинающих За 1 Час

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Визуализация внимания, сердце трансформера | Глава 6, Глубокое обучение

Визуализация внимания, сердце трансформера | Глава 6, Глубокое обучение