DataFrame API: от Dask к PySpark // Демо-занятие курса «MLOps»
Автор: OTUS IT Онлайн - образование
Загружено: 2023-05-16
Просмотров: 427
Описание:
Продолжение темы DataFrame API. Данные ещё умещаются на дисковый массив, но 16 ядер уже явно не хватает для быстрой обработки. Dask вновь готов помочь, предоставляя возможность для распределенных вычислений на нескольких узлах.
И вот мы достигли апогея этой истории. Поддерживать отдельный Dask-кластер из такого большого числа узлов становится нерентабельным, и мы переезжаем в общий Spark-кластер. Но благодаря pandas API on Spark всё еще остаемся вместе с так полюбившимся нам многоликим зверьком.
«MLOps» - https://otus.pw/O6GO/
Преподаватель: Павел Филонов - автор серии докладов про ML, С++, управление DS проектами и развитии команды
Подключайтесь к обсуждению в чате - https://otus.pw/baKq/
Пройдите опрос по итогам мероприятия - https://otus.pw/lwc2/
Следите за новостями проекта:
Telegram: https://t.me/Otusjava
ВКонтакте: https://otus.pw/850t
LinkedIn: https://otus.pw/yQwQ/
Хабр: https://otus.pw/S0nM/
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: