Вебинар R Consortium — Масштабирование анализа данных в R с помощью Arrow
Автор: R Consortium
Загружено: 2026-02-10
Просмотров: 203
Описание:
Исторически масштабирование анализа данных в R означало добавление инфраструктуры или радикальное изменение стратегии анализа — поддержание базы данных, работу на кластере или рефакторинг кода для параллельной обработки данных.
Экосистема Arrow предлагает альтернативу: быстрый, эффективный с точки зрения памяти анализ без дополнительных затрат.
Этот вебинар охватит следующие темы:
эволюция современного стека данных
практические подходы к работе с большими наборами данных в R
влияние формата Parquet на рабочие процессы обработки данных
как Arrow позволяет обрабатывать данные, которые не помещаются в память
где вписываются такие инструменты, как DuckDB
Мы рассмотрим, с чего начать, реальные примеры и проектные решения, которые обеспечивают эффективную совместную работу этих инструментов.
Докладчик
Доктор Ник Крейн – консультант по R, NC Data Labs
Доктор Ник Крейн — преподаватель и консультант по R. Ник является одним из сопровождающих пакета Arrow для R, членом Комитета по управлению проектом Apache Arrow и соавтором книги «Масштабирование с помощью R и Arrow».
Ресурсы консорциума R
Основной сайт консорциума R: https://www.r-consortium.org/
Вебинары консорциума R: https://r-consortium.org/webinars/web...
Блог: https://r-consortium.org/blog/
LinkedIn: / r-consortium
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: