ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

Tuning Apache Spark for Large Scale Workloads - Sital Kedia & Gaoxiang Liu

Автор: Databricks

Загружено: 2017-06-12

Просмотров: 45720

Описание: Apache Spark is a fast and flexible compute engine for a variety of diverse workloads. Optimizing performance for different applications often requires an understanding of Spark internals and can be challenging for Spark application developers. In this session, learn how Facebook tunes Spark to run large-scale workloads reliably and efficiently. The speakers will begin by explaining the various tools and techniques they use to discover performance bottlenecks in Spark jobs. Next, you'll hear about important configuration parameters and their experiments tuning these parameters on large-scale production workload.

You'll also learn about Facebook's new efforts towards automatically tuning several important configurations based on nature of the workload. The speakers will conclude by sharing their results with automatic tuning and future directions for the project.ing several important configurations based on nature of the workload. We will conclude by sharing our result with automatic tuning and future directions for the project.

Session hashtag: #SFexp1

Session overview:
Apache Spark at Facebook
Spark Architecture
Scaling Spark Driver
Dynamic Executor Allocation
Multi-threaded event processor
Better fetch failure handling
Scaling Spark Driver
executor memory layout
Tuning memory configurations
Eliminating disk i/o bottleneck
Scaling external shuffle service
Cache index files on shuffle server
Scaling external shuffle service
Application tuning
motivation
Auto tuning of mapper and reducer
Tools
Resources
Questions?

Sign up for a 1-day course on Apache Spark Tuning and Best Practices: https://bit.ly/2I0KMcj

About: Databricks provides a unified data analytics platform, powered by Apache Spark™, that accelerates innovation by unifying data science, engineering and business.
Read more here: https://databricks.com/product/unifie...

Connect with us:
Website: https://databricks.com
Facebook:   / databricksinc  
Twitter:   / databricks  
LinkedIn:   / databricks  
Instagram:   / databricksinc   Databricks is proud to announce that Gartner has named us a Leader in both the 2021 Magic Quadrant for Cloud Database Management Systems and the 2021 Magic Quadrant for Data Science and Machine Learning Platforms. Download the reports here. https://databricks.com/databricks-nam...

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Tuning Apache Spark for Large Scale Workloads - Sital Kedia & Gaoxiang Liu

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

Everyday I'm Shuffling - Tips for Writing Better Apache Spark Programs

Everyday I'm Shuffling - Tips for Writing Better Apache Spark Programs

Tuning and Debugging Apache Spark

Tuning and Debugging Apache Spark

Apache Spark был сложным, пока я не изучил эти 30 концепций!

Apache Spark был сложным, пока я не изучил эти 30 концепций!

The Parquet Format and Performance Optimization Opportunities Boudewijn Braams (Databricks)

The Parquet Format and Performance Optimization Opportunities Boudewijn Braams (Databricks)

A Tale of Three Apache Spark APIs: RDDs, DataFrames, and Datasets - Jules Damji

A Tale of Three Apache Spark APIs: RDDs, DataFrames, and Datasets - Jules Damji

Введение в MCP | Протокол MCP - 01

Введение в MCP | Протокол MCP - 01

Apache Spark Memory Management

Apache Spark Memory Management

From Query Plan to Performance: Supercharging your Apache Spark Queries using the Spark UI SQL Tab

From Query Plan to Performance: Supercharging your Apache Spark Queries using the Spark UI SQL Tab

Apache Spark Core – Practical Optimization Daniel Tomes (Databricks)

Apache Spark Core – Practical Optimization Daniel Tomes (Databricks)

Мир AI-агентов уже наступил. Что меняется прямо сейчас

Мир AI-агентов уже наступил. Что меняется прямо сейчас

Making Apache Spark™ Better with Delta Lake

Making Apache Spark™ Better with Delta Lake

Лучший Гайд по Kafka для Начинающих За 1 Час

Лучший Гайд по Kafka для Начинающих За 1 Час

Apache Spark Core—Deep Dive—Proper Optimization Daniel Tomes Databricks

Apache Spark Core—Deep Dive—Proper Optimization Daniel Tomes Databricks

New Developments in the Open Source Ecosystem: Apache Spark 3 0, Delta Lake, and Koalas

New Developments in the Open Source Ecosystem: Apache Spark 3 0, Delta Lake, and Koalas

Physical Plans in Spark SQL—continues - David Vrba (Socialbakers)

Physical Plans in Spark SQL—continues - David Vrba (Socialbakers)

Apache Spark Performance: Past, Future, and Present with Kay Ousterhout

Apache Spark Performance: Past, Future, and Present with Kay Ousterhout

Настройка Apache Spark Executor | Ядра и память Executor

Настройка Apache Spark Executor | Ядра и память Executor

Более глубокое понимание внутренних механизмов Spark — Аарон Дэвидсон (Databricks)

Более глубокое понимание внутренних механизмов Spark — Аарон Дэвидсон (Databricks)

⚡️АСЛАНЯН: Весь мир ЗАМЕР! Теперь ЯСНО, что готовят СИ и ПУТИН. В КНДР ЖЕСТЬ: вот, ЧТО УСТРОИЛ Ким

⚡️АСЛАНЯН: Весь мир ЗАМЕР! Теперь ЯСНО, что готовят СИ и ПУТИН. В КНДР ЖЕСТЬ: вот, ЧТО УСТРОИЛ Ким

Мировое правительство: Версия без мифов / Уроки истории / МИНАЕВ

Мировое правительство: Версия без мифов / Уроки истории / МИНАЕВ

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]