ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

Apache Datasketches for Big Data Analysis

Автор: Big Data LDN

Загружено: 2023-10-31

Просмотров: 888

Описание: 16:00 - 16:30 | FAST DATA THEATRE

APACHE DATASKETCHES FOR BIG DATA ANALYSIS
WEDNESDAY 20 SEPTEMBER 2023
SPEAKER: CHARLIE DICKENS, YAHOO

Many businesses face queries such as counting unique identifiers, finding frequent items, and understanding data distributions. However, these tasks are incredibly resource intensive at a large scale; particularly on streaming data or for real-time analytics. Given the rapid growth in dataset sizes, performing this type of analysis is now crucial to organisations of all sizes, rather than simply large enterprises.

We present Apache Software Foundation (ASF) DataSketches; a high-performance library for efficient large-scale data analysis. Using DataSketches, analysis can be performed orders of magnitudes faster than brute force. The sketches are extremely small compared to the original data and can be easily integrated into data cubes for efficient aggregate analysis. Our library is distributed in both Java and C++ and also has bindings to Python. It is compatible with Druid, Cloudera, Hive, Impala, PostgreSQL, Pinot, and Iceberg, in addition to being used by companies such as Yahoo. Our open-source library is free for any person or organisation to use.

We will introduce the audience to the notion of data sketching and detail the key wins they can expect by deploying these approaches. We will demonstrate how to use the sketches for OLAP-type queries using the Python API. Finally, we will showcase the key mergeability feature of our sketches. Using this feature we will show how to include sketches in data cubes so that aggregate statistics can easily be found over varying time periods. This is an example of a type of analysis for which a brute-force approach simply would not scale.

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Apache Datasketches for Big Data Analysis

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

Apache DataSketches A Production Quality Sketching Library for the Analysis of Big Data

Apache DataSketches A Production Quality Sketching Library for the Analysis of Big Data

08. The True Cost of AI: Rate Limits, Tokens, and Evaluation

08. The True Cost of AI: Rate Limits, Tokens, and Evaluation

Rapid Cloud Data Migrations With Confluent Cloud

Rapid Cloud Data Migrations With Confluent Cloud

Лучший Гайд по Kafka для Начинающих За 1 Час

Лучший Гайд по Kafka для Начинающих За 1 Час

Разбор инфраструктуры реального проекта. Стоит ли внедрять Kubernetes?

Разбор инфраструктуры реального проекта. Стоит ли внедрять Kubernetes?

How Theta Sketches Provide Huge Speed Advantages via Approximation

How Theta Sketches Provide Huge Speed Advantages via Approximation

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

ПОЛНЫЙ РАЗБОР URL: Пагинация, версионирование API, фильтрация, сортировка и другие возможности

ПОЛНЫЙ РАЗБОР URL: Пагинация, версионирование API, фильтрация, сортировка и другие возможности

Methods & Frameworks for a value-driven and ethical Data & Analytics strategy

Methods & Frameworks for a value-driven and ethical Data & Analytics strategy

FastMCP, Model Context Pragmatism

FastMCP, Model Context Pragmatism

Hyperloglog: Facebook's algorithm to count distinct elements

Hyperloglog: Facebook's algorithm to count distinct elements

Понимание GD&T

Понимание GD&T

КАК УСТРОЕН TCP/IP?

КАК УСТРОЕН TCP/IP?

Сисадмины больше не нужны? Gemini настраивает Linux сервер и устанавливает cтек N8N. ЭТО ЗАКОННО?

Сисадмины больше не нужны? Gemini настраивает Linux сервер и устанавливает cтек N8N. ЭТО ЗАКОННО?

Как сжимаются изображения? [46 МБ ↘↘ 4,07 МБ] JPEG в деталях

Как сжимаются изображения? [46 МБ ↘↘ 4,07 МБ] JPEG в деталях

Как LLM могут хранить факты | Глава 7, Глубокое обучение

Как LLM могут хранить факты | Глава 7, Глубокое обучение

Самая сложная модель из тех, что мы реально понимаем

Самая сложная модель из тех, что мы реально понимаем

Визуализация внимания, сердце трансформера | Глава 6, Глубокое обучение

Визуализация внимания, сердце трансформера | Глава 6, Глубокое обучение

Сети для несетевиков // OSI/ISO, IP и MAC, NAT, TCP и UDP, DNS

Сети для несетевиков // OSI/ISO, IP и MAC, NAT, TCP и UDP, DNS

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]