ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

Petabyte-Scale Data Quality: Leveraging AI to Build a Production Web Classifier

Автор: Machine & Deep Learning Israel

Загружено: 2026-01-26

Просмотров: 41

Описание: הרצאה זו היא חלק ממיטאפ משותף עם חברת Cyera וקהילת MDLI
אתם יכולים לצפות בשאר ההרצאות ובמצגות פה: https://mdli.co.il/classifyai


In this talk, I'll share how I tackled the challenge of filtering dead webpages at petabyte scale by combining AI, machine learning, and strategic preprocessing techniques. I'll walk through my approach to classifying pages with meaningful content versus empty or dead pages, starting with data science techniques for exploratory analysis and leveraging AI to automate the labeling process.


You'll see how I found a production-grade solution that operates at massive scale, along with the key architectural decisions that made this solution work in a real-world, high-volume environment. Whether you're dealing with large-scale data pipelines or interested in practical applications of AI for data quality problems, you'll learn how to approach similar challenges in your own infrastructure.

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Petabyte-Scale Data Quality: Leveraging AI to Build a Production Web Classifier

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

Demystifying MCP Communication: A Deep Dive into Transport Layers, Failures, and Fixes

Demystifying MCP Communication: A Deep Dive into Transport Layers, Failures, and Fixes

Reasoning Models Explained - Beyond Next Token Prediction (Lior Cohen, NVIDIA)

Reasoning Models Explained - Beyond Next Token Prediction (Lior Cohen, NVIDIA)

From Chaos to Control: Observability Practices for AI Agents

From Chaos to Control: Observability Practices for AI Agents

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

На меня напали… Розыгрыш в спортзале «Анатолий» пошел не так… | Притворился уборщиком

На меня напали… Розыгрыш в спортзале «Анатолий» пошел не так… | Притворился уборщиком

SLMs are WAY too big

SLMs are WAY too big

Доработайте свою степень магистра права за 13 минут. Вот как

Доработайте свою степень магистра права за 13 минут. Вот как

ДОСТОЕВСКИЙ: СЕКРЕТНЫЕ ДНЕВНИКИ о ЕВРЕЯХ! то что скрывали 140 ЛЕТ после смерти ГЕНИЯ!

ДОСТОЕВСКИЙ: СЕКРЕТНЫЕ ДНЕВНИКИ о ЕВРЕЯХ! то что скрывали 140 ЛЕТ после смерти ГЕНИЯ!

Нейронка, которая УНИЧТОЖИЛА ChatGPT 5! / Обзор бесплатной нейросети и ее возможности

Нейронка, которая УНИЧТОЖИЛА ChatGPT 5! / Обзор бесплатной нейросети и ее возможности

Обвал цен на 90%, изменивший всё.

Обвал цен на 90%, изменивший всё.

Когда газовая промышленность потерпела крах, мы выживали на солевых газах.

Когда газовая промышленность потерпела крах, мы выживали на солевых газах.

The ins-and-outs of LTX Video

The ins-and-outs of LTX Video

Этот «блинчатый» двигатель может сделать электромобили невероятно быстрыми (Mercedes его купил).

Этот «блинчатый» двигатель может сделать электромобили невероятно быстрыми (Mercedes его купил).

Гайд по скрытым возможностям Gemini. Хватит платить за подписки!

Гайд по скрытым возможностям Gemini. Хватит платить за подписки!

Let's Build A Teacher's Grading AI Agent!

Let's Build A Teacher's Grading AI Agent!

9 Скрытых Фишек ChatGPT о которых никто не говорит

9 Скрытых Фишек ChatGPT о которых никто не говорит

Data Science Agents with BigQuery and Gemini

Data Science Agents with BigQuery and Gemini

РЕАЛЬНОСТЬ НЕ СУЩЕСТВУЕТ | Пока вы на неё не посмотрите

РЕАЛЬНОСТЬ НЕ СУЩЕСТВУЕТ | Пока вы на неё не посмотрите

ЛУЧШАЯ БЕСПЛАТНАЯ НЕЙРОСЕТЬ Google, которой нет аналогов

ЛУЧШАЯ БЕСПЛАТНАЯ НЕЙРОСЕТЬ Google, которой нет аналогов

Ученые ЦЕРН обнаружили скрытый слой под поверхностью реальности (и он не исчезнет).

Ученые ЦЕРН обнаружили скрытый слой под поверхностью реальности (и он не исчезнет).

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]