ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

DeepSeek-OCR 3B + Ollama (конвейер проверки)

Автор: Tech Expert Tutorials

Загружено: 2026-02-16

Просмотров: 592

Описание: Модели DeepSeek AI становятся все более популярными. Локальное развертывание модели распознавания текста и языка — это только первая половина задачи. Вторая половина — это валидация.

В этом видео мы выйдем за рамки эмпирических «крутых» результатов локального ИИ и создадим профессиональный набор инструментов для бенчмаркинга и конвейер обработки данных для DeepSeek-OCR 3B, работающий на Ollama.

Мы разработаем конвейер аудита на основе Python для количественной оценки точности извлечения с использованием метрик частоты ошибок распознавания слов (WER) и «мешка слов» (BoW).

Локальное распознавание текста, несомненно, мощно, но его надежность зависит от уровня валидации.

К концу этого видео мы перейдем от экспериментального ИИ к предсказуемому, готовому к производству конвейеру, обеспечивающему полную прозрачность целостности данных — и все это при сохранении ваших данных на 100% локально.

Что мы рассматриваем:
Метричная стратегия: Почему мы объединяем основанный на последовательностях WER с основанным на наборах данных Bag of Words (BoW) для обработки нелинейных структур документов.
Управление видеопамятью: Настройка политик поддержания соединения для обеспечения того, чтобы модели OCR и чата не конкурировали за ресурсы графического процессора.
Анализ сбоев: Выявление регрессий производительности в сложных формах и определение пороговых значений для ручной проверки.
Визуальный аудит: Создание тепловых карт HTML и различий в стиле Git для локализации ошибок извлечения.

Ресурсы и код:
Репозиторий GitHub: https://github.com/TechExpertTutorial...
Используемая модель: DeepSeek-OCR 3B (через Ollama)
Основные библиотеки: Ollama-Python, TorchMetrics, Re (Regex), Pillow (PIL)

#DeepSeek #Ollama #OCR #LocalAI #MachineLearning #Python #ComputerVision

Скоро:
Оптимизация DeepSeek-V3 для высокопроизводительных конвейеров.
Локальные конвейеры обработки данных OCR: интеграция данных OCR в базу данных.
Расширенная предварительная обработка: пользовательские фильтры OpenCV для проблемных документов.

Временные метки:
0:00 — Пробел в валидации локального OCR
0:13 — Автоматизированный конвейер
0:19 — Факторы, влияющие на точность модели
0:38 — Полный код в репозитории GitHub
1:12 — Настройка DeepSeek-OCR с Ollama
1:50 — Пошаговый разбор кода
2:05 — Совет по повышению производительности
2:22 — Реализация набора тестов с двойной метрикой (WER и BofW)
2:44 — Объяснение набора тестов и подсказок
4:10 — Запуск приложения
4:19 — Определение пороговых значений для ручной проверки
4:47 — Итоговый бенчмарк
4:57 — Подробный анализ каждого изображения в наборе тестов
6:05 — Поворот изображения и пакет CV
7:44 — Анализ тепловой карты визуального аудита
8:37 — Будущие видеоролики о конвейерах OCR
8:58 — Заключение — Продолжаем разработку

Популярное Видео:
▶️ Введение в Data Factory:    • Intro to Azure Data Factory: Moving data w...  
▶️ Azure SQL Server:    • Create Azure SQL DB - Free Version available  
▶️ Windows SQL Server:    • Install SQL Server 2022 on Windows 11 With...  
▶️ Gemini AI Assistant: https://gemini.google.com/

Похожие видео:
▶️ Установка MySQL на ваш компьютер (zip-версия): видео будет позже
▶️ Установка Oracle на ваш компьютер:    • How to Install Oracle Database on Windows ...  &list=PLkTmsEazx3GVRnn0X1nPqT0jrYQSuvF7j
▶️ Установка MS SQL Server на ваш компьютер:    • Install SQL Server 2022 on Windows 11 With...  &list=PLkTmsEazx3GVRnn0X1nPqT0jrYQSuvF7j
▶️ Установка Postgres на AWS:    • Видео  &list=PLkTmsEazx3GVRnn0X1nPqT0jrYQSuvF7j

Видео по теме OCR:
▶️ OpenAI GPT 5.2:    • Видео  
▶️ DeepSeek VL2 OCR:    • DeepSeek VL2 OCR for Images - Open Source ...  
▶️ Pytesseract OCR:    • How to Extract Text using Pytesseract OCR ...  
▶️ Python, Conda и VSCode:    • Best Python IDE- VSCode Setup: Includes Co...  
▶️ Azure OCR:    • Azure AI Vision API for OCR: Text Extracti...  &list=PLkTmsEazx3GWHS3nAffhrS-wdq873Hz7B
▶️ GCP OCR:    • Google Cloud Vision API for OCR Text Extra...  &list=PLkTmsEazx3GWHS3nAffhrS-wdq873Hz7B
▶️ OpenAI OCR:    • OpenAI GPT Vision OCR API with Python: Ext...  &list=PLkTmsEazx3GWHS3nAffhrS-wdq873Hz7B
▶️ Gemini AI OCR:    • Gemini AI OCR Text Extraction with Python:...  &list=PLkTmsEazx3GWHS3nAffhrS-wdq873Hz7B
▶️ AWS OCR:    • AWS Textract API OCR Tutorial: Learn AWS O...  &list=PLkTmsEazx3GWHS3nAffhrS-wdq873Hz7B

Другие видео/плейлисты, связанные с OCR:
▶️ Google Cloud Vision API (Часть 1): Учебное пособие по извлечению текста с помощью OCR -    • Google Cloud Vision API (Part 1): Google V...  
▶️ Google Cloud Vision API (Часть 2): Учебное пособие по обнаружению объектов -    • Google Cloud Vision API (Part 2): Object D...  
▶️ Google Cloud Vision API (Часть 3): Учебное пособие по обнаружению ориентиров -    • Google Cloud Vision API (Part 3): Landmark...  
▶️ Google Cloud Vision API (Часть 4): Учебное пособие по распознаванию лиц -    • Google Cloud Vision API (Part 4): Facial D...  
▶️ Google Cloud Vision API (Часть 5): Учебное пособие по распознаванию меток -    • Google Cloud Vision API (Part 5): Label De...  
▶️ Плейлист Google Cloud Vision API -    • Google Cloud Vision API  

💻 Наш канал:    / @techexperttutorials  

💥 Ссылка для подписки:    / @techexperttutorials  

▶️ Самое новое видео:    • CSharp Async Await Explained: Parallel Pro...  
https://www.youtube...

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
DeepSeek-OCR 3B + Ollama (конвейер проверки)

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

Как использовать Gemini 3 для бесплатного распознавания текста за 5 минут (руководство по API на ...

Как использовать Gemini 3 для бесплатного распознавания текста за 5 минут (руководство по API на ...

Установка Ollama и моделей искусственного интеллекта для безбумажной системы NGX | Локальный инте...

Установка Ollama и моделей искусственного интеллекта для безбумажной системы NGX | Локальный инте...

Извлечение текста с помощью OCR DeepSeek на Python в Linux с использованием API (Deepseek-VL2)

Извлечение текста с помощью OCR DeepSeek на Python в Linux с использованием API (Deepseek-VL2)

Qwen3-coder-next -- НОВЫЙ ТОП ИИ ЛОКАЛЬНО, БЕСПЛАТНО И БЕЗЛИМИТНО! CLI, сравнение кодинг агентов

Qwen3-coder-next -- НОВЫЙ ТОП ИИ ЛОКАЛЬНО, БЕСПЛАТНО И БЕЗЛИМИТНО! CLI, сравнение кодинг агентов

12 БЕЗУМНЫХ кейсов NotebookLM за 25 МИНУТ для вашего бизнеса (БЕСПЛАТНО) новинки от Google 2026

12 БЕЗУМНЫХ кейсов NotebookLM за 25 МИНУТ для вашего бизнеса (БЕСПЛАТНО) новинки от Google 2026

Почему ваш сайт должен весить 14 КБ

Почему ваш сайт должен весить 14 КБ

GLM-5 УНИЧТОЖИЛА DeepSeek! Бесплатная нейросеть БЕЗ ограничений. Полный тест 2026

GLM-5 УНИЧТОЖИЛА DeepSeek! Бесплатная нейросеть БЕЗ ограничений. Полный тест 2026

Забудьте про готовые VPN. ИИ-агент настроит вам личный за 10 минут!

Забудьте про готовые VPN. ИИ-агент настроит вам личный за 10 минут!

Что на самом деле началось в Мексике? (НЕ КАРТЕЛИ!)

Что на самом деле началось в Мексике? (НЕ КАРТЕЛИ!)

ATLAS 3 от BOSTON DYNAMICS – ОТ ПАРКУРА К ЗАВОДУ

ATLAS 3 от BOSTON DYNAMICS – ОТ ПАРКУРА К ЗАВОДУ

Экономика вошла в зону смерти..⚫ Все ждут ухудшения ситуации || Дмитрий Потапенко*

Экономика вошла в зону смерти..⚫ Все ждут ухудшения ситуации || Дмитрий Потапенко*

OpenClaw - где там МАГИЯ и как сделать свою

OpenClaw - где там МАГИЯ и как сделать свою

Включаем секретный протокол MTproxy для Telegram против замедлений.  [goTelegram скрипт]

Включаем секретный протокол MTproxy для Telegram против замедлений. [goTelegram скрипт]

AgentZero + Ollama — это БЕЗУМНО (БЕСПЛАТНО!)

AgentZero + Ollama — это БЕЗУМНО (БЕСПЛАТНО!)

Строим Безопасную OpenClaw Альтернативу

Строим Безопасную OpenClaw Альтернативу

Gemini 3.1 Pro in Antigravity can do anything… just watch

Gemini 3.1 Pro in Antigravity can do anything… just watch

Нейронка, которая УНИЧТОЖИЛА ChatGPT 5! / Обзор бесплатной нейросети и ее возможности

Нейронка, которая УНИЧТОЖИЛА ChatGPT 5! / Обзор бесплатной нейросети и ее возможности

НАЛОГИ НА НЕДВИЖИМОСТЬ ВЫРАСТУТ В 2026!

НАЛОГИ НА НЕДВИЖИМОСТЬ ВЫРАСТУТ В 2026!

Telegram блокируют, YouTube пропал из DNS, Seedance 2.0 убивает Голливуд | 2Weelky 44

Telegram блокируют, YouTube пропал из DNS, Seedance 2.0 убивает Голливуд | 2Weelky 44

Теперь команды агентов Клода Кода управляют моим Raspberry Pi (Opus 4.6).

Теперь команды агентов Клода Кода управляют моим Raspberry Pi (Opus 4.6).

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]