Mindee docTR — вероятно, лучший OCR с открытым исходным кодом

Автор: Andrej Baranovskij

Загружено: 2022-04-18

Просмотров: 15032

Описание: Хотите создать конвейер машинного обучения для автоматизации извлечения данных из деловых документов (квитанций, счетов-фактур, форм)? Тогда первым шагом должна стать интеграция OCR для извлечения текста. Качество извлечения OCR должно быть высоким, весь конвейер будет зависеть от качества извлечения исходных текстовых данных. Если извлечённые данные будут точными, это означает, что модели машинного обучения смогут корректно классифицировать текст. Я потратил время на изучение доступных решений для OCR и считаю, что Mindee docTR на данный момент является одним из лучших решений OCR с открытым исходным кодом. Посмотрите видео, где я провожу и демонстрирую несколько тестов.

Mindee docTR на GitHub:
https://github.com/mindee/doctr

Набор данных SRD Receipts:
https://expressexpense.com/blog/free-...

Sparrow на GitHub:
https://github.com/katanaml/sparrow/t...

0:00 Введение
2:41 Mindee docTR
5:27 Тест 1
7:43 Тест 2
9:12 Тест 3
11:58 Тест 4
13:19 Тест 5
14:21 Краткое содержание

ПОДКЛЮЧИТЬСЯ:
Подписаться на этот канал на YouTube
Twitter:   / andrejusb
LinkedIn:   / andrej-baranovskij
Medium:   / andrejusb

#OCR #МашинноеОбучение #Python

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...

Mindee docTR — вероятно, лучший OCR с открытым исходным кодом

Доступные форматы для скачивания:

Скачать видео

Информация по загрузке:

Скачать аудио

Похожие видео

Document Information Extraction Demo on Hugging Face Spaces

Document Information Extraction Demo on Hugging Face Spaces

How to Preprocess Images for Text OCR in Python (OCR in Python Tutorials 02.02)

How to Preprocess Images for Text OCR in Python (OCR in Python Tutorials 02.02)

OCR libraries

Маркер: этот инструмент с открытым исходным кодом подготовит ваши PDF-файлы к магистратуре

Маркер: этот инструмент с открытым исходным кодом подготовит ваши PDF-файлы к магистратуре

Exploring TrOCR: Unleashing the Power of Transformer-Based OCR

Exploring TrOCR: Unleashing the Power of Transformer-Based OCR

Сравнение моделей искусственного интеллекта Qwen3-VL для задач OCR

Сравнение моделей искусственного интеллекта Qwen3-VL для задач OCR

LlamaOCR — создание собственной частной системы OCR

LlamaOCR — создание собственной частной системы OCR

Извлечение таблиц из документов изображений | Paddle Paddle | Paddleocr | OCR | Извлечение текста |

Извлечение таблиц из документов изображений | Paddle Paddle | Paddleocr | OCR | Извлечение текста |

Machine Learning

Machine Learning

Document AI with LayoutLM: The Complete Guide | NLP | Multimodel Learning

Document AI with LayoutLM: The Complete Guide | NLP | Multimodel Learning

Подготовка набора данных для тонкой настройки Donut (часть 1, Document AI)

Подготовка набора данных для тонкой настройки Donut (часть 1, Document AI)

ИИ-агенты — кошмар для безопасности? Разбираемся с OpenClaw

ИИ-агенты — кошмар для безопасности? Разбираемся с OpenClaw

olmOCR - The Open OCR System

olmOCR - The Open OCR System

Step-by-Step Handwritten Sentence Recognition with TensorFlow and CTC loss

Step-by-Step Handwritten Sentence Recognition with TensorFlow and CTC loss

Automatic OCR Receipt & Invoice Parsing in Python

Automatic OCR Receipt & Invoice Parsing in Python

Структурированный поиск данных с помощью Sparrow с использованием OCR и Vision LLM [Повышенная то...

Структурированный поиск данных с помощью Sparrow с использованием OCR и Vision LLM [Повышенная то...

PaddleOCR 3.0 Explained | OCR, LLMs & RAG Pipelines (Full Technical Audiobook)

PaddleOCR 3.0 Explained | OCR, LLMs & RAG Pipelines (Full Technical Audiobook)

Donut 🍩 — ChatGPT для ИИ-документов

Donut 🍩 — ChatGPT для ИИ-документов

Распознавание текста на изображениях с помощью Python — pytesseract против easyocr против keras_ocr

Распознавание текста на изображениях с помощью Python — pytesseract против easyocr против keras_ocr

Как Запустить OpenClaw Бесплатно с Kimi 2.5 (Полная Настройка)

Как Запустить OpenClaw Бесплатно с Kimi 2.5 (Полная Настройка)