ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

UTW 2025: No Spaces? No Problem! Segmenting Complex Scripts with Machine Learning

Автор: The Unicode Consortium

Загружено: 2026-03-04

Просмотров: 38

Описание: UTW 2025: No Spaces? No Problem! Segmenting Complex Scripts with Machine Learning
Presented by Shane Carr

Many languages, including Thai and Japanese, do not use spaces between words. Have you ever thought about how a machine can figure out where word boundaries occur so that it can perform text layout and other tasks?

This talk will explore how Machine Learning and Artificial Intelligence have helped us build text segmentation models for these languages, with the help of passionate contributors in Google Summer of Code. The talk will discuss the classical dictionary-based models and the progression into more sophisticated models including an LSTM (long short-term memory), CNN (convolutional neural network), and AdaBoost (adaptive boosting). The talk will show how these newer models have both improved accuracy and reduced model size, and it will discuss how to use these models in ICU4X and ICU.

To learn more about Unicode, please visit:
https://unicode.org/about.html
https://aac.unicode.org/adopt
https://www.unicode.org/events/utw/
https://www.unicode.org/events/utw/20...

#internationalization #unicode #technology #utw2025 #i18n #localization #segmenting #scripts #thai #japanese #languages #ai #artificialintelligence #machinelearning #google #lstm #cnn #adaboost #icu4x #icu

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
UTW 2025: No Spaces? No Problem! Segmenting Complex Scripts with Machine Learning

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

Масштабирование LLM упёрлось в предел: исследование MIT

Масштабирование LLM упёрлось в предел: исследование MIT

UTW 2025: Scaling Up Digital Inclusion: Summer 2025 Report from SILICON @ Stanford

UTW 2025: Scaling Up Digital Inclusion: Summer 2025 Report from SILICON @ Stanford

The AI Industry Just Changed | GPT-5.4 Worker AI, Pentagon Clash & NVIDIA’s Next Chip

The AI Industry Just Changed | GPT-5.4 Worker AI, Pentagon Clash & NVIDIA’s Next Chip

UTW 2025: Automated I18n Quality for Enterprise Platforms

UTW 2025: Automated I18n Quality for Enterprise Platforms

UTW 2025: Ask Unicode Anything

UTW 2025: Ask Unicode Anything

Gemini в 2026 году: Полный разбор всех инструментов и тарифов

Gemini в 2026 году: Полный разбор всех инструментов и тарифов

UTW 2025: Welcome to UTW 2025 and From Clay to Code: The Story of Encoding

UTW 2025: Welcome to UTW 2025 and From Clay to Code: The Story of Encoding

Что НА САМОМ ДЕЛЕ происходит, когда нажимаешь

Что НА САМОМ ДЕЛЕ происходит, когда нажимаешь "ПРИНЯТЬ ВСЕ КУКИ"?

Полный гайд по Claude: как выжать максимум из этой нейросети

Полный гайд по Claude: как выжать максимум из этой нейросети

Дороничев: ИИ — пузырь, который скоро ЛОПНЕТ. Какие перемены ждут мир?

Дороничев: ИИ — пузырь, который скоро ЛОПНЕТ. Какие перемены ждут мир?

Электричество НЕ течёт по проводам — тревожное открытие Ричарда Фейнмана

Электричество НЕ течёт по проводам — тревожное открытие Ричарда Фейнмана

🔥Христо Грозев: Мы вычислили секретную группу наводчиков российских ракет по Украине!

🔥Христо Грозев: Мы вычислили секретную группу наводчиков российских ракет по Украине!

ЛУЧШАЯ БЕСПЛАТНАЯ НЕЙРОСЕТЬ Google, которой нет аналогов

ЛУЧШАЯ БЕСПЛАТНАЯ НЕЙРОСЕТЬ Google, которой нет аналогов

Фильм Алексея Семихатова «ГРАВИТАЦИЯ»

Фильм Алексея Семихатова «ГРАВИТАЦИЯ»

Я разобрал всю ИИ-экосистему Google — 7 ключевых инструментов

Я разобрал всю ИИ-экосистему Google — 7 ключевых инструментов

ЦЕНА ОШИБКИ: 13 Инженерных Катастроф, Которые Потрясли Мир!

ЦЕНА ОШИБКИ: 13 Инженерных Катастроф, Которые Потрясли Мир!

UTW 2025:  Links with Non-ASCII: Unicode Detection and Display

UTW 2025: Links with Non-ASCII: Unicode Detection and Display

Электрон это не то что все думают! Вот как он выглядит на самом деле

Электрон это не то что все думают! Вот как он выглядит на самом деле

Война, инфляция и обнуление долгов. Лживые доклады и реальная ситуация в стране / Валентин Катасонов

Война, инфляция и обнуление долгов. Лживые доклады и реальная ситуация в стране / Валентин Катасонов

Что нового в ChatGPT 5.4

Что нового в ChatGPT 5.4

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]