ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

Empowering Low-Resource Languages Through Technology | Voices of the Industry Ep10 w/Felipe Sánchez

Автор: AI Loc Think Tank

Загружено: 2026-03-05

Просмотров: 5

Описание: In this episode of “Voices of the Industry” by the AI Localization Think Tank, Belén interviews Felipe Sánchez Martínez, associate professor at the University of Alicante, about building machine translation for low-resource languages and how the field has moved from rule-based to statistical, hybrid, and neural approaches. Felipe explains how neural MT enables transfer learning and multilingual systems, but highlights key data challenges: scarce parallel corpora, inconsistent orthography, and the difficulty of crawling usable web data. He describes work on predicting language and parallelism from URLs to guide crawling, and warns that much online text may be MT output, requiring detection and careful handling of synthetic data. He also discusses community-driven data creation for Mayan languages in Guatemala, including terminology agreement, guidelines, review workflows, and scanning/OCR hurdles. Finally, he outlines a new Spanish-government-funded project using LLMs for low-resource translation, including leveraging unstructured resources like grammar books and releasing outputs as open source.

00:00 Welcome and Guest Intro
01:05 Felipe Background in MT
03:30 Why Low Resource Matters
05:32 Crawling and Filtering Data
07:44 Mayan Languages Fieldwork
11:21 Finding Translators Partners
12:40 Detecting Machine Translations
16:24 LLMs and Creativity Gap
21:04 New Funded Research Project
24:54 Teaching LLMs with Grammars
27:42 Wrap Up and Thanks

—

➡️Felipe Sánchez LinkedIn Profile:   / felipe-s%c3%a1nchez-mart%c3%adnez-5817037a  

➡️Link to Felipe’s research: https://www.dlsi.ua.es/~fsanchez/

➡️Link to Transducens Project website: https://transducens.github.io/ai-tralow/

👉 Subscribe to the AI Localization Think Tank channel and newsletter for more conversations like this.

📢 Join the discussion on LinkedIn and tell us: What do you think about the data challenge for low-resource languages?

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Empowering Low-Resource Languages Through Technology | Voices of the Industry Ep10 w/Felipe Sánchez

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

Is The Localization Industry Doomed Or Is There Hope | Voices of the Industry Ep6 w/ Olga Stokowiec

Is The Localization Industry Doomed Or Is There Hope | Voices of the Industry Ep6 w/ Olga Stokowiec

AI Dubbing Demystified: Insights from TTS Expert | Voices of the Industry Ep8 w/ Álex Pérez

AI Dubbing Demystified: Insights from TTS Expert | Voices of the Industry Ep8 w/ Álex Pérez

Может ли у ИИ появиться сознание? — Семихатов, Анохин

Может ли у ИИ появиться сознание? — Семихатов, Анохин

Freelanceverse, AI, and the Future of Translation | Voices of the Industry Ep9 w/ Adrian Probst

Freelanceverse, AI, and the Future of Translation | Voices of the Industry Ep9 w/ Adrian Probst

Путина убьют: что дальше? Крах кадыровцев. Позор Пересильд в Дубае. Хабенский – хороший? БЫКОВ

Путина убьют: что дальше? Крах кадыровцев. Позор Пересильд в Дубае. Хабенский – хороший? БЫКОВ

Истинная цель военной операции в Иране | Станислав Белковский на Breakfast Show

Истинная цель военной операции в Иране | Станислав Белковский на Breakfast Show

Запрет заимствований, этнографический словарь войны  / Игорь Исаев: Утренний разворот

Запрет заимствований, этнографический словарь войны / Игорь Исаев: Утренний разворот

Фильм Алексея Семихатова «ГРАВИТАЦИЯ»

Фильм Алексея Семихатова «ГРАВИТАЦИЯ»

Блокировка Telegram: ТОП-5 защищенных мессенджеров на замену

Блокировка Telegram: ТОП-5 защищенных мессенджеров на замену

Битва вокруг Telegram: будет как в Иране? | Шульман, Кононов, Сулейманов

Битва вокруг Telegram: будет как в Иране? | Шульман, Кононов, Сулейманов

ЛИПСИЦ:

ЛИПСИЦ: "Меня критикуют за страшные прогнозы, но есть еще круче". К чему готовиться, нефть, Иран, РФ

Минфин отказался держать рубль. Дальше девальвация и инфляция. Иран не поможет | Владислав ЖУКОВСКИЙ

Минфин отказался держать рубль. Дальше девальвация и инфляция. Иран не поможет | Владислав ЖУКОВСКИЙ

Парадоксы велосипеда

Парадоксы велосипеда

PRO СВЕРЛЕНИЕ! Весь курс университета за 32 минуты!

PRO СВЕРЛЕНИЕ! Весь курс университета за 32 минуты!

Episode #4 Voices of the Industry w/ Alexandra Ralph - AI Governance & Policy

Episode #4 Voices of the Industry w/ Alexandra Ralph - AI Governance & Policy

Как учить ребёнка математике – Алексей Савватеев | Лекции по математике

Как учить ребёнка математике – Алексей Савватеев | Лекции по математике

Стратегия войны: США vs Иран — почему “быстро” не выйдет

Стратегия войны: США vs Иран — почему “быстро” не выйдет

Когда ИИ превзойдёт людей? Владимир Алипов - нейробиолог и эксперт в нейро-науках Ч.2

Когда ИИ превзойдёт людей? Владимир Алипов - нейробиолог и эксперт в нейро-науках Ч.2

Самый опасный ИИ-агент, Manus в Telegram бесплатно, новинки Gemini, Claude, ChatGPT / Итоги февраля

Самый опасный ИИ-агент, Manus в Telegram бесплатно, новинки Gemini, Claude, ChatGPT / Итоги февраля

Why Do LLMs Lie to Please Us? Understanding Sycophancy - AIRE Ep #2 with Marina Pantcheva

Why Do LLMs Lie to Please Us? Understanding Sycophancy - AIRE Ep #2 with Marina Pantcheva

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]