Tłumaczenie maszynowe. Korpus Dialogów oraz Korpus Pararela (dr. hab. Piotr Pęzik, prof. UŁ)
Автор: CLARIN-PL
Загружено: 2023-10-12
Просмотров: 138
Описание:
Podczas Śniadania Biznesowego AI zaprezentowane zostały krótkie prelekcje firm oraz naukowców połączone z debatą na temat wyzwań i dobrych praktyk w podejściu do tłumaczenia maszynowego. Podczas spotkania chcielibyśmy poruszyć tematy uwzględniające nie tylko technologię sztucznej inteligencji, ale również aspekt przygotowania danych, lingwistyki oraz lingwistyki komputerowej.
00:00 Wstęp
00:39 Korpus Pararela
04:18 Korpus dialogów DiaBiz
06:32 Tłumaczenie korpusu dialogów i jego adaptacja
08:56 Tłumacznia z wykorzystaniem LLM-ów
dr. hab. Piotr Pęzik (Uniwersytet Łódzki) - profesor UŁ w Instytucie Anglistyki, autorem prac naukowych i rozwiązań informatycznych z dziedziny językoznawstwa korpusowego i komputerowego. Wykonawca i kierownik krajowych i europejskich projektów badawczo-rozwojowych, m. in. NKJP, CESAR, PLEC, BootStrep. Odbył kilkuletni staż naukowy w grupie Ekstrakcji Informacji Europejskiego Instytutu Bioinformatyki w Cambridge, był konsultantem Institut für Deutsche Sprache w Mannheim w zakresie wielkoskalowych narzędzi korpusowych oraz członkiem Aston Institute for Forensic Linguistics. Członek konsorcjum Narodowego Korpusu Języka Polskiego, Polskiego Towarzystwa Językoznawczego oraz stowarzyszenia META-TRUST. Konsultant naukowy sektora prywatnego (np. Pfizer UK, Transition Technologies, Advertine) w zakresie systemów ekstrakcji informacji z danych językowych. Autor wyszukiwarki frazeo.pl, monitorcorpus.com, słowników frazeologicznych HASK EN i HASK PL, Spokes. Koordynator projektu CLARIN-PL w Uniwersytecie Łódzkim. Główny autor i opiekun specjalnego urządzenia badawczego — Wyszukiwarki PELCRA dla NKJP.
Link do korpusów:
https://paralela.clarin-pl.eu/
http://docs.pelcra.pl/doku.php?id=diabiz
#sniadaniebiznesowe #konferencjaCLARIN #CLARIN-PL
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: