Piotr Pęzik, Agnieszka Karlińska - Polskie duże modele językowe PLLuM (PyData Bydgoszcz #33)

Автор: PyData Bydgoszcz

Загружено: 2025-04-07

Просмотров: 568

Описание: PyData Bydgoszcz spotkanie 33
czwartek 06.03.2025
Młyny Rothera (Spichrz Zbożowy, 2. piętro), Mennica 10, Bydgoszcz

Dr hab. Piotr Pęzik, prof. UŁ
Jest kierownikiem Zakładu Językoznawstwa Korpusowego i Komputerowego w Uniwersytecie Łódzkim, autorem ponad 100 prac naukowych i rozwiązań informatycznych z dziedziny językoznawstwa korpusowego i komputerowego. Był wykonawcą i kierownikiem krajowych i europejskich projektów badawczo-rozwojowych, m. in. NKJP, CESAR, PLEC, BootStrep. Konsultant naukowy sektora prywatnego (np. Pfizer UK, Transition Technologies, Voicelab) w zakresie systemów ekstrakcji informacji z danych językowych. Autor wyszukiwarek frazeo.pl, http://spokes.clarin-pl.eu/, http://monco-pl.clarin-pl.eu/, słowników frazeologicznych HASK EN i HASK PL. Koordynator projektu CLARIN-PL w Uniwersytecie Łódzkim. Główny autor i opiekun Wyszukiwarki PELCRA dla NKJP. Kierował pracą zespołu UŁ w projekcie PLLuM.

Dr Agnieszka Karlińska
Jest adiunktką w Ośrodku Badań nad Bezpieczeństwem Sztucznej Inteligencji NASK PIB, gdzie zajmuje się z jednej strony tworzeniem narzędzi do wykrywania treści szkodliwych, takich jak mowa nienawiści, z drugiej zaś – budową bezpiecznych i wiarygodnych dużych modeli językowych. Skupia się w szczególności na ewaluacji skłonności LLM-ów do generowania treści toksycznych i dyskryminujących oraz na przeciwdziałaniu występowaniu obciążeń na różnych etapach tworzenia modeli. Z ramienia NASK kierowała projektem PLLuM, którego celem było utworzenie polskiego dużego modelu językowego. Aktualnie zajmuje się m.in. kwestiami związanymi z wdrażaniem polskich LLM-ów w administracji publicznej.

"Polskie duże modele językowe PLLuM”
"Wystąpienie będzie poświęcone procesowi tworzenia polskich dużych modeli językowych dostosowanych do potrzeb administracji publicznej. Przedstawimy kluczowe aspekty prac nad modelami z rodziny PLLuM – od pozyskiwania danych uczących, przez pretrening (zarówno w wariancie jednojęzycznym, jak i w formie kontynuacji treningu w celu adaptacji językowej) i dostrajanie na instrukcjach (ang. instruction fine-tuning), po wychowanie (ang. alignment). Omówimy wyzwania metodologiczne pojawiające się na każdym z tych etapów oraz pokażemy, jak modele sprawdzają się w różnorodnych zadaniach. Zaprezentujemy również narzędzie do szybkiej konfiguracji i testowania systemów RAG oraz nasze podejście do walidacji zdolności wyszukiwawczych modeli."

PyData Bydgoszcz
https://www.meetup.com/PyData-Bydgoszcz

[email protected]
  / pydatabydgoszcz
  / pydatabydgoszcz
#BydgoszczIT
  / pydatabydgoszcz

Nagranie sponsorowane przez firmę Sii
https://sii.pl

Realizacja wideo:
Jacek Owczarz
Jack Jack Films
+48 884 391 000

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...

Piotr Pęzik, Agnieszka Karlińska - Polskie duże modele językowe PLLuM (PyData Bydgoszcz #33)

Доступные форматы для скачивания:

Скачать видео

Информация по загрузке:

Скачать аудио

Похожие видео

Barbara Sobkowiak - Niedoceniane szeregi czasowe - blaski i cienie (PyData Bydgoszcz #28)

Barbara Sobkowiak - Niedoceniane szeregi czasowe - blaski i cienie (PyData Bydgoszcz #28)

Jak działają modele językowe i jak zbudować własne ChatGPT / Aleksander Smywiński-Pohl / 18. SFI

Jak działają modele językowe i jak zbudować własne ChatGPT / Aleksander Smywiński-Pohl / 18. SFI

Ameryka gra brutalnie i zmienia zasady gry wobec Europy || Tomasz Wróblewski - didaskalia#174

Ameryka gra brutalnie i zmienia zasady gry wobec Europy || Tomasz Wróblewski - didaskalia#174

Budowa i zastosowania polskich modeli językowych na przykładzie PLLuM – prof. Piotr Pęzik UŁ

Budowa i zastosowania polskich modeli językowych na przykładzie PLLuM – prof. Piotr Pęzik UŁ

11 cichych OBJAWÓW, które niszczą NERKI bez bólu.

11 cichych OBJAWÓW, które niszczą NERKI bez bólu.

WIELKA WYPRAWA MARII WIERNIKOWSKIEJ W GŁĄB ROSJI #1

WIELKA WYPRAWA MARII WIERNIKOWSKIEJ W GŁĄB ROSJI #1

Jakub Krajewski - Pretrening LLMów - jak działa i jak go poprawić? (PyData Bydgoszcz #31)

Jakub Krajewski - Pretrening LLMów - jak działa i jak go poprawić? (PyData Bydgoszcz #31)

UKRAINA RAPORT Z WOJNY 8 lutego 2026 - ponad 120 tys poległych Ukraińców.

UKRAINA RAPORT Z WOJNY 8 lutego 2026 - ponad 120 tys poległych Ukraińców.

PLLuM: co potrafi polska AI?

PLLuM: co potrafi polska AI?

Płk rez. Piotr Lewandowski: Jak szybko Rosja jest w stanie zająć Przesmyk Suwalski? Symulacja ataku

Płk rez. Piotr Lewandowski: Jak szybko Rosja jest w stanie zająć Przesmyk Suwalski? Symulacja ataku

Michał Pstrąg - Przeszukiwanie baz danych przy pomocy dużych modeli językowych (PyData #27)

Michał Pstrąg - Przeszukiwanie baz danych przy pomocy dużych modeli językowych (PyData #27)

Witold Sempruch - Mechanizmy kontroli w modelach dyfuzyjnych (PyData Bydgoszcz #32)

Witold Sempruch - Mechanizmy kontroli w modelach dyfuzyjnych (PyData Bydgoszcz #32)

Szczera Joanna Kulig opowiada swoją historię | Imponderabilia

Szczera Joanna Kulig opowiada swoją historię | Imponderabilia

ПОСЛЕ СМЕРТИ ВАС ВСТРЕТЯТ НЕ РОДСТВЕННИКИ, А.. ЖУТКОЕ ПРИЗНАНИЕ БЕХТЕРЕВОЙ. ПРАВДА КОТОРУЮ СКРЫВАЛИ

ПОСЛЕ СМЕРТИ ВАС ВСТРЕТЯТ НЕ РОДСТВЕННИКИ, А.. ЖУТКОЕ ПРИЗНАНИЕ БЕХТЕРЕВОЙ. ПРАВДА КОТОРУЮ СКРЫВАЛИ

Это получит каждый в Польше: готовимся к атаке России? Туск и Навроцкий переиграли Трампа в Давосе

Это получит каждый в Польше: готовимся к атаке России? Туск и Навроцкий переиграли Трампа в Давосе

Webinar PBC 2026

Webinar PBC 2026 "PRASA W CZASACH AI – ERA REWOLUCJI CZY EWOLUCJI"

Maria Knorps - O ewaluowaniu ewaluatorów w RAG (PyData Bydgoszcz #29)

Maria Knorps - O ewaluowaniu ewaluatorów w RAG (PyData Bydgoszcz #29)

Patryk Miziuła - 7 rzeczy, których nie potrzebujesz w szeregach czasowych (PyData Bydgoszcz #34)

Patryk Miziuła - 7 rzeczy, których nie potrzebujesz w szeregach czasowych (PyData Bydgoszcz #34)

Литовцы: Почему их язык совпадает с санскритом? Тайны истории

Литовцы: Почему их язык совпадает с санскритом? Тайны истории

Putin gra va banque. Stawka jest wyższa niż Ukraina || Mateusz Morawiecki - didaskalia#172

Putin gra va banque. Stawka jest wyższa niż Ukraina || Mateusz Morawiecki - didaskalia#172