ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

Piotr Pęzik, Agnieszka Karlińska - Polskie duże modele językowe PLLuM (PyData Bydgoszcz #33)

Автор: PyData Bydgoszcz

Загружено: 2025-04-07

Просмотров: 568

Описание: PyData Bydgoszcz spotkanie 33
czwartek 06.03.2025
Młyny Rothera (Spichrz Zbożowy, 2. piętro), Mennica 10, Bydgoszcz

Dr hab. Piotr Pęzik, prof. UŁ
Jest kierownikiem Zakładu Językoznawstwa Korpusowego i Komputerowego w Uniwersytecie Łódzkim, autorem ponad 100 prac naukowych i rozwiązań informatycznych z dziedziny językoznawstwa korpusowego i komputerowego. Był wykonawcą i kierownikiem krajowych i europejskich projektów badawczo-rozwojowych, m. in. NKJP, CESAR, PLEC, BootStrep. Konsultant naukowy sektora prywatnego (np. Pfizer UK, Transition Technologies, Voicelab) w zakresie systemów ekstrakcji informacji z danych językowych. Autor wyszukiwarek frazeo.pl, http://spokes.clarin-pl.eu/, http://monco-pl.clarin-pl.eu/, słowników frazeologicznych HASK EN i HASK PL. Koordynator projektu CLARIN-PL w Uniwersytecie Łódzkim. Główny autor i opiekun Wyszukiwarki PELCRA dla NKJP. Kierował pracą zespołu UŁ w projekcie PLLuM.

Dr Agnieszka Karlińska
Jest adiunktką w Ośrodku Badań nad Bezpieczeństwem Sztucznej Inteligencji NASK PIB, gdzie zajmuje się z jednej strony tworzeniem narzędzi do wykrywania treści szkodliwych, takich jak mowa nienawiści, z drugiej zaś – budową bezpiecznych i wiarygodnych dużych modeli językowych. Skupia się w szczególności na ewaluacji skłonności LLM-ów do generowania treści toksycznych i dyskryminujących oraz na przeciwdziałaniu występowaniu obciążeń na różnych etapach tworzenia modeli. Z ramienia NASK kierowała projektem PLLuM, którego celem było utworzenie polskiego dużego modelu językowego. Aktualnie zajmuje się m.in. kwestiami związanymi z wdrażaniem polskich LLM-ów w administracji publicznej.

"Polskie duże modele językowe PLLuM”
"Wystąpienie będzie poświęcone procesowi tworzenia polskich dużych modeli językowych dostosowanych do potrzeb administracji publicznej. Przedstawimy kluczowe aspekty prac nad modelami z rodziny PLLuM – od pozyskiwania danych uczących, przez pretrening (zarówno w wariancie jednojęzycznym, jak i w formie kontynuacji treningu w celu adaptacji językowej) i dostrajanie na instrukcjach (ang. instruction fine-tuning), po wychowanie (ang. alignment). Omówimy wyzwania metodologiczne pojawiające się na każdym z tych etapów oraz pokażemy, jak modele sprawdzają się w różnorodnych zadaniach. Zaprezentujemy również narzędzie do szybkiej konfiguracji i testowania systemów RAG oraz nasze podejście do walidacji zdolności wyszukiwawczych modeli."

PyData Bydgoszcz
https://www.meetup.com/PyData-Bydgoszcz

[email protected]
  / pydatabydgoszcz  
  / pydatabydgoszcz  
#BydgoszczIT
  / pydatabydgoszcz  

Nagranie sponsorowane przez firmę Sii
https://sii.pl

Realizacja wideo:
Jacek Owczarz
Jack Jack Films
+48 884 391 000

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Piotr Pęzik, Agnieszka Karlińska - Polskie duże modele językowe PLLuM (PyData Bydgoszcz #33)

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

Barbara Sobkowiak - Niedoceniane szeregi czasowe - blaski i cienie (PyData Bydgoszcz #28)

Barbara Sobkowiak - Niedoceniane szeregi czasowe - blaski i cienie (PyData Bydgoszcz #28)

Jak działają modele językowe i jak zbudować własne ChatGPT / Aleksander Smywiński-Pohl / 18. SFI

Jak działają modele językowe i jak zbudować własne ChatGPT / Aleksander Smywiński-Pohl / 18. SFI

Ameryka gra brutalnie i zmienia zasady gry wobec Europy  || Tomasz Wróblewski - didaskalia#174

Ameryka gra brutalnie i zmienia zasady gry wobec Europy || Tomasz Wróblewski - didaskalia#174

Budowa i zastosowania polskich modeli językowych na przykładzie PLLuM – prof. Piotr Pęzik UŁ

Budowa i zastosowania polskich modeli językowych na przykładzie PLLuM – prof. Piotr Pęzik UŁ

11 cichych OBJAWÓW, które niszczą NERKI bez bólu.

11 cichych OBJAWÓW, które niszczą NERKI bez bólu.

WIELKA WYPRAWA MARII WIERNIKOWSKIEJ W GŁĄB ROSJI #1

WIELKA WYPRAWA MARII WIERNIKOWSKIEJ W GŁĄB ROSJI #1

Jakub Krajewski - Pretrening LLMów - jak działa i jak go poprawić? (PyData Bydgoszcz #31)

Jakub Krajewski - Pretrening LLMów - jak działa i jak go poprawić? (PyData Bydgoszcz #31)

UKRAINA RAPORT Z WOJNY 8 lutego 2026 - ponad 120 tys poległych Ukraińców.

UKRAINA RAPORT Z WOJNY 8 lutego 2026 - ponad 120 tys poległych Ukraińców.

PLLuM: co potrafi polska AI?

PLLuM: co potrafi polska AI?

Płk rez. Piotr Lewandowski: Jak szybko Rosja jest w stanie zająć Przesmyk Suwalski? Symulacja ataku

Płk rez. Piotr Lewandowski: Jak szybko Rosja jest w stanie zająć Przesmyk Suwalski? Symulacja ataku

Michał Pstrąg - Przeszukiwanie baz danych przy pomocy dużych modeli językowych (PyData #27)

Michał Pstrąg - Przeszukiwanie baz danych przy pomocy dużych modeli językowych (PyData #27)

Witold Sempruch - Mechanizmy kontroli w modelach dyfuzyjnych (PyData Bydgoszcz #32)

Witold Sempruch - Mechanizmy kontroli w modelach dyfuzyjnych (PyData Bydgoszcz #32)

Szczera Joanna Kulig opowiada swoją historię | Imponderabilia

Szczera Joanna Kulig opowiada swoją historię | Imponderabilia

ПОСЛЕ СМЕРТИ ВАС ВСТРЕТЯТ НЕ РОДСТВЕННИКИ, А.. ЖУТКОЕ ПРИЗНАНИЕ БЕХТЕРЕВОЙ. ПРАВДА КОТОРУЮ СКРЫВАЛИ

ПОСЛЕ СМЕРТИ ВАС ВСТРЕТЯТ НЕ РОДСТВЕННИКИ, А.. ЖУТКОЕ ПРИЗНАНИЕ БЕХТЕРЕВОЙ. ПРАВДА КОТОРУЮ СКРЫВАЛИ

Это получит каждый в Польше: готовимся к атаке России? Туск и Навроцкий переиграли Трампа в Давосе

Это получит каждый в Польше: готовимся к атаке России? Туск и Навроцкий переиграли Трампа в Давосе

Webinar PBC 2026

Webinar PBC 2026 "PRASA W CZASACH AI – ERA REWOLUCJI CZY EWOLUCJI"

Maria Knorps - O ewaluowaniu ewaluatorów w RAG (PyData Bydgoszcz #29)

Maria Knorps - O ewaluowaniu ewaluatorów w RAG (PyData Bydgoszcz #29)

Patryk Miziuła - 7 rzeczy, których nie potrzebujesz w szeregach czasowych (PyData Bydgoszcz #34)

Patryk Miziuła - 7 rzeczy, których nie potrzebujesz w szeregach czasowych (PyData Bydgoszcz #34)

Литовцы: Почему их язык совпадает с санскритом? Тайны истории

Литовцы: Почему их язык совпадает с санскритом? Тайны истории

Putin gra va banque. Stawka jest wyższa niż Ukraina || Mateusz Morawiecki - didaskalia#172

Putin gra va banque. Stawka jest wyższa niż Ukraina || Mateusz Morawiecki - didaskalia#172

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]