Adaptando Modelos de Linguagem para o Português: Passado, Presente e Futuro - com Rodrigo Nogueira
Автор: Brasileiras em PLN
Загружено: 2023-06-26
Просмотров: 1105
Описание:
Palestrante: Prof. Rodrigo Nogueira (UNICAMP)
Resumo: Com o avanço e sucesso contínuos de modelos de linguagem cada vez maiores e mais poderosos fica a impressão de que o futuro se direcionará para o de um grande modelo monolítico, dotado de um vasto conhecimento e capaz de resolver uma grande quantidade de tarefas de diversos domínios. Especialmente no cenário multilíngue, essa abordagem é atraente, pois promete um único sistema que entende centenas de idiomas e culturas. No entanto, nesta apresentação, argumentarei que essa abordagem não é a mais eficiente em termos de custo computacional, e que modelos treinados em línguas e domínios específicos, derivados de modelos generalistas "fundacionais", trazem grandes ganhos com custo comparativamente baixo. Discutirei, particularmente, as técnicas e lições aprendidas na construção de modelos de linguagem adaptados para o Português, como o BERTimbau, PTT5 e, mais recentemente, o Sabiá-65B, cujo desempenho é comparável ao ChatGPT-3.5 em tarefas em Português. Por fim, discutirei possíveis soluções para problemas atuais desses modelos, como mitigar o problema das alucinações, e desafios em se construir modelos que aprendem continuamente.
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: