《下一步,AI。NEXT,愛 》中文段詞系統 (馬偉雲)
Автор: 東臺傳播
Загружено: 2021-10-08
Просмотров: 462
Описание:
馬博士帶領中研院詞庫小組,花費十多年,開發出「廣義知網」,這是AI專屬的中文大辭典,內容涵蓋了九萬多個詞彙,它們都經過大量人力標注,定義出詞性、語法、結構等規則,才能提供給機器進行學習。
中文不像英文,每個字詞之間都有空格,為了方便機器閱讀,科學家還得先做斷詞。
中研院資訊所馬偉雲助研究員:我們怎麼讓電腦知道每個詞彙的意思呢?我們就必須有像是一個辭典,是電腦看得懂的辭典。我們過去就是開發了一套這樣子的知識庫,叫做廣義知網。
歷經十多年,中研院詞庫小組在2019年,正式開源釋出中文斷詞系統「CkipTagger」,準確度達到97%。
#科技部 補助
#國家實驗研究院 監製
#東臺傳播 製作
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: