Sklearn 做搜索扩展应用 #2.3 (NLP 自然语言处理教学)
Автор: Morvan Zhou
Загружено: 2020-09-20
Просмотров: 3878
Описание:
TF-IDF是一张二维表,分别代表文章索引和单词索引。文章量是可以无限增大的,单词量的增长也是很恐怖的。那么随着这两个维度的增长, 我们的内存总有一天会扛不住。好在我们可以利用一个节约内存的技术,叫做Sparse Matrix,稀疏矩阵,它只会存储有内容的值,而忽略无内容的值。 在这张巨大的二维表中,肯定每篇文章不一定会提及到所有词汇,这些不提及的词汇,我们当然可以不用存储。
更多扩展应用包括IDF迁移,向量化理解,搜索引擎流程等。
代码:https://github.com/MorvanZhou/NLP-Tut...
"莫烦Python" NLP 教学目录: https://mofanpy.com/tutorials/machine...
支持莫烦做更好的视频: https://mofanpy.com/support/
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: