fastText之我所见(一)
本系列blog重点介绍fasttext快速文本分类器的历史、原理以及实战等,主要有(一)(二)两个教程share给大家。教程(一)主要介绍fastTest,教程(二)主要从代码的角度来实战。
笔者信息:Next_Legend QQ:1219154092 人工智能 自然语言处理 图像处理 神经网络 高维信息处理
——2018.7.31于天津大学
一、What is fastTest?
FastText is an open-source, free, lightweight library that allows users to learn text representations and text classifiers. It works on standard, generic hardware. Models can later be reduced in size to even fit on mobile devices.
FastText是一个开源的、免费的、轻量级的库,允许用户学习文本表示和文本分类器。它适用于标准的通用硬件。模型可以在以后缩小,甚至可以在移动设备上使用。
fasttext是facebook开源的一个词向量与文本分类工具,在2016年开源,典型应用场景是“带监督的文本分类问题”

本文介绍了fastText,一个轻量级的文本分类和表示学习库,性能媲美深度学习且速度更快。fastText结合了词袋模型、n-gram和子字信息,提供了一种有效的方法来处理文本任务。文章涵盖了fastText的基本概念、构建和选项,还探讨了它与word2vec的异同。
最低0.47元/天 解锁文章
7212

被折叠的 条评论
为什么被折叠?



