
NLP
技术修行
人生如梦,技术无边,愿做行僧,修得真谛。
展开
-
中文处理FoolNLTK
中文处理FoolNLTK这是一个中文处理工具,提供BiLSTM来分词。特性,基于BiLSTM模型来训练、准确度高、可用户自定义字典、支持自训练、允许batch处理、速度不是最快的,但接近市场上的大部分开源工具。依赖:python3安装:pip install foolnltk使用:python -m fool [filename]用户可自定义字典,格式如下难受香菇 10什么鬼 10加载自定义字典;...原创 2018-06-22 15:23:44 · 4417 阅读 · 3 评论 -
蚂蚁金服金融大脑的挑战赛的实现代码 NLP文本相似度计算
近期做了一些NLP的研究,并基于6月份蚂蚁金服金融大脑的挑战赛,完成了文本相似度计算的验证。主要思路是基于word2vec来进行训练,并实现文本相似度的计算。所使用的语料,包括了公开的wiki语料,网友收集的微信语料,以及此大赛中的语料。其中微信语料的位置在https://spaces.ac.cn/archives/4304(可参考)。注意,此次语料训练采用了增量训练的方式。整体的代码位置在,ht...原创 2018-07-09 15:12:36 · 5157 阅读 · 2 评论 -
2018 研究报告
中国人工智能发展报告2018.pdf 2018中国互联网+指数报告.pdf 2018-04-12_人工智能行业应用价值报告.pdf 2018自然语言处理-研究报告-nlp.pdf 2018部分研究报告,可参考使用。...原创 2018-07-30 21:53:28 · 565 阅读 · 0 评论 -
高层次语义特征检测:行人检测
高层次语义特征检测:行人检测 此代码未发布,待发布后验证下。 依赖; Python 2.7 Tensorflow 1.4.1 Keras 2.0.6 OpenCV 3.4.1.15 安装: pip install -r requirements.txt 数据下载:下载后放到./data/下。 其中./data/caltech目录下结构如下 *DATA_PATH *train...翻译 2019-04-13 22:26:21 · 793 阅读 · 0 评论