
dl4j
文章平均质量分 86
无敌小猫猫
啦啦啦……
展开
-
dl4j LSTM分类
总结一下。参考http://blog.youkuaiyun.com/luoyexuge/article/details/73313586 这个博文很赞。1. 数据加载器还是要自己写的。你的数据格式,你的输入输出,需要动手实现一下,然后才能喂给网络2. 我处理的是中文,所以分词是个问题,报错好几次。终于不忍了,参考结巴java版,自己写了一个分词器。把dl4j的word2vec模型的所有term,都放入到分词词...原创 2018-03-22 14:31:56 · 1984 阅读 · 0 评论 -
word2vec 词向量 分词效果对比
分词前后效果对比【不分词】 所有的商品名称本身作为term蔬菜 >>>>>>>> [马铃薯, 古柯叶, 芋头, 油茶籽, 生地, 皮大麦, 种用谷物, 土豆, 蒲芹萝卜, 生大麻]油茶籽 >>>>>>>> [根洋芹菜, 瓜类蔬菜, 中草药材, 蒜叶婆罗门参, 罂粟杆, 双低油菜籽, 红萝原创 2018-03-23 11:16:36 · 1503 阅读 · 0 评论 -
分词 天龙八部
自定义词典:段誉段正明段正淳段延庆皇妃刀白凤秦红棉甘宝宝阮星竹王夫人王语嫣木婉清钟灵高升泰巴天石华赫艮范晔褚万里古笃诚傅思归朱丹臣南海鳄神云中鹤钟万仇崔百泉过彦之枯荣大师本因本观本相本参黄眉大师破疑破嗔鸠摩智萧峰萧远山阿朱阿紫游坦之马夫人徐长老白世镜项长老传功陈长老孤雁吴长老长风宋长老奚长老全冠清...原创 2018-03-20 09:55:31 · 922 阅读 · 0 评论 -
word2vec训练词向量
输入是分词之后的文本输出是词向量./word2vec -train tlbb.seg -output tlbb.seg.vec -cbow 0 -size 200 -window 5 -negative 0 -hs 1 -sample 1e-3 -threads 12 -binary 0原创 2018-03-20 10:02:10 · 460 阅读 · 0 评论 -
CSV文件 分类
org.deeplearning4j.examples.dataexamplesBasicCSVClassifier数据格式。一定要搞清楚数据格式,输入输出,才能构建网络。对应的是你手头有什么,想要做什么,预测什么?训练日志。这个例子只是举例,训练的效果不考虑。10:34:14,208 INFO ~ Loaded [CpuBackend] backend10:34:15,497 INFO ~...原创 2018-03-20 10:55:53 · 1453 阅读 · 1 评论 -
dl4j 报错 加载词向量
Unable to guess input file format. Please use corresponding loader directly【重点】保存模型,WordVectorSerializer.writeFullModel(vec, filePath+".vec");读取的时候,WordVectors wordVectors =WordVectorSerializer.loa...原创 2018-03-22 10:46:31 · 1035 阅读 · 0 评论