>>> from tgrocery import Grocery #
新开张一个杂货铺,别忘了取名! >>>
grocery = Grocery( 'sample' ) #
训练文本可以用列表传入 >>>
train_src = [ ( 'education' , '名师指导托福语法技巧:名词的复数形式' ), ( 'education' , '中国高考成绩海外认可
是“狼来了”吗?' ), ( 'sports' , '图文:法网孟菲尔斯苦战进16强
孟菲尔斯怒吼' ), ( 'sports' , '四川丹棱举行全国长距登山挑战赛
近万人参与' ) ] >>>
grocery.train(train_src) #
也可以用文件传入 >>>
grocery.train( 'train_ch.txt' ) #
保存模型 >>>
grocery.save() #
加载模型(名字和保存的一样) >>>
new_grocery = Grocery( 'sample' ) >>>
new_grocery.load() #
预测 >>>
new_grocery.predict( '考生必读:新托福写作考试评分标准' ) education #
测试 >>>
test_src = [ ( 'education' , '福建春季公务员考试报名18日截止
2月6日考试' ), ( 'sports' , '意甲首轮补赛交战记录:米兰客场8战不败国米10年连胜' ), ] >>>
new_grocery.test(test_src) #
准确率 0.5 #
同样可以用文本传入 >>>
new_grocery.test( 'test_ch.txt' ) #
自定义分词器 >>>
custom_grocery = Grocery( 'custom' ,
custom_tokenize = list )
|
短文本分类工具 TextGrocery
最新推荐文章于 2025-09-03 22:23:28 发布