- 博客(6)
- 收藏
- 关注

原创 Python实现中文最大逆向匹配分词算法
学习流程记录20170502经过查阅资料对最大逆向匹配算法上有了概念性的理解, 但是要具体用某一种编程工具来实现还是需要好好思考一下, 需要用什么方法实现,以及各种语法规则手中材料有一些文章的已经切好的词, 放在表格的某一列,一词一格. 停用词表一个, 一词一格N篇待切文章(均在切词表有)由于数据较大可以自己制作小型测试数据,以方便调试.5.7–5.10import xlrddef r
2017-05-12 23:23:32
3563
1
原创 妈耶,搞了半天原来pycharm整体字体太小了应该这样设置。。
emmmmm就是个人偏好超大分辨率以至于桌面图标啊,各种应用的字体较小。但是总之还可以接受啊。最近需要用Pycharm ,打开一看, wodema.. 这默认字体也太小了。。还怎么码字呀。。眼要瞎。。于是file>>>setting>>Edit—font>>>把size从10调成14,点右下角apply 然后ok关闭。 以为万事大吉。。。 然而….. 菜单栏和列表栏还是那么小的字啊!!!!只有
2017-09-27 20:56:57
43094
7
原创 Python简单词频统计以及格式合并实现
用到的模块: xlrd 运用到:字典dict列表list 读表格, 最后得到文件: txt词频统计:有关素材:代码如下: ( (相关注释和想法大都写在旁边的备注里了))import xlrd#定义读取指定列数据的函数, 并返回列表datadef readxls_bycol(path,colnum): xl = xlrd.open_workbook(path) tab
2017-05-02 20:41:38
4713
原创 Python 实现共现矩阵算法
用到的模块: xlrd最后得到文件: txt(全部复制txt 打开新表格粘贴即可得到xls文件)///开始写这个方法的目的是完成作业目标: 对表格里的关键词提取, 然后计算其共现次数, 生成共现矩阵
2017-04-08 00:01:47
10576
8
原创 C++小小知识存储地
16.10.13error C2065: 'malloc' : undeclared identifier ; 出现原因是因为我开头没有用包含文件:#include 加上后就解决了~gets(),getchar(),scanf() ; gets读一行,getchar()读一个字符。getchar(c) 只能接受一个字符。与之相对的是putchar() ,
2016-10-23 15:56:27
512
原创 开始学C的数据结构啦!!
本来博文是昨晚发表在新浪的..... 今早回去查看自己的博文的时候发现..就连自己看都那么多广告插在旁边...还有一些辣鸡无聊的市井博客推荐.....不能忍啊.....为保智商转移来这里了.... 是C#老师推荐的...希望以后多向这里的学习...多多写博客总结.....自己还是一个小小的programmer seed..... 还是没发芽的那种//// 不过准备啦....
2016-10-23 09:25:40
531
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人