- 博客(6)
- 收藏
- 关注
原创 python作业|齐夫定律、平均多义性
题目(1):P82.第23题. 齐夫定律:f(w)是自由文本中词w的频率。假设一个文本中的所有词都按照它们的频率排名,频率最高的排在最前面。齐夫定律指出一个词类型的频率与它的排名成反比(即f*r=k,k是某个常数)。例如:最常见的第50个词类型出现的频率应该是最常见的第150个词类型出现频率的3倍。 a) 写一个函数来处理一个大文本,使用pylab.plot画出相对于词的排名的词的概率,你认可齐夫定律吗?(提示:使用对数刻度会有帮助。)所绘的线的极端情况是怎样的? b) 随机生成文本,如:使用random.
2020-06-03 10:24:17
1284
原创 使用crf++工具进行分词训练
1.将语料处理成CRF++工具要求的格式 train.txt的格式如下: (使用4tab,BEMS,字与标注之间以“\t”间隔,一个字一行。当然,这里还涉及到将空格切分的文本处理成标签的问题。可参考:https://blog.youkuaiyun.com/juanjuan1314/article/details/78892855) 迈 B 向 E 充 B 满 E 希...
2019-08-15 14:35:46
542
1
原创 Java实现UDP协议
1.定义 UDP(User Datagram Protocol):用户数据报协议 TCP (Transmission Control Protocol):传输控制协议 上层应用的两个不同的运输层协议。 UDP概述: UDP是无连接的。 UDP使用尽最大努力交付。 UDP没有拥塞控制。 UDP是面向报文的。 UDP支持一对一、多对多、多对一和多对多的交互通信 2.UDP协议发送数据 发送处理过程...
2019-05-08 21:52:43
2212
1
原创 ubuntu下安装editplus
1.首先要安装wine sudo apt-get update sudo apt-get install wine 记得update,不然可能会出错。 安装的时间会比较长,遇到这里时,tab键选择确定。 2.下载最新版的editplus: wget ftp://ftp.editplus.com/ep3setup.exe 3.使用wine安装: wine ./ep3setup.exe 会有图...
2019-05-08 19:06:17
1785
原创 细数Ubuntu下安装mysql和workbench我踩过的坑
最终安装成功的教程:http://www.cnblogs.com/zhuyp1015/p/3561470.html 安装过程: 1. sudo apt-get install mysql-server 2. apt-get isntall mysql-client 3. sudo apt-get install libmysqlclient-dev 结果我在第二句代码就又出现很迷的问题!! ...
2018-10-18 23:13:22
3735
2
原创 pyhanlp的使用(在python里调用hanlp分词包)
Pyhanlp的使用(在python里调用hanlp分词包) 这是我第一次写博客,写的不好,请多多见谅。 1.在python下安装pyhanlp sudo pip install pyhanlp 详见pyhanlp官方文档链接:https://pypi.org/project/pyhanlp/0.1.26/ 2.pyhanlp的一些使用方法 (1)Hanlp.segment的使用。 fro...
2018-07-26 19:59:42
15999
5
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人