- 博客(9)
- 资源 (1)
- 收藏
- 关注
原创 自然语言处理-英文文本 python
关于自然语言处理的资料已经非常多,对于英文文本的处理步骤和方式在这里给大家整理一下:一般来说英文文本处理有几以下几个步骤:(1)分词操作:分词应该是所有自然语言处理首先都需要做的,那么分词有以下几种方法供给大家参考1.TextBlob包中提供的分词操作用法:text.word,其中text为文本名称2.NLTK包中的分词方法:word_tokenize(text)3.split方法做分词:因为英文单词本来就有空格,所以直接使用空格作为词语之间的间隔判断:text.split()(2)小写转化:
2020-08-05 11:56:05
2096
原创 python之—将一个表格中相同名字的行的数据合并
找了很多资料想要将自己数据集中相同id的行进行整合,(单纯数据合并):例如数据:id name review1 mi good1 mi great2 k nice2 k really合并之后效果:id name review1 mi [good,great]2 k [nice
2020-07-14 22:44:27
10641
2
原创 python之-下载各种包失败(pycharm)最简便解决办法
最近需要用到自然语言处理工具,python提供了很多自带的工具包。其中可能会使用到gensim包 和和nltk.download(‘stopwords’)来处理停词问题。这里就发现pycharm下载包经常会报错,查过很多解决办法相对来说都比较繁琐,比如使用控制台pip install 来安装包。其实主要原因还是因为网络,因为无法获取相关的资源。因此今天尝试了使用外网来安装,目前所需要使用到的自然语言处理包都能够快速地被安装成功,算是一大发现了。可能因为很多获取路径和资源都在国外服务器上。如果使用外网
2020-07-12 19:22:43
7683
2
原创 测试类问题(一)
简述什么是静态测试、动态测试、黑盒测试、白盒测试、α测试 β测试·静态测试是不运行程序本身而寻找程序代码中可能存在的错误或评估程序代码的过程。·动态测试是实际运行被测程序,输入相应的测试实例,检查运行结果与预期结果的差异,判定执行结果是否符合要求,从而检验程序的正确性、可靠性和有效性,并分析系统运行效率和健壮性等性能。·黑盒测试一般用来确认软件功能的正确性和可操作性,目的是检测软件的各个功能是否能得以实现,把被测试的程序当作一个黑盒,不考虑其内部结构,在知道该程序的输入和输出之间的关系或程序功能
2020-07-10 10:53:33
409
原创 测试用例-人脸支付:
功能性测试:人脸识别之前是否可以选择不同支付方式(零钱,银行卡)1. 是否获得相机权限,是,是否则进入付款界面,2. 否,提示框是否弹出打开相机权限3. 没有捕获到人脸是否有提示4. 捕获到人脸之后是否进入活体检测5. &nb
2020-07-10 10:48:34
1917
1
原创 计算机网络基础面试知识(一)
总结一下计算机网络面试常考知识:TCP (传输控制协议)Tcp可靠:数据包校验,丢弃重复数据,超时重发,流量控制TCP握手的三次流程seq: 序号。ack: 确认号。TCP 的三次握手过程:主机 A 向B 发送连接请求;主机 B 对收到的主机A 的报文段进行确认;主机 A 再次对主机B 的确认进行确认。·最初两端的TCP进程都处于CLOSE(关闭)状态。上图中A主动打开连接,B被动打开连接。·B打开连接后处于LISTEN(监听状态),等待客户的连接请求。·A向B发送请求报文,
2020-07-10 10:45:49
344
原创 Java基础面试知识(一)
总结一下面试中常考的java知识点:垃圾回收机制java虚拟机(JVM)垃圾回收器提供的一种用于在空闲时间不定时回收无任何对象引用的对象占据的内存空间的一种机制。垃圾:无任何对象引用的对象。(1)强引用(Strong Reference):如“Object obj = new Object()”,这类引用是Java程序中最普遍的。只要强引用还存在,垃圾收集器就永远不会回收掉被引用的对象。(2)软引用(SoftReference):它用来描述一些可能还有用,但并非必须的对象。在系统内存不够用时,这
2020-07-10 10:38:48
157
原创 数据处理之-pkl文件转csv,txt转csv
在上一篇文章中已将讲述了怎样打开pkl文件由于自己的数据集比较特殊,直接使用python将pkl文件转csv文件后规格都会乱套。这里提供几个数据转化的思路和方法。1.首先将pkl转化为txt文件:import pickleimport pandas as pdf = open(‘ingr_map.pkl’,‘rb’)data = pickle.load(f)pd.set_option(‘display.width’,None)pd.set_option(‘display.max_rows’,
2020-06-21 11:53:40
8153
1
原创 打开pkl文件之-安装pycharm安装pandas
打开pkl文件之-安装pycharm安装pandas开心地开启了毕业设计旅程,这里记录一下每一步。为了打开pkl文件费周章。首先pkl文件是python自生成的文件。下载pycharm的community版本(这里网上大部分都有详细教程不再赘述)。打开pkl文件的代码:import picklef = open(‘test.pkl’,‘rb’)data = pickle.load(f)print(data)这里会报错,原因是没有安装pandas。那么绕回了安装pandas包的问题,我在网上
2020-06-20 17:53:02
3997
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人