- 博客(23)
- 收藏
- 关注
原创 利用词向量来分析人物关系
1、安装gensim 如果没有安装numpy,scipy,首先去安装(注意对应python版本);再安装gensim. 如果包已经安装好,但是运行代码时候出现:DLL找不到模块。查了网上的说法是包没安装对,版本的问题,but我换了好几个版本,都有错。。。。 解决方式:(方式二我试了,没有那个错,程序可以运行)官网安装。方式1方式22、知识介绍 Gensim是自然语言处理中的...
2020-04-23 11:53:17
529
1
原创 地名,机构名词云制作
大家好,之前有篇文章是介绍词云制作的,今天主要是来详细介绍一下基于TF-IDF关键词提取及词云的制作过程,有关软件的安装见我之前的博客。点击 我的博客。实现过程1、提取关键词2、生成词云遇到的问题1、由于中文语言的复杂性,很难识别出机构名,地名等;2、文本中会出现语气词以及难以判断的词,如我们,觉得,这样等会导致文本中的关键词无法识别出来;3、jieba分词的不准确性;解决问题...
2020-04-18 18:02:57
357
原创 Gephi可视化人物关系图
大家好,昨天跟大家介绍了一下在文本中抽取出人物关系,今天将利用gephi来绘制人物关系图。背景知识介绍图相关的概念和术语图的度量实现网络图绘制一、背景知识 图是一种数据结构 图结构:是研究数据元素之间的多对多的关系。在这种结构中,任意两个元素之间可能存在关系。即结点之间的关系可以是任意的,图中任意元素之间都可能相关。 基于图论(Graph theory)的网络科学认为...
2020-04-10 19:49:37
8873
2
原创 统计中文文本中人物出现次数
&emp&emp;大家好,今天跟大家介绍一下如何统计文本中人物出现的次数?共现关系:在文献计量学中,关键词的共词方法常用来确定该文献集所代表学科中各主题之间的关系。而在这里,我们需要通过分析一篇小说或剧本,来分析剧中各个角色之间的人物关系。两者有很相同的地方。一般我们认为,在一篇文章中的同一段出现的两个人物之间,一定具有某种关联,因此我们的程序的大致流程也可以确定下来。我们可...
2020-04-09 22:49:21
4441
原创 命名实体的识别
大家好,今天跟大家介绍一下基于pyltp做中文文本中命名实体的识别。基于词典来介绍一下整个流程,首先跟大家介绍一下理论知识以方便大家理解,最后附上完整代码供大家参考学习。什么是命名实体的识别基于词典与统计的算法一、认识命名实体识别过程1、什么是命名实体的识别 命名实体识别(Named Entity Recognition,简称NER),又称作“专名识别”,是自然语言处理中的一项...
2020-03-28 21:35:45
1949
1
原创 pyltp引入外部词典
大家好,今天跟大家介绍一下在文本学习过程中,为什么要引入外部词典以及引入外部词典之后又什么变化。为什么引入外部词典怎么引入(外部词典的配置)...
2020-03-26 12:10:37
3113
4
原创 pyltp安装学习
大家好,今天跟大家介绍一下自然语言处理中对中文处理的工具—ltp,以及相关知识。目前国内有多个开源的中文语言处理工具可供直接调用实现命名实体识别,比如复旦大学研发的fudanNLP,中科院的NLPIR分词系统(又名ICTCLAS2013)和哈工大的LTP。因为从一开始接触自然语言处理就是用Python进行基本的操作,恰好哈工大的LTP提供python接口,所以就直接用python调用其封装成的...
2020-03-21 20:56:38
335
原创 自然语言处理基础——NLTK
大家好,今天跟大家介绍一下自然语言处理的基础的一些操作。Tokenize词性标注命名实体识别nltk频率统计下载语料库一、Tokenize把句子分成有意义的小部件import nltksentence = 'The imperial Palace is located in Bei Jing!'tokens = nltk.word_tokenize(sentence)pr...
2020-03-17 18:28:55
454
原创 Python学习——面向对象三大特性
大家好,今天跟大家介绍面向对象的三大特性:封装,继承和多态。一、封装顾名思义就是将内容封装到某个地方,以后再去调用被封装在某处的内容。所以,在使用面向对象的封装特性时,需要:1)将内容封装到某处2)从某处调用被封装的内容第一步,将内容封装到某处self 是一个形式参数,当执行 passat = Car(‘passat’, 250000 ) 时,self 等于passat;当执行 f...
2020-03-04 11:22:49
1438
11
原创 Python学习——初识类与对象
大家好,今天跟大家简答介绍一下类的基础知识,主要有:Python中类和对象的概念Python中的函数和普通函数的对比python类语法的初识一、Python中类和对象的概念我们把一类相同的事物叫做类,其中用相同的属性(其实就是变量)描述,里面封装了相同的方法。比如,汽车是一个类,它包括价格、品牌等属性。倘若要实现打印100种车的属性的功能,那么可以用函数实现,也可以用类来实现。##...
2020-03-03 14:21:03
268
转载 人工智能已经进入第三代
https://blog.youkuaiyun.com/r6Auo52bK/article/details/101088166
2020-02-20 13:21:50
382
原创 Python基础知识(六)
大家好,今天跟大家介绍函数的基础的知识,主要有以下:1、函数的定义和调用2、函数的参数1、函数的定义和调用1)函数定义:def 关键词开头,空格之后接函数名称和圆括号(),最后还有一个":"。 函数名:函数名只能包含字符串、下划线和数字且不能以数字开头。虽然函数名可以随便起,但我们给函数起名字还是要尽量简短,并能表达函数功能。注释:每一个函数都应该对功能和参数进行相应的说明,应该写...
2020-02-19 16:38:53
144
原创 Python基础学习(五)
大家好,今天跟大家分享Python中字典的常见用法。1、什么是字典字典是Python语言中唯一的映射类型。映射类型对象里哈希值(键,key)和指向的对象(值,value)是一对多的的关系,通常被认为是可变的哈希表。字典对象是可变的,它是一个容器类型,能存储任意个数的Python对象,其中也可包括其他容器类型。2、 创建字典简单的说就是用大括号({}),包裹的键值对的集合。键和值之间用冒...
2020-02-12 14:10:55
475
原创 Python基础篇(三)
大家好,今天跟大家分享以下知识:1、循环2、切片一、循环循环这种概念很重要,因为它是让计算机自动完成重复工作的常见方式之一。循环的操作使得对每个元素执行相同的操作方便很多。1、 for循环语句for循环可以遍历任何序列的项目,如一个列表或者一个字符串。1) 格式:``pythonfor 变量名 in sequences: 语句1else: 语句22)示...
2020-02-09 15:49:36
1760
原创 Python学习基础篇(二)
大家好,今天继续学习Python基础知识,顺便提醒一下,大家在学习新知识之余,也要及时的回顾一下之前所学的知识。今天主要学习列表相关知识:什么是列表列表的表示方法访问列表元素列表的拼接删除和添加列表反向输出列表的排序1、什么是列表什么是列表,列表是由一系列按特定顺序排列的元素组成。比如说,可以是字母组成的列表,也可以是数字组成的列表,也可以是没有任何关系的元素组成的列表。鉴于列...
2020-01-21 17:49:41
563
原创 Python学习基础篇(一)
大家好,今天主要跟大家分享Python学习中的下列基础知识:1、变量2、字符串3、数字前言介绍之前,先给大家再温习一下Python的相关知识。1、Python的设计哲学:优雅,明确,简单。用一种方法,最好是只有一种方法来做一件事。拒绝花俏的语法,选用没有歧义或是很少歧义的语句。2、①Python是完全面向对象的语言函数、模块、数字、字符串都是对象,在Python中一切皆为对象。...
2020-01-20 10:19:23
336
原创 腾讯云服务器配置+Python搭建过程及jupyter环境的开通过程
本次文章跟大家分享以下内容:1、腾讯云服务器的购买及配置2、Python环境的配置及开通jupyter编程环境。一、腾讯云服务器的购买及配置1、腾讯云服务器的购买1)浏览器搜索腾讯云出现以下界面:2)注册账号,点击购买,根据自身身份购买即可,学生党一个月10元,...
2020-01-10 14:43:52
2698
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人