- 博客(37)
- 资源 (1)
- 收藏
- 关注
原创 从NLP视角看电视剧《狂飙》,会有什么发现?
本文主要内容,获取解析豆瓣《狂飙》的短评相关数据和演职员信息,在数据预处理后,进行简单的数据分析和可视化展示。
2023-03-03 15:06:05
6455
26
原创 文本数据预处理:可能需要关注这些点
要进行自然语言处理相关工作,文本数据预处理是个必不可少的过程。本文将对文本数据预处理相关的内容进行归纳整理,主要包括以下4个方面内容:文本数据获取、常规文本数据预处理、任务相关的文本数据预处理、文本预处理工具。
2023-01-31 14:16:13
1113
2
原创 Py2neo:一种快速导入百万数据到Neo4j的方式
Py2neo是一个可以和Neo4j图数据库进行交互的python包。本文提供一个py2neo小技巧,通过简单的代码,能够以每秒1万节点/关系的速度快速将数据导入Neo4j。
2022-11-04 17:07:48
4496
2
原创 基于pyecharts的中医药知识图谱可视化
数据可视化是一种直观展示数据结果和变化情况的方法,可视化有助于知识发现与应用。Neo4j数据库对于知识图谱的展示形式过于单调。因此,本文基于pyecharts对当前处理的中药知识图谱数据进行分析与可视化。以利用图形传递和表达更清晰的中药知识图谱信息,发掘有潜在价值的内容。......
2022-06-21 21:37:18
7241
13
原创 趁热打铁,再构建百万节点关系中药方剂知识图谱
前文自顶向下构建中药知识图谱初探中,已经介绍了知识图谱和中药知识图谱构建的相关基础概念,本文将研究中药方剂数据,趁热打铁,再构建百万节点关系中药方剂知识图谱。该图谱能够让中医药知识图谱更加完善与全面。详细内容请看全文。
2022-05-05 16:19:08
3069
5
原创 自顶向下构建中药知识图谱初探
当前,知识图谱已在金融、电商和医疗等领域开展了诸多实践性探索,并被广泛的应用在了智能问答、知识搜索、个性化推荐和辅助诊断等知识型驱动的任务中。本文从中药和知识图谱研究视角出发,对所收集中药相关数据进行预处理与实体关系抽取,自顶向下构建中药知识图谱。同时利用neo4j对部分数据进行了可视化分析。
2022-05-05 15:24:25
5974
11
原创 win10中jupyter notebook设置conda虚拟环境全流程及问题汇总
正常安装流程1、安装anaconda2、安装jupyter notebook3、安装nb-conda4、创建虚拟环境5、向虚拟环境中安装ipykernel6、在jupyter notebook中添加虚拟环境变量7、查看现有kernel8、jupyter notebook中删除虚拟环境变量安装后问题汇总及解决方法1、jupyter notebook界面认识2、查看虚拟环境是否添加成功(1)如图查看(2)加载虚拟环境是否成功3、kernel链接错误..
2020-12-31 12:47:14
1749
原创 Keras网络可视化方法
Keras网络可视化方法Keras模型可视化 Keras可视化依赖的两个包参考链接Keras模型可视化代码:from keras.utils import plot_modelplot_model(model, to_file='model.png')plot_model接收两个可选参数:show_shapes:指定是否显示输出数据的形状,默认为False...
2018-09-06 17:26:10
6317
6
转载 剑指Offer题解(Python版)
剑指Offer题解(Python版)转载链接https://blog.youkuaiyun.com/tinkle181129/article/details/79326023 二叉树的镜像链表中环的入口结点删除链表中重复的结点从尾到头打印链表斐波那契数列跳台阶变态跳台阶矩形覆盖把字符串转换成整数平衡二叉树和为S的连续正数序列左旋转字符串数字在排...
2018-08-16 20:57:08
447
原创 python自然语言处理(NLP)1------中文分词1,基于规则的中文分词方法
python中文分词方法之基于规则的中文分词目录常见中文分词方法推荐中文分词工具参考链接一、四种常见的中文分词方法:基于规则的中文分词基于统计的中文分词深度学习中文分词混合分词方法基于规则的中文分词包括, 正向最大匹配法,逆向最大匹配法和双向最大匹配法。 最大匹配方法是最有代表性的一种基于词典和规则的方法,其缺点是严重依赖...
2018-08-11 18:14:19
6175
原创 直接快速下载NLTK数据
直接快速下载NLTK数据直接下载NLTK的数据速度很慢,这里提供NLTK数据集,直接下载即可。或者选择下列百度云下载: 链接:https://pan.baidu.com/s/1fZa0ouEkIyUk9S4tuEvRdw 密码:z8n8安装nltk查看nltk数据包位置确认是否下载成功NLTK数据安装nltkpip install nltk如需要快速安装,可以选择...
2018-07-27 21:34:42
24875
16
原创 python3中的常见知识点3------reduce()函数
python3中的常见知识点3——reduce()函数python3导入reduce()函数reduce()函数语法reduce()举例参考链接python3中不能直接使用reduce(),需要先利用下面一行代码导入函数from functools import reducereduce()函数语法reduce() 函数会对参数序列中元素进行累积。 函数将一个数...
2018-07-23 21:16:10
574
原创 python random模块几个常用方法
python random模块几个常用方法random.random()方法random.uniform(a, b)方法random.randint(a, b)方法random.randrange([start], stop[, step]])方法random.choice(sequence)方法random.shuffle(list)方法random.sample(sequen...
2018-07-20 20:51:52
596
原创 python 爬取豆瓣电影评论,并进行词云展示
python 爬取豆瓣电影评论,并进行词云展示本文旨在提供爬取豆瓣电影《我不是药神》评论和词云展示的代码样例1、分析URL2、爬取前10页评论3、进行词云展示1、分析URL我不是药神 短评 第一页url https://movie.douban.com/subject/26752088/comments?start=0&limit=20&sort=n...
2018-07-17 15:49:16
12307
31
原创 保存sklearn中模型的两种方法(pickle、joblib)
保存sklearn中模型的两种方法(pickle、joblib)from sklearn import svmfrom sklearn import datasetsclf = svm.SVC()iris = datasets.load_iris()X, y = iris.data, iris.targetclf.fit(X, y)# pickle python内置保存模...
2018-07-11 15:48:07
7100
转载 机器学习经典算法详解及Python实现之Logistic回归(LR)分类器
机器学习经典算法详解及Python实现—Logistic回归(LR)分类器本文来源于:机器学习经典算法详解及Python实现—Logistic回归(LR)分类器。(一)认识Logistic回归(LR)分类器首先,Logistic回归虽然名字里带“回归”,但是它实际上是一种分类方法,主要用于两分类问题,利用Logistic函数(或称为Sigmoid函数),自变量取值范围为(-INF, ...
2018-07-10 10:50:17
1549
转载 27个Jupyter Notebook小提示与技巧
27 个Jupyter Notebook的小提示与技巧文章包括27个让 Jupyter 用的更加舒心的建议与技巧。转载中文链接:27 个Jupyter Notebook的小提示与技巧英文原文链接:https://www.dataquest.io/blog/jupyter-notebook-tips-tricks-shortcuts/...
2018-07-02 10:03:14
381
转载 在windows下安装Neo4j图数据库
一、在windows下安装Neo4j图数据库Neo4j数据库有两个版本:社区版和商业版,社区版是开源并且免费的,社区版与商业版功能上没有什么区别,不同的是,社区版只能单机使用,商业版可以做分布式集群。单机版最大可以存储10亿个字节。Neo4j针对不同的操作系统,提供不同的安装包,下载官网:https://neo4j.com/download/other-releases/1、下载完...
2018-06-30 15:38:09
1539
转载 Jupyter notebook入门教程
转载自文章Jupyter notebook入门教程(上) https://blog.youkuaiyun.com/red_stone1/article/details/72858962 Jupyter notebook入门教程(下) https://blog.youkuaiyun.com/red_stone1/article/details/72863749转载内容如下:Jupyter notebo...
2018-06-27 16:48:13
992
原创 python安装包出现的两个问题error: Unable to find vcvarsall.bat、提示No module named Crypto.Cipher
python安装包出现的两个问题error: Unable to find vcvarsall.batNo module named Crypto.Ciphererror: Unable to find vcvarsall.bat解决方法一、对于python2请下载Microsoft Visual C++ Compiler for Python 2.7安装即可解决...
2018-06-25 17:32:46
1210
1
原创 python 中文分词工具
python 中文分词工具jieba,https://github.com/fxsjy/jiebajieba_fast,https://github.com/deepcs233/jieba_fastnltk,https://github.com/nltk/nltkFoolNLTK,https://github.com/rockyzhengwu/FoolNLTK/blob/master/...
2018-06-24 16:30:03
11635
原创 python3中的常见知识点2
python3中的常见知识点2列表与栈和队列map()函数python列表遍历的4种方式参考链接列表栈和队列1、列表作为栈使用栈:先进后出,First In Last Out 使用 append()添加项到栈顶,使用无参的 pop() 从栈顶检出项。 2、列表作为队列使用队列:先进先出,First In first Out deque模块可以快速地从两...
2018-06-05 16:20:08
364
原创 python3中的常见知识点1
python3中的常见用法简记一些python小知识字符串输出docstring(文档字符串)Lambda 函数(匿名函数)python函数之参数调用参考链接字符串输出1、r’原始字符串’,当需要输出字符串中的 \ ,而不是将其视为特殊字符时,r’原始字符串’很有必要。print('D:\python3\newExample') # \n是换行符...
2018-06-04 15:42:35
652
原创 Python编程规范之PEP8
Python编程规范—PEP8PEP是 Python Enhancement Proposal 的缩写英文链接: https://legacy.python.org/dev/peps/pep-0008/#a-foolish-consistency-is-the-hobgoblin-of-little-minds(转)中文翻译链接:https://www.cnblogs.com/aji...
2018-06-03 11:57:34
298
原创 K近邻算法(k-nearest neighbor, kNN)
K近邻算法(K-nearest neighbor, KNN)KNN是一种分类和回归方法。KNN简介KNN模型3要素KNN优缺点KNN应用参考文献KNN简介KNN思想 给定一个训练集T={(x1,y1),(x2,y2),...,(xN,yN)}T={(x1,y1),(x2,y2),...,(xN,yN)}T=\left\{ (x_1,y_1), (x_2,y_...
2018-05-14 09:15:30
1134
原创 python文件名解析---从文件名获得分类类别
python文件名解析—从文件名获得分类类别python os.listdir() 方法用于返回指定的文件夹包含的文件或文件夹的名字的列表。列表以字母顺序。listdir()方法举例说明listdir()方法从os模块中导入函数listdirfrom os import listdir返回指定文件夹中的所有文件和文件夹的名字列表listdir(pa...
2018-05-09 14:09:41
8694
原创 latex 中添加Springer LNCS 模板的\bibitem{}格式参考文献方法
1、将需要引用的参考文献新建为.bib格式,例如referencesTest.bib文件,具体如下:新建txt文件,后缀名改为.bib;然后打开谷歌学术,搜索参考文献, 点击导入BibTeX,具体如下图:图1---导入BibTeX方法图2---将BibTex格式复制到刚刚新建的.bib文件中保存2、在latex中新建.tex文件,例如referencesTest.tex文件,在其中添加以下命令然后
2018-01-19 11:55:30
30831
3
原创 keras小点记录
Keras学习小点记录1、axis(轴)(1)解释参考链接:https://www.zhihu.com/question/58993137(2)测试参考链接:http://keras-cn.readthedocs.io/en/latest/for_beginners/concepts/
2017-09-19 11:22:49
422
原创 python3 利用当前时间、随机数产生一个唯一的数字作为文件名
一、python3 利用当前时间、随机数产生一个唯一的数字作为文件名代码如下:#-*-coding:utf-8-*-#python3自动生成文件名from datetime import *import timeimport randomfor i in range(0,1): nowTime = datetime.now().strftime("%Y%m%
2017-05-21 16:31:56
5316
原创 python中文词云生成
一、词云“词云”就是对网络文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨。二、python实现中文词云显示1、需要准备的python库包括,matplotlib,jieba和wordcloud,可以通过pip install ---进行安装。2、代码实现#
2017-05-12 18:46:24
13737
原创 python读入中文文本编码错误
python读入中文txt文本,出现错误:UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 10: illegal multibyte sequence的解决办法。
2016-12-06 21:02:01
1013
原创 PyQt4编写界面的两种方式
应用PyQt4开发图形化界面有两种方式,一种是直接通过QtDesigner通过提供的窗口部件拖拽进行GUI创建,另外一种是直接进行编程实现。使用pyuic4把.ui文件转换为.py文件。
2016-11-29 14:39:53
3109
原创 Windows10下python3和python2同时安装(三)VS 2013配置python环境
Windows10下python3和python2同时安装(三)VS 2013配置python环境 说明:本文基于python2和python3同时安装之后,对VS 2013进行配置,下面有些地方文件路径添加如果不清楚,请大概浏览本系列教程(一)和(二)。 首先,下载VS 2013的插件,https://github.com/Microsoft/PT
2016-11-20 12:39:37
4138
原创 Windows10下python3和python2同时安装(二)python2.exe、python3.exe和pip2、pip3设置
Windows10下python3和python2同时安装(二)python2.exe、python3.exe和pip2、pip3设置说明:安装安装python3和python2请参考本系列教程(一)1、添加python2到系统环境变量2、修改python.exe名字为python2.exe和python3.exe3、pip2 和 pip3设置
2016-11-20 12:03:03
17207
20
原创 Windows10下python3和python2同时安装(一)安装python3和python2
Windows10下python3和python2同时安装(一)安装python3和python2特别说明,本文是在Windows64位系统下进行的,32位系统请下载相应版本的安装包,安装方法类似。使用python开发,环境有Python2和 python3 两种,有时候需要两种环境切换使用,下面提供详细教程一份。1、下载python3和python22、python3安装3、pyton2安装
2016-11-20 11:36:43
26387
2
仿宋_GB2312.ttf
2017-05-12
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人