- 博客(143)
- 资源 (2)
- 收藏
- 关注
转载 anaconda安装之后,一定要设置环境变量
D:\python\Anaconda3 D:\python\Anaconda3\ScriptsD:\Anaconda\Library\bin 总结来说,要想在cmd的任意路径下使用conda命令,应当至少将Anaconda的安装路径、该路径下的Scripts目录以及Library\bin目录一同添加到环境变量中。 于是可得添加环境变量的完整路径: D:\Anacond...
2018-12-25 21:22:31
65766
16
转载 embedding到底进行了什么操作
用word embeddding 可以将一个词转换成固定长度的词向量表示!word embedding 给每个单词分配一个固定长度的向量表示!好博客:英文解释很清晰https://jalammar.github.io/illustrated-transformer/ This softmax score determines how much how much each wo...
2018-12-25 21:19:41
1329
转载 使用sklearn做单机特征工程
资料来自http://www.cnblogs.com/jasonfreak/p/5448385.html目录1 特征工程是什么?2 数据预处理 2.1 无量纲化 2.1.1 标准化 2.1.2 区间缩放法 2.1.3 标准化与归一化的区别 2.2 对定量特征二值化 2.3 对定性特征哑编码 2.4 缺失值计算 2.5 数据变换 2.6 回顾...
2018-12-20 21:16:23
263
转载 五分钟带你入门TensorFlow tf的下载 安装 简单入门介绍等
https://www.jianshu.com/p/2ea7a0632239TensorFlow是Google开源的一款人工智能学习系统。为什么叫这个名字呢?Tensor的意思是张量,代表N维数组;Flow的意思是流,代表基于数据流图的计算。把N维数字从流图的一端流动到另一端的过程,就是人工智能神经网络进行分析和处理的过程。话说在Android占领了移动端后,Google开源了TensorFlow...
2018-05-21 10:42:26
1120
1
原创 scp命令同步多个文件
scproot@30.4.161.27:/wls/applogs/suxiaoming380/code_0420_ajslf/reg/\{extract_function_reg.xlsx,plaintiff_defendant_function_reg.xlsx,reg_casefee_1.txt,reg_casefee_2.txt\}./
2018-05-09 16:07:56
8415
原创 windows下如何用pip命令安装python 软件包 库
1. 先安装wheel 进入下载目录,安装wheel 2. pip install ***安装需要的软件包1.用管理员方式打开cmd2.首先通过pip命令安装wheel 如果提示’pip’不是内部或外部命令,也不是可运行的程序或批处理文件①将python安装目录下的scripts目录(例如D:\Python27\Scripts)添加到系统环境变量path里,注意前加分号。再执行该命...
2018-03-27 20:41:07
1520
原创 判别模型 vs 生成模型
判别模型: 判决属于哪一类,计算 条件概率。生成模型:计算 联合概率。需要加上贝耶斯法则,然后应用到分类中。概率分布。 生成模型是模拟这个结果是如何产生的,然后算出产生各个结果的概率两种模型都会告诉你最后的label标签 ,类别结果。但是生成模型会告诉一个概率。生成模型会告诉你关于数据的一些统计信息(p(x|y) 分布 etc.)判别模型: 决策树 (不是这个就是那个...
2018-03-26 19:43:54
402
转载 论文笔记 Neural Architectures for Named Entity Recognition
NLP论文笔记1:Neural Architectures for Named Entity Recognition原创 2017年12月26日 18:31:14标签:BILSTM-CRF458看这一篇论文的主要目的是看BILSTM-CRF模型,对于实际应用,CRF看分词、BILSTM-CRF做NER,接下来通过BILSTM-CNN-CRF做序列标注,NLP几个基本的应用也差不多了,句法分析貌似比...
2018-03-26 09:51:42
620
转载 LSTM结构理解与python实现
转自:http://blog.youkuaiyun.com/flyinglittlepig/article/details/72229041LSTM结构理解与python实现上篇博客中提到,简单的RNN结构求解过程中易发生梯度消失或梯度爆炸问题,从而使得较长时间的序列依赖问题无法得到解决,其中一种越来越广泛使用的解决方法就是 Long Short Term Memory network (
2017-12-18 15:23:57
11884
2
原创 python按行写入到文件 另存为文件
f = open('./result/new.xml','a+')for line in content: text = ['\n',line,'\n'] f.writelines(text) print text
2017-06-30 15:33:29
3087
转载 Python re 模块
Python通过re模块提供对正则表达式的支持。使用re的一般步骤是先使用re.compile()函数,将正则表达式的字符串形式编译为Pattern实例,然后使用Pattern实例处理文本并获得匹配结果(一个Match实例),最后使用Match实例获得信息,进行其他的操作。import repattern = re.compile('[a-zA-Z]')result =
2017-06-29 18:49:16
322
翻译 python 资源大全 摘要
http://www.cnblogs.com/groundsong/p/6549758.htmlPDFPDFMiner:一个用于从PDF文档中抽取信息的工具。官网PyPDF2:一个可以分割,合并和转换 PDF 页面的库。官网ReportLab:快速创建富文本 PDF 文档。官网用于进行网页内容提取的库。Haul:一个可以扩展的图像爬取工具。官网htm
2017-06-29 09:45:24
397
翻译 python 下划线 函数 解释
加下划线的函数会自动运行Python中所有的类成员(包括数据成员)都是 公共的 ,所有的方法都是 有效的.可在其它类中使用.若变量名称为双下划线前缀,则为私有变量.如 __private,可以只在类 或 函数中使用,有效.__init__在类中被用做构造函数.
2017-06-27 16:30:09
807
转载 径向基(RBF)神经网络
径向基(RBF)神经网络2015-06-02 16:51 4033人阅读 评论(0) 收藏 举报RBF网络能够逼近任意非线性的函数。可以处理系统内难以解析的规律性,具有很好的泛化能力,并且具有较快的学习速度。当网络的一个或多个可调参数(权值或阈值)对任何一个输出都有影响时,这样的网络称为全局逼近网络。由于对于每次输入,网络上的每一个权值都要调整,从而导致
2017-04-10 12:21:03
933
转载 径向基函数(RBF)神经网络
本文摘自:《模式识别与智能计算——matlab技术实现第三版》与《matlab神经网络43个案例分析》【注】蓝色字体为自己的理解部分 径向基函数神经网络的优点:逼近能力,分类能力和学习速度等方面都优于BP神经网络,结构简单、训练简洁、学习收敛速度快、能够逼近任意非线性函数,克服局部极小值问题。原因在于其参数初始化具有一定的方法,并非随机初始化。 RBF是具有单隐层
2017-04-10 12:20:02
12229
原创 一个函数调用另一个函数,最好用参数传递。不然就得声明为全局变量。被调用的函数里边,变量前面写 global
一个函数调用另一个函数,最好用参数传递。不然就得声明为全局变量。被调用的函数里边,变量前面写 global
2016-12-16 14:37:48
6215
原创 python中 if __name__ == "__main__": 解析
个人总结:__name__ 双下划线表示name为系统变量,是模块名字。此句话保证了,当前python代码,既可以被执行,也可以被调用。import若执行该文件。name == main 执行main下面的代码若该文件被其他模块调用。import 。 则 name = 该文件的名字。 不执行 main下面的代码。可以保证调试方便。分块调试。互不影响。转:其
2016-12-14 19:55:29
589
原创 Python编程常识 总结
1.if else 一定后边有冒号if :elif:else:2.return False 大写第一个字母3.条件判断if () and () or ():
2016-12-14 19:40:15
456
转载 VI命令使用大全
从shell中启动可视化编辑器 vi filename 指示shell启动vi编辑器,并将参数filename传给它。如果当前目前中存在该文件,则vi编辑器将它解释为要打开的文件;如果没有该文件,则vi编译器创建新文件 vi file1 file2 file3 shell传递3个参数给vi,vi将它们解释为要打开的文件。可以使用:w命令保存文件,使用:n命令访问下一个文件 vi +#
2016-12-09 10:58:03
2016
原创 \\s+
详解 "\\s+"正则表达式中\s匹配任何空白字符,包括空格、制表符、换页符等等, 等价于[ \f\n\r\t\v]\f -> 匹配一个换页 \n -> 匹配一个换行符 \r -> 匹配一个回车符 \t -> 匹配一个制表符 \v -> 匹配一个垂直制表符而“\s+”则表示匹配任意多个上面的字符。另因为反斜杠在Java里是转义字符,所以在Java里,我们要这么用“\\s+”.
2016-12-02 15:10:03
436
原创 python chr() 函数
chr(kk) 函数,kk为整数,asc编码值,函数返回asc编码为kk 的对应的字符。 中间的参数可以是 八进制 十六进制 0x 等形式。chr(0x0a)>>\nchr(63)>>?
2016-12-02 15:02:36
6390
原创 python strip 函数
python 函数 strip()str.strip("stkf") 删除 字符串str 左右两边 的指定字符,只要字符序列在 stkf 中,就可以被删除。 中间 “” 中的字符串可以任意组合。 str.strip(" \n\t\r" + chr(0x0a) + " abc")str.lstrip() 左边的str.rstrip() 右边的
2016-12-02 14:50:31
419
原创 终于学会了看十六进制编码!! hexdump
十六进制 hexdump:bbe4 09b6 0a30 e40a 81b8 0a0a文本:件 0丁 文 tab 0 回车e4 bb b6 09 30 0a0a 回车 丁e4 b8 81 0a 回车0a 回车
2016-12-02 11:42:57
9841
原创 hexdump命令
hexdump 命令用来查看 文件的十六进制编码hexdump命令一般用来查看“二进制”文件的十六进制编码,但实际上它能查看任何文件,而不只限于二进制文件来自: http://man.linuxde.net/hexdumphexdump命令一般用来查看“二进制”文件的十六进制编码,但实际上它能查看任何文件,而不只限于二进制文件。来自: http://man.linuxd
2016-12-02 09:52:37
1313
原创 nohup命令
nohup command > myout.file 2>&1 &其中0 表示键盘输入 1表示屏幕输出 2表示错误输出.把标准出错重定向到标准输出, 最後一個& 表示 在後臺運行輸出重定向到 myout.file
2016-11-24 15:06:55
404
原创 linux 使程序在后台稳定运行 命令 nohup
如果只是临时有一个命令需要长时间运行,什么方法能最简便的保证它在后台稳定运行呢 用nohupnohup python test.py & 加& 表示默认输出到nohup.out 文件中 也可以">filename 2>&1"来重定向可用ps 命令查看进程 ps ps -ef |grep largeFile显示所有进程信息,连同命令行
2016-11-08 14:39:41
566
转载 ubuntu 安装eclipse
补充:建立软链接 进去eclipse目录后 把jdk软链接进去 ln -s /opt/jvm/jdk1.8.0_101 jre1. 下载jdk , jdk-8u77-Linux-x64.tar.gz2.下载 eclipse , eclipse-jee-mars-2-linux-gtk-x86_64.tar.gz注:我下载的都是64位的,因为我的系统是6
2016-10-27 15:03:29
729
转载 查看python的安装位置及好安装第三方库的位置
有时我们需要查看python的安装位置,好安装第三方库,linux可以先python进入python cmd,然后输入import sys print sys.path即可打印所有python路径。
2016-10-25 15:14:33
22281
原创 rpm -qa|grep lrzsz 查看是否安装了 lrzsz 软件包
rz receive Zmode 文件 从本地上传到服务器sz send Zmode 文件从服务器下载到本地rpm命令 用来管理rpm 文件 -qa 查看安装信息
2016-10-20 14:31:55
5410
1
转载 java中的length属性和length()方法和size()方法
转自:http://blog.youkuaiyun.com/mcy478643968/article/details/3488861#comments1 Java中的length属性是针对数组说的,比如说你声明了一个数组,想知道这个数组的长度则用到了length这个属性.2 java中的length()方法是针对字符串String说的,如果想看这个字符串的长度则用到length()这个方法.
2016-10-19 20:02:17
2405
原创 Python字符串笔记
Python字符串笔记1.字符串 str = 'abcd'在引用str 希望得到abcd时kkk = str + 'cdef'ttt = open("/home/suyuhan123/" + str + '.txt')引用字符时直接写str 不要写$str "str" 等。 str 直接就表示了 'abcd'2.代码中有中文时 写# coding
2016-09-01 17:16:42
377
原创 Linux文件压缩
Linux文件压缩1.压缩成tar文件tar命令可以用来压缩打包单文件、多个文件、单个目录、多个目录。常用格式:单个文件压缩打包 tar czvf my.tar file1多个文件压缩打包 tar czvf my.tar file1 file2,...单个目录压缩打包 tar czvf my.tar dir1多个目
2016-09-01 17:16:15
292
原创 随机森林
实习汇报目录(面试亦是如此)1.什么是weka2.机器学习算法的性能很大程度上依赖于应用程序和数据集的维度a.随机森林几乎不需要输入准备。它们可以处理二元特征,分类特征,数字特征,并且不需要任何缩放处理。b.随机森林可实现隐式特征选择,并且提供一个很好的特征重要性指标。c.随机森林训练速度非常快。它的一个特色就是当性能优化时,恰巧会提高模型精度,反之亦然。随机特征子集设置的
2016-09-01 17:13:46
756
原创 Apriori算法
Apriori算法一个项集的支持度:数据集中包含该项集的记录所占比例。{豆奶} {豆奶,尿布}置信度(可信度):针对关联规则来定义的。例如 {尿布}->{葡萄酒} = 支持度{尿布,葡萄酒} /支持度{尿布} = 0.75 这意味着对于包含尿布的记录,规则对其中75%的记录都适用。 支持度,可信度是用来量化关联分析是否成功的方法。 频繁项集:是经常
2016-09-01 17:08:32
307
原创 Apriori 算法关联分析
Apriori 算法关联分析频繁项集:经常出现在一起的物品的集合关联规则:暗示两物品间肯恩共存在很强的关系。 一个项集的支持度:数据集中包含该项集的记录所占比例。{豆奶} {豆奶,尿布}置信度(可信度):针对关联规则来定义的。例如 {尿布}->{葡萄酒} = 支持度{尿布,葡萄酒} /支持度{尿布} = 0.75 这意味着对于包含尿布的记录,规则对其中
2016-09-01 17:06:55
324
原创 连续值、缺失值 、正负样本不均衡处理方法
数据挖掘笔试总结:1.连续值、缺失值 、正负样本不均衡处理方法缺失值: (1)删除含有缺失值的数据对象或属性 (2)估计遗漏值,差值补全。 a.均值插补 均值 或者众数 b.利用同类均值插补 c.极大似然估计 前提适用于大样本期望值最大化 d.多重插补(较好) 最近邻平均属性 众数
2016-09-01 17:06:17
4723
原创 特征提取:
特征提取:原始特征的数量可能很大,或者说处在高纬空间中,通过映射(或变换)的方法用低纬空间来表示样本,这个过程叫特征提取。是一个变换过程 Y是测量空间 X是特征空间 变换A:Y->X 叫特征提取器。特征选择:从一组特征中挑选出一些最有代表性的特征,以达到降维的目的,这个过程叫特征选择。用映射(变换)方法,把原始特征变换为较少新特征————特征提取从原
2016-09-01 17:03:58
744
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人