
Python
余音丶未散
J2EE,机器学习,Hadoop,Spark,时间序列分析
展开
-
Python入门基本语法
Python入门基本语法Python标识符Python不允许标点字符标识符,如@,$和%。Python是一种区分大小写的编程语言Python中不使用括号来表示代码类/函数定义块或流量控制代码块由行缩进,这是严格执行表示多行语句允许使用续行字符(\)表示该行应该继续。例如:total = item_one + \ item_two + \原创 2016-04-06 17:33:36 · 2021 阅读 · 0 评论 -
mac os环境下安装lightgbm失败 解决方法
问题使用官方github的安装方法,在cmake地方编译不通过解决已安装过Cmake,保证cmake版本要3.8以上,通用–更新cmake版本 gcc版本有问题,原mac os 因为其他项目下载过gcc-6 使用gcc-6 编译lighgbm时cmake ..替换为如下命令cmake -DCMAKE_CXX_COMPILER=g++-6 -DCMAKE_C_COMPILER...原创 2018-03-16 08:41:15 · 1543 阅读 · 1 评论 -
python使用汇总
python中函数参数*args和**kw的区别*args是可变参数,args接收的是一个tuple,把list或tuple的元素变成可变参数传进去,即可变参数允许你传入0个或任意个参数,这些可变参数在函数调用时自动组装为一个tuple(有序列表,元组,一旦初始化就不能修改): **kw是关键字参数,kw接收的是一个dict。关键字参数允许你传入0个或任意个含参数名的参数,这些关键字参数在函...原创 2017-01-17 11:41:33 · 704 阅读 · 1 评论 -
Python之xgboost新版0.6win7安装笔记
Python安装xgboost1安装anaconda2安装mingw-w64下载x86_64-5.3.0-release-win32-seh-rt_v4-rev0.7zhttps://sourceforge.net/projects/mingw-w64/files/Toolchains%20targetting%20Win64/Personal%20Builds/mingw-bui原创 2016-08-23 09:59:50 · 1454 阅读 · 0 评论 -
机器学习实战之决策树ID3算法
决策树ID3信息增益-熵C4.5信息增益率CART基尼系数+后剪枝ID3算法1先计算经验熵--(熵越高,则混合的数据也越多,即同一特征不同情况越多)首先计算数据集中实例的总数创建一个数据字典-每个键值都记录了当前类别出现的次数-出现的类别key-次数value使用所有类标签的发生频率计算类别出现的概率-遍历key 次数/总数 累计 sum-=sum-log2(p)2切分原创 2016-07-02 11:41:18 · 762 阅读 · 0 评论 -
Python机器学习与实战笔记之逻辑斯蒂回归Logistic Regression, LR
理论参考-特别是梯度下降权值更新向量化的过程http://www.cnblogs.com/nsnow/p/4540700.htmlhttp://blog.youkuaiyun.com/zouxy09/article/details/203196731定义特征与标签矩阵2定义sigmoid函数3根据推出的权值更新公式进行迭代-最后算出权值可选的训练方式有梯度上升,随机梯度上升,改进的随机原创 2016-07-23 10:16:14 · 1127 阅读 · 0 评论 -
Python机器学习与实战笔记之朴素贝叶斯分类
##1联合概率分布p(x,y)=p(y)P(x|y) 或者p(A交B)=p(A)xp(B) p(A交B)不容易求,假设条件独立拆分成两个事件的乘积2基本假设条件独立性3利用贝叶斯定理 p(y|x)=P(x,y)/p(x)=p(y)P(x|y)/sum(y-i)[p(y)P(x|y)]y=max p(y)P(x|y)贝叶斯决策理论要求计算两个概率p1(x,y),p2(x, y原创 2016-06-28 09:15:21 · 2394 阅读 · 0 评论 -
Python机器学习实战笔记之KNN算法
k-近邻算法测量不同特征值之间的距离方法进行分类优 点 :精度高、对异常值不敏感、无数据输入假定。缺点:计算复杂度高、空间复杂度高。适用数据范围:数值型和标称型。(常用欧氏距离)1收集数据2准备数据3分析数据4训练算法5测试算法6使用算法Python中识别中文文件开头添加#coding:utf-8分类代码#coding:utf-8fro原创 2016-06-25 11:33:33 · 1334 阅读 · 0 评论 -
Pandas常用笔记
官方文档http://pandas.pydata.org/pandas-docs/stable/导入包pandasimport pandas as pd获取文件夹下文件名称import osfilenames=[]for file in os.listdir(path): filenames.append(file)读前几行文件(大文件)...原创 2016-11-29 16:07:50 · 2858 阅读 · 0 评论