
machine learning
lxx199603
正在学习数据科学
展开
-
机器学习笔记2
我总感觉csdn里面编辑文本怪怪的,比如上下箭头按键不好用、backspace键删除一行不好用、ie浏览器里出现奇怪的文本框、时不时出现键入位置偏移之类的奇怪错误,可能是我电脑的原因,下回换个电脑试一下。但总之就我码了这么多博客(虽然总共没码多少字)的经验来说,csdn的用户写作体验绝对是差评、差评、差评。 逻辑回归与线性回归的联系与区别 线性回归是用于回归问题,y是连续值; 逻辑回归是用于...原创 2019-03-31 09:48:35 · 220 阅读 · 0 评论 -
机器学习笔记1
有监督/无监督学习 泛化能力、过拟合、欠拟合、方差、偏差 交叉验证 线性回归的基本形式 线性回归的损失函数、代价函数 线性回归的梯度下降法 R方、常用优化方法 sklearn的线性回归 LinearRegression()的参数 fit_intercept=True 默认要计算截距项,否则不计算截距项(数据已经中心化)。 normalize=Fal...原创 2019-03-28 15:34:28 · 195 阅读 · 1 评论 -
机器学习笔记3
信息论基础 决策树的局限性:决策边界是横平竖直的,与坐标轴平行的;对个别样本点很敏感。 回归树 from sklearn.datasets import load_boston from sklearn.model_selection import train_test_split from sklearn.tree import DecisionTreeRegressor bost...原创 2019-04-03 11:51:01 · 345 阅读 · 0 评论 -
数据预处理总结2
类别变量 文本转换为数值(一列类别变量) 适用于有序变量(小学、初中、高中、大学;差、中、良、优…) from sklearn.preprocessing import LabelEncoder df = pd.DataFrame([[2,'aa'],[3,'ss'],[33,'aa'],[43,'dd'],[66,'dd']]) # 这个类没什么参数,可以一行代码解决战斗 df[1]...原创 2019-06-26 14:53:51 · 182 阅读 · 0 评论 -
数据预处理总结1
特征缩放 标准化 使数据服从标准正态分布,均值为0,方差为1。 做数据挖掘,pandas和numpy库肯定是要引入的,这里就省略了。 from sklearn.preprocessing import StandardScaler import warnings warnings.filterwarnings("ignore") mydata = pd.DataFrame([[-1,2...原创 2019-06-24 16:51:55 · 269 阅读 · 0 评论