
机器学习基础python实现
文章平均质量分 87
「已注销」
这个作者很懒,什么都没留下…
展开
-
Python编程
Python编程学习input函数创建列表列表常用函数和方法删除元素修改列表元素查询列表元素位置列表常用操作元组字典(dict)集合运算程序流程控制语句if多路分支(else、elif)for 循环whilerange 函数breakcontinue函数创建并使用匿名函数面向对象编程绑定 self删除对象私有化方法生成迭代器返回迭代器继承父类属性和方法文件基础最后一次更新,要离开了pythoninput函数>>> zz=input()我心光明>>> zz'我原创 2021-04-26 11:07:21 · 1114 阅读 · 1 评论 -
惊叹,Pyecharts绘制图表原来可以如此漂亮!
本文转载自公众号「杰哥的IT之旅」,作者旧时晚风拂晓城Pyecharts一、Pyecharts简介和安装二、绘制地理图表三、柱形图四、饼图五、环图六、玫瑰图七、词云图八、仪表盘九、水球图十、折线图十一、箱形图一、Pyecharts简介和安装1、简介Echarts 是一个由百度开源的数据可视化,凭借着良好的交互性,精巧的图表设计,得到了众多开发者的认可。而 Python 是一门富有表达力的语言,很适合用于数据处理。当数据分析遇上数据可视化时,pyecharts 诞生了。简洁的 API 设计,使用如丝转载 2021-04-26 11:00:34 · 1778 阅读 · 0 评论 -
《特征工程入门与实践》--特征构建
特征构建检查数据集自定义分类填充器编码分类变量定序等级的编码将连续特征分箱扩展数值特征针对文本的特征构建词袋法CountVectorizerTF-IDF向量化器我们会探讨如下主题:检查数据集;填充分类特征;编码分类变量;扩展数值特征;针对文本的特征构建。检查数据集为了进行演示,本章会使用我们自己创建的数据集,以便展示不同的数据等级和类型。我们先设置数据的DataFrame。用Pandas创建要使用的DataFrame,这也是Pandas的主要数据结构。这样做的优点是可以用很多属性和方法原创 2021-02-15 23:38:04 · 929 阅读 · 0 评论 -
《特征工程入门与实践》--特征选择
特征选择元指标特征选择的类型:基于统计的特征选择皮尔逊相关系数假设检验基于模型的特征选择使用机器学习选择特征针对基于树的模型线性模型和正则化《特征工程入门与实践》 -特征选择元指标元指标是指不直接与模型预测性能相关的指标,它们试图衡量周遭的性能,包括:模型拟合/训练所需的时间;拟合后的模型预测新实例的时间;需要持久化(永久保存)的数据大小。为了跟踪这些指标,我们可以创建一个get_best_model_and_accuracy函数以评估若干模型,同时精细到可以提供每个模型的指标原创 2021-02-15 19:40:43 · 863 阅读 · 0 评论 -
端到端的机器学习项目
端到端的机器学习项目 一、关于RMSE和MAE的理解二、快速查看数据结构三、创建测试集四、地理数据可视化可视化参数查找关联五、数据清洗pandas的dropna()函数pandas的drop函数Imputerfit(),transform(),fit_transform()Scikit-Learn 设计六、处理文本和类别属性reshape七、自定义转换器八、特征缩放九、流水线十、网格搜索https://dl.apachecn.org/#/docs/hands-on-ml-2e-zh/2本篇涉及到的方法比原创 2021-02-11 00:46:33 · 723 阅读 · 2 评论 -
回归模型 python实现
python 机器学习 (四)、回归预测1、线性回归器step1:美国波士顿地区房价数据描述step2:美国波士顿地区房价数据分割step3:训练与测试数据标准化处理step4:使用线性回归模型LinearRegression 和 SGDRegressor分别对数据进行学习和预测step5:使用三种回归评价机制对模型回归能力进行评价2、支持向量机(回归)step1:使用三种不同核函数配置的支持向量机模型进行训练,并作出预测step2:对三种核函数配置下的支持向量机回归模型在相同测试集上进行性能评估3、kkk原创 2021-01-08 21:51:38 · 3617 阅读 · 0 评论 -
决策树及集成模型 python实现
python机器学习1、决策树step1:泰坦尼克号乘客数据库step2:使用决策树模型预测泰坦尼克号乘客的生还情况step3:决策树模型对泰塔尼克乘客是否生还的预测性能2、集成模型step1:使用集成模型对泰坦尼克号乘客是否生还的预测step2:集成模型对泰塔尼克乘客是否生还的预测性能1、决策树step1:泰坦尼克号乘客数据库# 导入pandas用于数据分析。import pandas as pd# 利用pandas的read_csv模块直接从互联网收集泰坦尼克号乘客数据。titanic =原创 2021-01-08 20:42:09 · 450 阅读 · 0 评论 -
支持向量机,朴素贝叶斯,k近邻(分类) python实现
Python 机器学习(二) 支持向量机,朴素贝叶斯,k 近邻(分类) python实现1、 支持向量机(分类)step1:手写体数据读取代码样例# 从sklearn.datasets里导入手写体数字加载器。from sklearn.datasets import load_digits# 从通过数据加载器获得手写体数字的数码图像数据并储存在digits变量中。digits = load_digits()# 检视数据规模和特征维度。digits.data.shape(1797L, 6原创 2021-01-08 20:08:36 · 730 阅读 · 0 评论 -
逻辑回归及 SGDC python 实现
Python 机器学习(一)Logistic Regression,SGDC应用于预测Tips线性关系:f(w,x,b)=wTx+bf(\boldsymbol{w},\boldsymbol{x},b) = \boldsymbol{w}^T\boldsymbol{x}+bf(w,x,b)=wTx+bLogistic函数:g(z)=11+e−z g(z)= \frac{1}{1+e^{-z}}g(z)=1+e−z1整合上面两式子得到 Logistic Regression:h(w,b)(x)=原创 2021-01-08 17:50:12 · 678 阅读 · 0 评论