让路
勤学苦练,不负韶华。
展开
-
《Python机器学习基础教程》01 鸢尾花分类与KNN近邻算法
书山有路勤为径,学海无涯苦作舟黑发不知勤学早,白首方悔读书迟鸢尾花数据集1.1 数据简介from sklearn.datasets import load_irisiris_dataset = load_iris()print("Keys of iris_dataset: \n{}".format(iris_dataset.keys()))Keys of iris_dataset:dict_keys([‘data’, ‘target’, ‘target_names’, ‘DESCR’,原创 2021-09-26 10:50:44 · 161 阅读 · 0 评论 -
《从青铜学到王者》Python机器学习工程师之知识点汇总
机器学习DAY01机器学习概述什么是机器学习机器学习是一门能够让编程计算机从数据中学习的计算机科学。一个计算机程序在完成任务T之后,获得经验E,其表现效果为P,如果任务T的性能表现,也就是用以衡量的P,随着E增加而增加,那么这样计算机程序就被称为机器学习系统。自我完善,自我增进,自我适应。为什么需要机器学习自动化的升级和维护解决那些算法过于复杂甚至跟本就没有已知算法的问题在机器学习的过程中协助人类获得对事物的洞见机器学习的问题建模问题所谓机器学习,在形式上可这样理解:在数据对原创 2021-08-14 09:12:59 · 121 阅读 · 0 评论 -
《从青铜学到王者》Python机器学习工程师之 情感分析,主题抽取,语音识别, 图像识别 07
每天一遍,学习不厌nltk分类器nltk提供了朴素贝叶斯分类器方便的处理自然语言相关的分类问题,并且可以自动处理词袋,完成IFIDF矩阵的整理,完成模型训练,最终实现类别预测。使用方法如下:import nltk.classify as cfimport nltk.classify.util as cu'''train_data的格式不再是样本矩阵,nltk要求的数据格式如下:[ ({'age': 15, 'score1': 95, 'score2': 95}, 'good'), ({'原创 2021-08-21 19:07:04 · 181 阅读 · 0 评论 -
《从青铜学到王者》Python机器学习工程师之 推荐引擎原理,自然语言处理,词袋模型,TF-IDF 06
文章目录每天一遍,学习不厌推荐引擎自然语言处理(NLP)文本分词词干提取词性还原词袋模型词频(TF)文档频率(DF)逆文档频率(IDF)词频-逆文档频率(TF-IDF)每天一遍,学习不厌推荐引擎推荐引擎涉及两件事:召回,排序。召回就是把你的需要的召回回来,在对所有的进行排序。推荐引擎意在把最需要的推荐给用户。推荐引擎有两种:1,基于用户的协同过滤(user base cf), 找到相似用户。(聚类,找到用户属于的类别。或者根据用户特征整理得到相似用户)2基于项目(内容)的协同过滤。(找相似的原创 2021-08-21 12:57:19 · 173 阅读 · 0 评论 -
《从青铜学到王者》Python机器学习工程师之 网格搜索,SVR预测,聚类 ,Kmeans,DBSCAN 05
文章目录每天一遍,学习不厌网格搜索案例:事件预测案例:交通流量预测(回归)聚类K均值算法图像量化均值漂移算法凝聚层次算法轮廓系数DBSCAN算法每天一遍,学习不厌网格搜索获取一个最优超参数的方式可以绘制验证曲线,但是验证曲线只能每次获取一个最优超参数。如果多个超参数有很多排列组合的话,就可以使用网格搜索寻求最优超参数组合。针对超参数组合列表中的每一个超参数组合,实例化给定的模型,做cv次交叉验证,将其中平均f1得分最高的超参数组合作为最佳选择,实例化模型对象。网格搜索相关API:import原创 2021-08-20 12:52:24 · 498 阅读 · 0 评论 -
《从青铜学到王者》Python机器学习工程师之 分类模型评估、决策树调参案例、SVM 04
机器学习DAY04交叉验证由于数据集的划分有不确定性,若随机划分的样本正好处于某类特殊样本,则得到的训练模型所预测的结果的可信度将受到质疑。所以需要进行多次交叉验证,把样本空间中的所有样本均分成n份,使用不同的训练集训练模型,对不同的测试集进行测试时输出指标得分。sklearn提供了交叉验证相关API:import sklearn.model_selection as msms.cross_val_score(模型, 输入集, 输出集, cv=折叠数, scoring=指标名)->指标值数组原创 2021-08-14 08:23:53 · 165 阅读 · 0 评论 -
《从青铜学到王者》Python机器学习工程师之 决策树,随机森林,逻辑回归,朴素贝叶斯,数据集的划分 03
机器学习DAY12正向激励首先为样本矩阵中的样本随机分配初始权重,由此构建一棵带有权重的决策树,在由该决策树提供预测输出时,通过加权平均或者加权投票的方式产生预测值。将训练样本代入模型,预测其输出,对那些预测值与实际值不同的样本,提高其权重,由此形成第二棵决策树。重复以上过程,构建出不同权重的若干棵决策树。正向激励相关API:import sklearn.tree as stimport sklearn.ensemble as se# model: 决策树模型(一颗)model = st.De原创 2021-08-12 10:20:49 · 235 阅读 · 0 评论 -
《从青铜学到王者》Python机器学习工程师之 线性回归与决策树 02
每天妹子看一遍,怎么学都学不厌系列文章目录第一章 《从青铜学到王者》Python机器学习工程师之 概述与数据的预处理 01第二章 《从青铜学到王者》Python机器学习工程师之 线性回归与决策树 02文章目录每天妹子看一遍,怎么学都学不厌系列文章目录线性回归线性回归评估训练结果误差(metrics)模型的保存和加载岭回归多项式回归决策树基本算法原理工程优化集合算法正向激励线性回归输入 输出0.5 5.00.6 5.50.8 6.01.1转载 2021-08-07 11:44:50 · 159 阅读 · 0 评论 -
《从青铜学到王者》Python机器学习工程师之 概述与数据的预处理 ,数据编码 01
每天妹子看一遍,天天学习学不厌机器学习概述什么是机器学习机器学习是一门能够让编程计算机从数据中学习的计算机科学。一个计算机程序在完成任务T之后,获得经验E,其表现效果为P,如果任务T的性能表现,也就是用以衡量的P,随着E增加而增加,那么这样计算机程序就被称为机器学习系统。自我完善,自我增进,自我适应。为什么需要机器学习自动化的升级和维护解决那些算法过于复杂甚至跟本就没有已知算法的问题在机器学习的过程中协助人类获得对事物的洞见机器学习的问题建模问题所谓机器学习,在形式上可这样原创 2021-08-04 16:28:30 · 579 阅读 · 0 评论