
机器学习
iken_g
肝肝肝
展开
-
Scikit-learn总结: 常用方法
在机器学习和数据挖掘的应用中,scikit-learn是一个功能强大的python包。在数据量不是过大的情况下,可以解决大部分问题。学习使用scikit-learn的过程中,我自己也在补充着机器学习和数据挖掘的知识。这里根据自己学习sklearn的经验,我做一个总结的笔记。另外,我也想把这篇笔记一直更新下去。1 scikit-learn基础介绍1 、估计器(Estimator)估计器,很多时...转载 2019-04-22 22:35:58 · 773 阅读 · 0 评论 -
机器学习数据处理框架、步骤
原创 2019-04-19 22:03:34 · 865 阅读 · 0 评论 -
机器学习之数据处理过程小知识+参考网址集合
机器学习过程知识集锦fig,ax = plt.subplots()的理解这个fig,ax = plt.subplots()的意思是,建立一个fig对象,建立一个axis对象。不然要用更复杂的方式来建如下:fig=plt.figure()ax=fig.add_subplot(111)pandas.DataFrame()中的iloc和loc用法iloc,即index locate 用...原创 2019-04-24 23:34:25 · 264 阅读 · 0 评论 -
机器学习的相关知识的简介
机器学习的相关知识与介绍*阿尔法狗( AlphaGo )是一款围棋人工智能程序,由谷歌( Google) ! : 旗下 De叩Mind 公司的戴密斯·哈萨比斯、大卫·席尔瓦、黄士杰与他们 : 的团队开发,其主要工作原理是“深度学习”。KNN 最近邻算法BP 和扎在LP 神经网络算法MLP (Multi-layer Percep位on )多层神经网络算法也称为 MLP 多层感知器,是...原创 2019-04-24 23:53:47 · 591 阅读 · 0 评论 -
Python的zip函数, 使用zip()划分训练集和测试集
Python的zip函数使用zip() data_class_list = list(zip(data_list, class_list)) #zip压缩合并,将数据与标签对应压缩 random.shuffle(data_class_list) #将data_class_list乱序 index = ...原创 2019-07-11 17:20:29 · 1249 阅读 · 0 评论 -
Python实现 交叉验证
交叉验证trainingSet :储存训练集索引index :数据集总数all_data:储存测试集索引trainingSet = list(range(all_data)) #创建存储训练集的索引值的列表testSet = [] #储存测试集的索引值的列表 for i i...原创 2019-07-11 17:37:29 · 14574 阅读 · 6 评论 -
电影小数据分析
一、预处理先给源码git下载:https://github.com/linkunxin/filmRvenuePred或者网盘下载:1、数据初步处理先来看一下数据集样子然后总览一下数据情况( info() ),在此之前,我们往往将测试集和训练集先合并,统一处理后再分开,就不用处理两遍了。import pandas as pdimport numpy as npimport mat...原创 2019-07-31 21:02:26 · 2631 阅读 · 0 评论