- 博客(24)
- 收藏
- 关注
原创 【机器学习-数据科学】第三节:数据分析实例 分析MovieLens电影数据
数据分析实例 分析MovieLens电影数据导入数据数据合并按性别查看各个电影的平均评分活跃电影排行榜电影投票数据grouplens.org/datasets/movielens把文件放到这个路径下导入数据数据合并按性别查看各个电影的平均评分查看男女评分差别最大的按照diff去排序 找出分歧最大的就好啦活跃电影排行榜评分个数这些就是最热门的电影(前十大热门电影)下面找评分最高的电影但是现在结果是很多评分高的用户少的不知名的电影排行很高为了解决这个问
2020-08-01 15:08:54
997
原创 【机器学习-数据科学】第二节:ipython开发环境搭建以及pandas快速入门
这里写目录标题0.开发环境搭建技巧网页版ipython:ipython notebooknumpy1.pandas 快速入门一导入创建对象2. pandas 快速入门二空数据处理apply的用法count和mode函数数据合并3. pandas 快速入门三数据整形数据透视时间序列数据可视化数据载入和保存0.开发环境搭建pip install jupyterpip install numpypip install matplotlib然后进入ipython 看一下没有错就可以了技巧ipy
2020-07-30 16:43:14
545
原创 【机器学习-数据科学】第一节:numpy&pandas
numpy&pandas安装numpy&pandasarray创建numpy的基础运算numpy的索引numpy的 array 合并numpy的 array分割numpy的 copy & deep copy安装numpy&pandasimport numpy as nparray=np.array([[1,2,3], [2,3,4]])# 将数组转化为矩阵print(array) #打印矩阵print('number of dim
2020-07-28 15:25:47
415
原创 我的爬虫第一天
爬虫一个简单的爬虫:1.安装request2.测试是否安装成功3.新建项目4.使用requests请求网页4.如何用python解析网页源码5.简单的保存数据的方法一个简单的爬虫:1.安装requestpip install requests2.测试是否安装成功输入pythonimport requests不报错就是安装成功3.新建项目4.使用requests请求网页import requests #引入requests包resp=requests.get('https:
2020-07-27 16:35:04
279
原创 【Python基础知识-pycharm版】第十一节-文件操作(IO技术)
第十一节-文件操作(IO技术)文本文件和二进制文件文件操作相关模块概述创建文件对象 open()文本文件的写入基本的文件写入操作常用编码介绍ASCIIISO8859-1GB2312,GBK,GB18030中文乱码问题write()/writelines()写入数据close()关闭文件流with 语句(上下文管理器)文本文件的读取二进制文件的读取和写入文件对象的常用属性和方法文件任意位置操作使用 pickle 序列化CSV 文件的操作csv.reader 对象和 csv 文件读取csv.writer 对象和
2020-07-25 13:31:18
627
原创 【Python基础知识-pycharm版】第十节_异常
第十节异常异常机制本质异常解决的关键:定位try... 一个 except 结构try... 多个 except 结构try...except...else 结 构try...except...finally 结构return 语句和异常处理问题常见异常的解决常见异常汇总with 上下文管理trackback 模块自定义异常类异常在实际工作中,我们遇到的情况不可能是非常完美的。比如:你写的某个模块,用户输入不一定符合你的要求;你的程序要打开某个文件,这个文件可能不存在或者文件格式不对;你要读取数据库的数
2020-07-23 15:47:03
1384
原创 【Python基础知识-pycharm版】第九节_面向对象的三大特征
第九节方法方法没有重载私有属性和私有方法(实现封装)@property装饰器_get和set方法面向对象的三大特征说明(封装、继承、多态)继承方法的重写(类成员的继承和重写)查看类的继承结构object根类_dir() 查看对象属性重写__str__()方法多重继承mro()super()获得父类的定义多态特殊方法和运算符重载特殊属性对象的浅拷贝和深拷贝组合设计模式_工厂模式设计模式_单例模式方法方法没有重载私有属性和私有方法(实现封装)#测试私有属性class Employee: d
2020-07-22 17:36:22
754
原创 【Python基础知识-pycharm版】第八节-面向对象编程/类
面向对象编程面向对象和面向过程的区别_执行者思维_设计者思维类的定义构造函数__init__实例属性_内存分析实例方法_内存分析类对象类属性_内存分析创建类和对象的底层类方法_静态方法_内存分析图示__del__()析构方法和垃圾回收机制__call__()方法和可调用对象面向对象和面向过程的区别_执行者思维_设计者思维类的定义class Student: #company= "SXT" #类属性 #count =0 #类属性 def __
2020-07-21 17:32:39
436
原创 【Python基础知识-pycharm版】第六节-控制语句
控制语句选择结构选择结构通过判断条件是否成立,来决定执行哪个分支。选择结构有多种形式,分为:单分支、双分支和多分支。流程图如下:s=input("请输入一个数字")if int(s)<10: print("s是小于10的数字")else: print("s是大于等于10的数字")#测试三元条件运算符print("s是小于10的数字"if int(s)<10 else "s是大于等于10的数字")请输入一个数字55s是大于等于10的数字s是大于等于10
2020-07-19 20:23:53
470
原创 【Python基础知识-pycharm版】第五节-字典\集合
第五节-字典\集合\控制语句字典字典的创建字典元素的访问字典元素添加、修改、删除序列解包表格数据使用字典和列表存储,并实现访问字典核心底层原理(重要)集合集合相关操作字典字典是“键值对”的无序可变序列,字典中的每个元素都是一个键值对,包含:“键对象”和“值对象”,可以通过“键对象”实现快速获取、删除、更新对应的“值对象”。列表中我们通过“下标数字”找到对应的对象。字典中通过“键对象”找到对应的“值对象”。“键”是任意不可变数据,比如:整数、浮点数、字符串、元组。但是:列表、字典、集合这些事可变对象,不
2020-07-16 19:45:23
1310
原创 【Python基础知识-pycharm版】第四节-元组
元组元组的创建元组的元素访问和计数生成器推导式创建元组列表属于可变序列,可以任意修改列表中的元素,元组属于不可变序列,不能修改元组中的元素。因此,元组没有增加元素、修改元素、删除元素相关的方法。因此,我们只需要学习元组的创建和删除,元组中元素的访问和计数即可。元组支持如下操作:索引访问切片操作连接操作成员系列操作比较运算操作计数:元组len()、最大值max()、最小值()、求和sum()等元组的创建1.通过()创建元组,小括号可以省略a=(10,20,30)或者a=10,20,3
2020-07-16 15:11:11
675
原创 【Python基础知识-pycharm版】第三节-列表
Python 第三节-列表序列-列表列表创建的四种方式创建列表的增加和删除列表元素访问和技术列表排序二维列表表格数据的存取和读取序列-列表常用的序列结构:字符串 元祖 字典 集合列表对象大小可变,根据需要随时增加或缩小列表创建的四种方式一、基本语法[]创建a = []print(a) #结果,创建空的列表 []b = [1,2,"abc"]print(b) #结果:[1, 2, 'abc']print(b[2]) #结果:abc二、list()创建c = list
2020-07-14 22:12:17
1196
原创 【Python基础知识-pycharm版】第二节-赋值/数据类型/时间点/运算符/字符串
python第二节链式赋值_系列解包赋值内置数据类型时间表示unix时间点多点坐标绘出折线图运算符字符串部分来源:1.https://blog.youkuaiyun.com/wys103158/article/details/964882382.https://www.cnblogs.com/jack-zh/p/10810569.html3.http://c.biancheng.net/view/4258.html4.https://www.runoob.com/python/python-operators
2020-07-13 21:06:56
1315
原创 【Python基础知识-pycharm版】第一节-基础
python第一节特点Python 解释器python开发环境交互模式IDLE开发环境使用入门程序基本格式图形化程序设计python程序的构成python程序的对象python的引用python的标识符标识符命名规则变量和简单赋值语句删除变量和垃圾回收机制Python 是一种解释型、面向对象的语言。官网:www.python.org部分来源于:1.https://www.runoob.com/python/python-object.html2.https://blog.youkuaiyun.com/dori
2020-07-13 11:26:47
802
转载 Opencv visual studio c++ 环境搭建
转载:https://blog.youkuaiyun.com/smilife_/article/details/89244189https://blog.youkuaiyun.com/cwj066/article/details/82252764c++ 环境搭建下载链接opencv-3.4.5-vc14_vc15.exe第一步:去opencv官网(https://opencv.org/)下载opencv源码https://opencv.org/releases/,选一个版本下载(opencv-xxx.exe,xxx版本号
2020-07-12 13:05:09
997
原创 【机器学习】逻辑回归—良/恶性乳腺癌肿瘤预测
逻辑回归—良/恶性乳腺癌肿瘤预测逻辑回归的损失函数、优化与线性回归原理相同,但由于是分类问题,损失函数不一样,只能通过梯度下降求解sklearn逻辑回归APIsklearn.linear_model.LogisticRegressionLogisticRegressionsklearn.linear_model.LogisticRegression(penalty=‘l2’, C = 1.0)Logistic回归分类器coef_:回归系数只能解决二分类问题:广告点击率判
2020-07-09 20:18:04
3265
原创 【机器学习】回归算法-线性回归分析、回归实例和回归性能评估
回归算法-线性回归分析、回归实例和回归性能评估线性回归损失函数(误差大小)sklearn线性回归正规方程、梯度下降API线性回归实例回归:目标值连续;分类:目标值离散。预测回归和分类是不一样的。回归问题可以用于预测销售额,比如公司的收入、广告可以影响会对销售额进行预测。举个例子:期末成绩:0.7×考试成绩+0.3×平时成绩西瓜好坏:0.2×色泽+0.5×根蒂+0.3×敲声import matplotlib.pyplot as pltplt.figure(figsize=(10,10))p
2020-07-09 16:52:22
1660
原创 【机器学习】sclearn分类算法-决策树、随机森林
分类算法-决策树、随机森林1.决策树1.1 认识决策树1.2 信息论基础-银行贷款分析1.3 决策树的生成1.4 决策树的划分依据之一-信息增益1.5 sklearn决策树API1.6 泰坦尼克号乘客生存分类2. 集成学习方法-随机森林1.决策树1.1 认识决策树决策树思想的来源非常朴素,程序设计中的条件分支结构就是if-then结构,最早的决策树就是利用这类结构分割数据的一种分类学习方法1.2 信息论基础-银行贷款分析每猜一次给一块钱,告诉我是否猜对了,那么我需要掏多少钱才能知道谁
2020-07-08 17:25:55
1090
原创 【机器学习】分类算法sklearn-朴素贝叶斯算法
分类算法-朴素贝叶斯算法1. 概率基础2. 朴素贝叶斯介绍3. sklearn朴素贝叶斯实现API4. 朴素贝叶斯算法案例1. 概率基础概率定义为一件事情发生的可能性:扔出一个硬币,结果头像朝上;某天是晴天联合概率和条件概率“”:联合概率:包含多个条件,且所有条件同时成立的概率记作:????(????,????)条件概率:就是事件A在另外一个事件B已经发生条件下的发生概率记作:????(????|????)特性:P(A1,A2|B) = P(A1|B)P(A2|B)注意:此条件概率的成立,
2020-07-08 10:36:10
582
原创 【机器学习】sklearn k-近邻算法
sklearn k-近邻算法1. sklearn k-近邻算法API2. k近邻算法实例-预测入住位置核心思想:你的“邻居”来推断出你的类别定义:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。来源:KNN算法最早是由Cover和Hart提出的一种分类算法如何求距离:计算距离公式两个样本的距离可以通过如下公式计算,又叫欧式距离比如说,a(a1,a2,a3),b(b1,b2,b3)相似样本,特征之间的值应该都是相近的。skle
2020-07-08 09:13:43
723
原创 【机器学习】sklearn数据集获取、分割、分类和回归
sklearn数据集1、数据集划分机器学习一般的数据集会划分为两个部分:训练数据:用于训练,构建模型(分类、回归和聚类)测试数据:在模型检验时使用,用于评估模型是否有效划分的时候一般就是75%和25%的比例。sklearn数据集划分API:sklearn.model_selection.train_test_split获取数据分为两种,一个是在datasets中的直接加载可以使用的,另一个一个是需要下载的大规模的数据集。sklearn.datasets加载获取流行数据集datasets
2020-07-07 19:53:39
2325
原创 【机器学习】sklearn数据特征预处理:归一化和标准化
归一化处理特点:通过对原始数据进行变换把数据映射到(默认为[0,1])之间from sklearn.preprocessing import MinMaxScalerdef mm(): """ 归一化处理 :return: NOne """ mm = MinMaxScaler(feature_range=(2,3)) data = mm.fit_transform([[90, 2, 10, 40], [60, 4, 15, 45], [75, 3, 1
2020-07-07 15:52:52
1002
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人