
数据科学
sabcasjkd
是只小猴子
展开
-
Pandas常用操作整理
【代码】Pandas常用操作整理。原创 2023-08-24 17:24:32 · 197 阅读 · 0 评论 -
[机器学习-笔记07] 支持向量机
1. 原理直觉解释:SVM需要尝试找到满足红点和绿点分别到边界线的最小距离的最大值的那条边界。2. Python案例实现2.1 数据案例中使用的数据结构如下(只展示了部分样本):2.2 实现代码部分与[机器学习-笔记06]逻辑回归的案例代码部分类似,主要在模型拟合那部分有所改动,因此相似的代码就省略了。from sklearn.svm import SVC# 拟合模型classifier = SVC(kernel = 'linear', random_state = 0)class原创 2021-04-19 15:22:27 · 177 阅读 · 0 评论 -
[机器学习-笔记06]逻辑回归
1.原理假设函数Sigmoid函数图像:决策界限代价函数整合后的代价函数:2. Python案例实现2.1 数据数据格式如下(只展示了部分样本):2.2 实现原创 2021-04-19 14:41:56 · 305 阅读 · 0 评论 -
[机器学习-笔记05] 回归模型表现评估
1. R2剩余平方和共平方和R22. 广义R2随着新自变量的加入R2不会下降[注1] 特征过多会造成模型过拟合。广义R2随着自变量个数的升高,Adj R^2会受到惩罚。原创 2021-04-18 20:44:43 · 189 阅读 · 0 评论 -
[数据可视化-笔记05] Python&Leather多图Grid
实现data1 = [(1, 3),(2, 5),(3, 3),(5, 2)]data2 = [(3, 4),(5, 6),(7, 10),(8, 2)]chart1 = leather.Chart('Dots')chart1.add_dots(data1, fill_color="blue")chart2 = leather.Chart('Lines')chart2.add_line(data2, stroke_color="red")grid = leather.Grid()g.原创 2021-04-18 19:16:59 · 98 阅读 · 0 评论 -
[数据可视化-笔记04] Python&Leather画柱状图
API如下:add_columns(data, x=None, y=None, name=None, fill_color=None)实现:import leather# 数据data1 = [['A',2],['B',3],['C',1],['D',4],['E',5],['F',2]]# 可视化chart = leather.Chart("My Column Chart")chart.add_columns(data1, fill_color="red")chart.add_y原创 2021-04-18 19:03:51 · 115 阅读 · 0 评论 -
[数据可视化-笔记03] Python&Leather画条形图
API如下:add_bars(data, x=None, y=None, name=None, fill_color=None)实现:import leather# 数据data1 = [[2,'A'],[3,'B'],[1,'C'],[4,'D']]# 可视化chart = leather.Chart("My Bar Chart")chart.add_bars(data1, fill_color="blue")chart.add_x_scale(0,5)# 显示图像chart原创 2021-04-18 18:59:02 · 117 阅读 · 0 评论 -
[机器学习-笔记04] 多项式回归
1. 原理多项式回归方程:应用情境:2. Python案例实现2.1 数据共10条数据,如下:2.2 实现import numpy as npimport pandas as pdfrom sklearn.model_selection import train_test_splitfrom sklearn.linear_model import LinearRegressionfrom sklearn.preprocessing import PolynomialFeatu原创 2021-04-18 18:36:35 · 140 阅读 · 0 评论 -
[机器学习-笔记03] 多元线性回归
1. 多元线性回归原理多元线性回归的方程如下:使用多元线性回归时需满足的假设:线性、同方差性、多元正态分布、误差独立、无多重共线性虚拟变量:可以看下这篇对虚拟变量的直观介绍:什么是虚拟变量?怎么设置才正确?虚拟变量陷阱:所谓的“虚拟变量陷阱”就是当一个定性变量含有m个类别时,模型引入m个虚拟变量,造成了虚拟变量之间产生完全多重共线性,无法估计回归参数。下图例子中若同时加入New York和California的虚拟变量则会使得D2=1-D1成立,从而造成多重共线性,掉入虚拟变量陷进。因原创 2021-04-18 17:54:31 · 469 阅读 · 0 评论 -
[数据可视化-笔记02] Python&Leather画折线图
API如下:add_line(data, x=None, y=None, name=None, stroke_color=None, width=None)实现:import leather# 数据data1 = [[1.5,2],[2,3.5],[3,2.5],[4,4.8],[5,1.2]]data2 = [[1.5,2],[2.3,4],[3,3],[4,2.3],[5,0.9]]# 可视化chart = leather.Chart("My Line Chart")chart原创 2021-04-17 20:42:56 · 122 阅读 · 0 评论 -
[数据可视化-笔记01] Python&Leather画点图
API如下:add_dots(data, x=None, y=None, name=None, fill_color=None, radius=None)实现:import leather# 数据data1 = [[1.5,2],[2,3.5],[1.8,2.5],[3.3,4.8],[0.9,1.2]]data2 = [[2.6,2],[2.4,1.3],[4.8,2.5],[1.1,2.3],[4.8,0.9]]# 可视化chart = leather.Chart("My Cha原创 2021-04-17 20:28:40 · 177 阅读 · 0 评论 -
[机器学习-笔记02] 简单线性回归
1. 简单线性回归原理简单(一元)线性回归的方程如下:二维平面表示:b0和b1的含义:模型拟合:2. Python案例实现2.1 数据我们用到的数据如下:2.2 实现# Simple Linear Regression# Importing the librariesimport numpy as npimport matplotlib.pyplot as pltimport pandas as pd# Importing the datasetdataset原创 2021-04-17 11:37:54 · 259 阅读 · 1 评论