- 博客(162)
- 收藏
- 关注
原创 【JAVA】计算算式
package hello;import java.util.Scanner;public class Hello { public static void main(String[] args) { // TODO Auto-generated method stub System.out.println("你好"); Scanner in=new Scanner(System.in); int price; price=in.nextInt(); System.out
2021-12-18 23:04:03
750
1
原创 【JAVA】应声虫程序
package hello;import java.util.Scanner;public class Hello { public static void main(String[] args) { // TODO Auto-generated method stub System.out.println("你好"); Scanner in=new Scanner(System.in); System.out.println("echo:"+in.nextLine()); }
2021-12-18 22:54:45
1304
原创 机器学习-pr曲线,roc曲线
模型评价指标0. 加载相关模块import numpy as npimport matplotlib.pyplot as pltimport pandas as pdimport seaborn as snsfrom sklearn.model_selection import train_test_split# 用于在jupyter中进行绘图%matplotlib inline1. 数据加载# 加载数据集fruits_df = pd.read_table('fruit_data_w
2021-03-27 21:22:14
355
原创 机器学习-交叉验证及网格搜索,保存模型到硬盘
交叉验证及网格搜索0. 加载相关模块import numpy as npimport matplotlib.pyplot as pltfrom sklearn.datasets import load_irisfrom sklearn.model_selection import train_test_split# 用于在jupyter中进行绘图%matplotlib inline1. 数据加载iris = load_iris()X = iris.datay = iris.targ
2021-03-27 21:02:08
855
原创 机器学习-向量机SVM
SVM0. 加载相关模块from sklearn.datasets import load_irisfrom sklearn.svm import SVCfrom sklearn.model_selection import train_test_splitfrom sklearn.metrics import accuracy_score# 用于在jupyter中进行绘图%matplotlib inline1. 加载数据iris = load_iris()1.1 数据处理X =..
2021-03-23 19:31:47
119
原创 机器学习-朴素贝叶斯
朴素贝叶斯0. 加载相关模块from sklearn.datasets import load_irisfrom sklearn.naive_bayes import GaussianNBfrom sklearn.neighbors import KNeighborsClassifierfrom sklearn.tree import DecisionTreeClassifierfrom sklearn.model_selection import train_test_splitfr...
2021-03-23 18:42:14
122
原创 机器学习-决策树
决策树0. 加载相关模块from sklearn.datasets import load_irisfrom sklearn.tree import DecisionTreeClassifierfrom sklearn.model_selection import train_test_splitimport seaborn as snsfrom sklearn.metrics import accuracy_score# 用于在jupyter中进行绘图%matplotlib inli..
2021-03-23 18:17:16
81
原创 机器学习-kNN
kNN0. 加载相关模块import numpy as npimport matplotlib.pyplot as pltimport pandas as pdimport seaborn as snsfrom sklearn.model_selection import train_test_split# 用于在jupyter中进行绘图%matplotlib inline1. 数据加载1.1 数据预览# 加载数据集fruits_df = pd.read_table('fruit.
2021-03-23 17:25:50
107
原创 机器学习-模型测试及评价
第八课 机器学习简单介绍第14节 模型测试及评价# 引入包import pandas as pdimport numpy as npimport seaborn as snsfrom sklearn.model_selection import train_test_split准备数据集# 加载数据# 乳腺癌数据集,30个特征,二分类问题:良性/恶性data = pd.read_csv('./dataset/breast_cancer.csv')print(data.shape)...
2021-03-23 11:19:11
330
原创 机器学习-模型调参
第八课 机器学习简单介绍第13节 模型调参方法# 引入包import pandas as pdimport numpy as npfrom sklearn.model_selection import train_test_split准备数据集# 加载数据iris_data = pd.read_csv('./dataset/iris.csv')# 获取特征X = iris_data[['sepal_length', 'sepal_width', 'petal_length', 'p..
2021-03-23 10:39:14
303
原创 机器学习-数据预处理及特征工程
第八课 机器学习简单介绍第十节 数据预处理及特征工程# 引入包import pandas as pdimport numpy as npfrom sklearn.model_selection import train_test_splitimport matplotlib.pyplot as plt准备数据集# 加载数据iris_data = pd.read_csv('./dataset/iris.csv')# 获取特征X = iris_data[['sepal_length',
2021-03-22 22:09:53
128
原创 机器学习-模型选择
第八课 机器学习简单介绍第九节 模型选择# 引入包import pandas as pdimport numpy as npfrom sklearn.model_selection import train_test_split准备数据集# 加载数据iris_data = pd.read_csv('./dataset/iris.csv')# 获取特征X = iris_data[['sepal_length', 'sepal_width', 'petal_length', 'petal_
2021-03-22 22:08:53
264
原创 机器学习-数据集准备及划分
第八课 机器学习简单介绍第八节 数据集准备及划分# 引入包import pandas as pdimport numpy as np准备数据集iris_data = pd.read_csv('./dataset/iris.csv')iris_data.head()sepal_length sepal_width petal_length petal_width species label0 5.1 3.5 1.4 0.2 setosa 11 4.9 3.0 1.4 0.2 setosa
2021-03-22 22:07:46
398
原创 机器学习-scikit-learn
第八课 机器学习简单介绍第七节 使用scikit-learn的流程# 引入包import pandas as pdimport numpy as np准备数据集iris_data = pd.read_csv('./dataset/iris.csv')iris_data.head()sepal_length sepal_width petal_length petal_width species label0 5.1 3.5 1.4 0.2 setosa 11 4.9 3.0 1.4 0.
2021-03-22 22:02:51
158
原创 pandas-绘图
import matplotlib.pyplot as pltimport pandas as pd# 读取数据iris_data = pd.read_csv('./dataset/iris.csv')iris_data.head()iris_data.index.values折线图iris_data.plot()柱状图# 分组柱状图iris_data.groupby('species').mean().plot(kind='bar')# 堆叠柱状图iris_da..
2021-03-21 19:56:15
160
原创 seaborn-类别数据可视化
第七课 数据可视化第15节 类别数据可视化 -- 类别散布图、类别内数据分布、类别内统计图import pandas as pdimport seaborn as sns# 加载小费数据集tips_data = sns.load_dataset('tips')tips_data.head()total_bill tip sex smoker day time size0 16.99 1.01 Female No Sun Dinner 21 10.34 1.66 Male No Sun...
2021-03-21 18:45:38
181
原创 seaborn-变量关系可视化
第七课 数据可视化第14节 数据集分布可视化(1) -- 变量关系可视化import pandas as pdimport seaborn as snspairplot# 加载鸢尾花数据集data = pd.read_csv('./dataset/iris.csv')data.head()sepal_length sepal_width petal_length petal_width species0 5.1 3.5 1.4 0.2 setosa1 4.9 3.0 1.4 0.2 s.
2021-03-21 18:05:31
194
原创 seaborn-单变量分布 双变量分布
第七课 数据可视化第13节 数据集分布可视化(1) -- 单变量分布、双变量分布import seaborn as snsimport numpy as npimport matplotlib.pyplot as pltsns.__version__'0.8.1'单变量分布# 核密度估计图data1 = np.random.normal(size=1000000) # 按正态分布生成数据sns.kdeplot(data1)plt.show()# 核密度估计图data2 = ..
2021-03-21 17:45:23
559
2
原创 matplotlib-坐标,标签,图例,标题
上下两行效果一样plt.yticks()里面可以放两个列表第七课 数据可视化第11节 Matplotlib坐标刻度、标签、图例、标题import matplotlib.pyplot as pltimport numpy as np# 生成数据data1 = np.random.randn(1000).cumsum()data2 = np.random.randn(1000).cumsum()data3 = np.random.randn(1000).cumsum()基本显示pl.
2021-03-21 12:16:58
614
2
原创 matplotlib-折线图颜色,标记,类型
第七课 数据可视化第十节 Matplotlib颜色、标记、线型import matplotlib.pyplot as pltimport numpy as npfig, subplot_arr = plt.subplots(2, 2, figsize=(8, 8))data = np.random.randn(20)subplot_arr[0, 0].plot(data, '--r.')subplot_arr[0, 1].plot(data, 'gv:')subplot_arr[1, .
2021-03-21 11:25:10
808
原创 matplotlib-子图的使用
第七课 数据可视化第九节 子图的使用import matplotlib.pyplot as pltimport numpy as np#划分画布fig, subplot_arr = plt.subplots(2, 2, figsize=(8, 8))#在画布上创建子图subplot_arr[0, 0].scatter(np.random.randn(50), np.random.randn(50) * 2)subplot_arr[0, 1].bar([1, 2, 3, 4, 5], [5,.
2021-03-21 11:17:53
129
原创 matplotlib-矩阵绘图
第七课 数据可视化第八节 矩阵绘图# 引入包import matplotlib.pyplot as pltimport numpy as np# 准备数据m = np.random.rand(10, 12)marray([[0.46838188, 0.88061003, 0.09905449, 0.86064009, 0.54258062, 0.0397806 , 0.98757139, 0.28271989, 0.13231385, 0.81527905, .
2021-03-21 11:05:48
1963
原创 matplotlib-直方图
第七课 数据可视化第七节 直方图的绘制# 引入包import matplotlib.pyplot as plt# 准备数据population_ages = [22, 55, 62, 45, 21, 22, 34, 42, 42, 4, 89, 82, 80, 80, 75, 65, 54, 44, 43, 42, 48]# 指定分组个数bins = 5plt.hist(population_ages, bins)plt.show()# 指定分组边界bins = [0, 10, .
2021-03-21 10:57:53
84
原创 matplotlib-散点图,柱状图
第七课 数据可视化第六节 散点图和柱状图的绘制# 引入包import matplotlib.pyplot as pltimport numpy as np散点图plt.figure()# 生成一组数据x = np.random.randn(50)y = x * 2# 可视化结果plt.scatter(x, y)plt.show()plt.figure()# 生成两组数据x = np.random.randn(50)y1 = x ** 2y2 = x * 2#..
2021-03-21 10:50:14
272
原创 matplotlib画布figure
第七课 数据可视化第五节 Matplotlib画布# 引入包import matplotlib.pyplot as pltimport numpy as np# 创建画布plt.figure()# 生成数据data = [2, 3, 6, 7, 11]# 可视化结果plt.plot(data)plt.show()设置画布大小# 创建画布plt.figure(figsize=(20, 5))# 生成数据random_data = np.random.randn(100)
2021-03-21 10:32:59
694
原创 pandas-滑动窗口
第四课 Pandas时序型数据分析第六节 时序数据滑动窗口操作import pandas as pdimport numpy as npser_obj = pd.Series(np.random.randn(1000), index=pd.date_range('20190101', periods=1000))ser_obj = ser_obj.cumsum()ser_obj.head()2019-01-01 0.4704242019-01.
2021-03-20 20:02:19
241
原创 pandas-时序数据重采样
第四课 Pandas时序型数据分析第五节 时序数据重采样import pandas as pdimport numpy as npdata_df = pd.read_csv('./datasets/day_stats.csv', index_col='date', parse_dates=True, dayfirst=True)data_df.head()city PM_China PM_US Post Polluted State CH Polluted State USdate ..
2021-03-20 19:38:27
370
1
原创 pandas-时序数据的位移与调整
第四课 Pandas时序型数据分析第四节 时序数据的位移与频率调整import pandas as pdimport matplotlib.pyplot as plt%matplotlib inline#parse_dates=True将时间序列解析为datetime类型data_df = pd.read_csv('./datasets/day_stats.csv', index_col='date', parse_dates=True, dayfirst=True)data_df.he..
2021-03-20 19:07:36
282
原创 pandas-时序性数据运算
第四课 Pandas时序型数据分析第三节 时序型数据运算import pandas as pdTimedeltapd.Timedelta('1 day')Timedelta('1 days 00:00:00')pd.Timedelta('1 day 2 hours')Timedelta('1 days 02:00:00')pd.to_timedelta(['1 day', '1 day 2 hours'])TimedeltaIndex(['1 days 00:00:00', '1 da..
2021-03-20 18:18:14
169
2
原创 pandas-时间戳索引
第四课 Pandas时序型数据分析第二节 时间戳索引import pandas as pddate_rangepd.date_range(start='2019-01-01', end='2019-02-01')DatetimeIndex(['2019-01-01', '2019-01-02', '2019-01-03', '2019-01-04', '2019-01-05', '2019-01-06', '2019-01-07', '2019-01-08', ..
2021-03-20 17:45:34
605
原创 pandas-时序性数据创建和表示
第四课 Pandas时序型数据分析第一节 时序型数据的创建和表示import pandas as pd通过日期型数据列表创建from datetime import datetimedate_list1 = [datetime(2019, 1, 1), datetime(2019, 1, 2), datetime(2019, 1, 3)]pd.Series(date_list1)0 2019-01-011 2019-01-022 2019-01-03dtype: da...
2021-03-20 17:22:51
139
原创 pandas-类别型数据向量化
#!/usr/bin/env python# coding: utf-8# # 第三课 Pandas类别型数据分析# ## 第五节 类别型数据的向量化# In[1]:import pandas as pdimport numpy as np# In[2]:data_df = pd.read_csv('./datasets/2016_happiness.csv', nrows=3)data_df# * 有序类别数据编码# In[3]:#将类别向量化变成有序的data_...
2021-03-20 16:46:35
296
原创 pandas-类别型数据排序及比较
#!/usr/bin/env python# coding: utf-8# # 第三课 Pandas类别型数据分析# ## 第四节 类别型数据排序及比较# In[1]:import pandas as pdimport numpy as np# * 排序# In[2]:data = ['a', 'b', 'c', 'a']# In[3]:# 不设置ordereds = pd.Series(pd.Categorical(data, ordered=False))s# .
2021-03-19 21:56:52
280
原创 pandas-类别型数据操作
#!/usr/bin/env python# coding: utf-8# # 第三课 Pandas类别型数据分析# ## 第三节 类别型数据基本操作# In[1]:import pandas as pd# * 类别型数据属性# In[2]:s = pd.Series(['a', 'b', 'c', 'a'], dtype='category')s# In[3]:s.cat.categories# In[4]:s.cat.ordered# * 重命名类别名称# In.
2021-03-19 21:16:36
315
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人