数据分析
网球小伙子
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
jupyter lab中pyecharts的.render_notebook()无法显示问题
jupyter lab中pyecharts的.render_notebook()无法显示问题 使用pyecharts自带的config来申明一下使用pyecharts的运行环境 from pyecharts.globals import CurrentConfig, NotebookType CurrentConfig.NOTEBOOK_TYPE = NotebookType.JUPYTER_LAB CurrentConfig.ONLINE_HOST 另起单元格 import numpy as np原创 2020-11-26 09:30:32 · 22736 阅读 · 4 评论 -
matplotlib和seaborn解决中文字体问题
运行以下代码即可 # 解决中文不能显示的问题 plt.rcParams['font.sans-serif'] = ['SimHei'] # 中文字体无法正常显示负号. plt.rcParams['axes.unicode_minus'] = False # seaborn sns.set_style('whitegrid', {'font.sans-serif':['simhei', 'Arial']}) ...原创 2020-11-25 14:29:07 · 1044 阅读 · 0 评论 -
plt的3d图中,画空间直线和平面
3d图 # 方式一 plt.subplot(projection='3d') # 方式二 # get current axes plt.figure(figsize=(14, 10)) axes = plt.gca(projection='3d') 空间直线 方式一 x = np.linspace(0, 10, 20) y = np.linspace(2, 8, 20) z = 2*x + 5*y + 3 plt.plot(x, y, z) 方式二 x,y,z = array([22.5, 50原创 2020-07-31 20:21:11 · 5362 阅读 · 0 评论 -
字典格式变成DataFrame格式
导包 import pandas as pd import numpy as np import string from pandas import DataFrame, Series 生成字典 dic = dict(zip(string.ascii_lowercase,string.digits)) dic """ {'a': '0', 'b': '1', 'c': '2', 'd': '3', 'e': '4', 'f': '5', 'g': '6', 'h': '7', 'i':原创 2020-09-21 11:43:17 · 1204 阅读 · 0 评论 -
机器学习算法原理、优缺点、应用
分类的目标变量是标称型数据,分类解决离散问题; 回归将会对连续型的数据做出预测,回归解决连续问题 一、KNN 分类问题:from sklearn.neighbors import KNeighborsClassifier 回归问题:from sklearn.neighbors import KNeighborsRegressor 原理: K-近邻算法采用测量不同特征值之间的距离方法进行分类(k-Nearest Neighbor,KNN) 优点: 精度高、对异常值不敏感、无数据输入假定。 缺点: 时间复杂度高原创 2020-09-02 11:50:30 · 843 阅读 · 0 评论 -
numpy交换两行数据
import numpy as np n = np.random.randint(1,10,(4,3)) n """ array([[9, 8, 8], [5, 9, 5], [8, 9, 6], [6, 3, 6]]) """ n[[1,2]] = n[[2,1]] n """ array([[9, 8, 8], [8, 9, 6], [5, 9, 5], [6, 3, 6]]) """原创 2020-08-27 21:15:28 · 1928 阅读 · 0 评论 -
PCA中whiten参数
whiten 白化. 每个特征的标准偏差是否一致 默认default,一般改成whiten=True原创 2020-08-03 10:01:32 · 1581 阅读 · 0 评论 -
knn的练习题---小麦种类预测
读取seeds.tsv文件(文件已经上转到本博客下载中心,可免费下载), 最后一列是小麦品种,其他列是小麦特征 导包 import numpy as np import pandas as pd import matplotlib.pyplot as plt 数据获取 seeds = pd.read_csv('./seeds.tsv',sep='\t',header=None) data = seeds.iloc[:,:-1] data = np.array(data) target = seeds.原创 2020-08-01 15:05:14 · 2540 阅读 · 2 评论 -
手写梯度下降法实现逻辑回归
导包 import numpy as np import matplotlib.pyplot as plt from sklearn.datasets import make_blobs 数据 data, target = make_blobs(centers=2) plt.scatter(data[:,0], data[:,1], c=target) 逻辑斯蒂函数 # 目标函数 def aim(X,theta): return np.dot(X,theta.T) # 逻辑斯蒂函数 def原创 2020-07-30 21:50:33 · 673 阅读 · 0 评论 -
手写梯度下降法实现线性回归(带数学公式)
导包 import numpy as np import matplotlib.pyplot as plt 数据 x = np.random.random(100) y = x*2 + 3 + np.random.normal(size=100) X = x.reshape(-1,1) plt.scatter(X,y) X0 = 1 X_C = np.hstack((np.ones(X.shape),X)) X_C.shape 损失函数 def J(b_w,X_C,y): return np.原创 2020-07-27 09:04:12 · 490 阅读 · 0 评论
分享