machine learning
时光爱客
明天是遥远的,我们只能从当下的努力中嗅出它的味道。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
LDA 提取新闻中的主题
先说一下遇到的几个问题: 1.读取.csv文件的时候,有时候会出现编码问题,我们可以用记事本将.csv文件另存为Utf-8编码的文件就行啦,然后直接用utf-8编码方式打开。 例如: df = pd.read_csv(r"*.csv", encoding='utf-8') 2.用jieba分词读取新闻内容的时候有时候会出现'AttributeError: 'float' objec原创 2017-11-09 22:12:57 · 4375 阅读 · 0 评论 -
机器学习实例之PCA(主成分分析)
用sklearn自带的鸢尾花数据集,降到两维 import matplotlib.pyplot as plt from sklearn.decomposition import PCA from sklearn.datasets import load_iris data = load_iris() y = data.target x = data.data #print(x) #print(原创 2017-12-10 21:47:51 · 854 阅读 · 0 评论 -
numpy多维数组的切片操作
import numpy as np item = np.array([[1,4,5],[5,3,6],[8,15,33]]) print(item[0,:]) print(item[1,:]) print(item[2,:]) print(item[:,0]) print(item[:,1]) print(item[:,2]) 输出: [1 4 5] [5 3 6] [ 8原创 2017-12-11 21:00:23 · 1267 阅读 · 0 评论 -
线性回归(linear regression)
假设有线性函数: 可写成: 其中x0 = 0;定义代价函数为: 当然,有时也会写成1/2m,这就是最小二乘法。我们的任务就是选择合适的θ使得代价函数J最小。考虑梯度下降:考虑一个只有一个训练例子的时候,即m=1,则有:对于单个的样本,更新规则为:对于所有的样本,更新规则为:因为它每次更新一个参数θj的时候都需要全部...原创 2018-03-21 22:07:19 · 1065 阅读 · 0 评论
分享