
MachineLearning
文章平均质量分 54
风度翩翩猪肉王子
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
(六)Tensorflow学习——卷积神经网络
深度学习框架-Tensorflow案例实战视频课程 导入相关包 import numpy as np import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data 加载mn...原创 2019-11-14 16:26:13 · 255 阅读 · 0 评论 -
(五)Tensorflow学习——神经网络模型架构
以mnist数据集为例,建立双隐层神经网络模型。 导入相关包 import numpy as np import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data 加载数据集 print('Download and Extract MNIST dataset') mnist = input_da...原创 2019-11-14 11:35:35 · 269 阅读 · 0 评论 -
(四)Tensorflow学习——逻辑回归Logistic Regression
以mnist数据集为例,学习逻辑回归分类模型。 这是一个十分类模型,利用softmax进行多分类。 导入相关包 import numpy as np import tensorflow as tf # tensorflow数据集 from tensorflow.examples.tutorials.mnist import input_data 导入mnist数据 print('Downloa...原创 2019-11-14 11:30:09 · 461 阅读 · 0 评论 -
(三)Tensorflow学习——mnist数据集简介
导入相关包 import numpy as np import tensorflow as tf import matplotlib.pyplot as plt # tensorflow自带的一些数据集 from tensorflow.examples.tutorials.mnist import input_data 加载数据集 在该目录下,建立一个空文件夹data,加载mnist数据集时,...原创 2019-11-14 11:22:39 · 280 阅读 · 0 评论 -
(二)Tensorflow学习——构造线性回归模型
实验在jupyter notebook上运行。 一、导入相关包 import tensorflow as tf import numpy as np import matplotlib.pyplot as plt %matplotlib inline # 保证图像直接在notebook上显示,不用显示调用plt.show() 二、随机生成x,y数据 num_points = 1000 vect...原创 2019-11-13 20:53:40 · 340 阅读 · 0 评论 -
(一)Tensorflow学习——基本操作:创建变量
在tensorflow中使用float32数据格式。 import tensorflow as tf # 行向量 w = tf.Variable([[0.5, 1.0]]) # 列向量 x = tf.Variable([[2.0], [1.0]]) # 矩阵乘法 y = tf.matmul(w, x) print(y) 创建变量后,需要进行全局初始化。 如果直接打印y,是没有值的,需...原创 2019-11-13 20:15:17 · 809 阅读 · 0 评论 -
(三)利用Wikipedia中文语料训练词向量word2vec——word2vec模型测试
通过前两篇文章,我们得到了word2vec模型: (一)利用Wikipedia中文语料训练词向量word2vec——获取Wikipedia简体中文语料库 (二)利用Wikipedia中文语料训练词向量word2vec——分词、训练word2vec 下面,我们利用word2vec模型进行简单的使用和测试。 # 导入包 from gensim.models import Word2Vec # 加载模...原创 2019-11-12 19:55:42 · 1095 阅读 · 2 评论 -
(二)利用Wikipedia中文语料训练词向量word2vec——分词、训练word2vec
在前一节,我们学习到了如何下载Wiki中文语料库,并且学会了如何将繁体转换为简体。在这一节中,我们将学习如何训练word2vec,包括分词以及训练两个步骤。所有的处理过程都是在jupyter notebook中进行的。 文章目录第一步 jieba分词第二步 gensim训练word2vec 第一步 jieba分词 import pandas as pd import codecs import j...原创 2019-11-12 19:50:51 · 930 阅读 · 0 评论 -
(一)利用Wikipedia中文语料训练词向量word2vec——获取Wikipedia简体中文语料库
利用Wikipedia中文语料训练词向量一共分为两个篇章,这篇文章属于第一部分,包括下载Wikipedia语料库,并将其从繁体转换为简体。 目录第一步 下载语料库第二步 将下载好的bz2文件转换为txt(text)文件第三步 繁体转换为简体 第一步 下载语料库 Wikipedia中文语料库链接: https://dumps.wikimedia.org/zhwiki/ 打开网址后,就会看到如下的...原创 2019-11-08 17:27:29 · 1475 阅读 · 0 评论 -
04-06 逻辑回归【100-Days-Of-ML-Code】
查看转载请点击此处转载 2019-03-31 10:47:13 · 377 阅读 · 0 评论 -
03-多元线性回归【100-Days-Of-ML-Code】
查看转载请点击此处 虚拟变量:当该特征是标称型的,那么就可以构造数值型虚拟变量,取值可以对类别进行区分。 虚拟变量陷阱:如果该特征是标称型,且有m个取值,那么我们只需要构建m-1个虚拟变量即可,因为最后一个虚拟变量可以通过前m-1个虚拟变量预测推断出来。 第1步: 数据预处理 导入库 import pandas as pd import numpy as np 导入数据集 dataset = ...转载 2019-03-31 10:31:35 · 245 阅读 · 0 评论 -
02-简单线性回归模型【100-Days-Of-ML-Code】
学习地址,请点击此处 第一步:数据预处理 import pandas as pd import numpy as np import matplotlib.pyplot as plt dataset = pd.read_csv('studentscores.csv') X = dataset.iloc[ : , : 1 ].values Y = dataset.iloc[ : , 1 ]....转载 2019-03-30 19:55:59 · 162 阅读 · 0 评论 -
01-数据预处理【100-Days-Of-ML-Code】
学习地址,请点击此处 第1步:导入需要的库 Numpy:包含数学计算函数 Pandas:用于导入和管理数据集 import numpy as np import pandas as pd 第2步:导入数据集 数据集通常是.csv格式文件。CSV文件以文本形式保存表格数据,文件的每一行是一条数据记录。我们使用Pandas的read_csv()方法读取本地CSV文件为一个数据帧(数据框)。然后,从数...原创 2019-03-30 19:41:59 · 354 阅读 · 0 评论 -
信息、熵、信息增益
信息、熵、信息增益是在决策树中用到的概念,在利用特征进行分类时,会考虑特征选取的顺序。 1. 信息 香农: 信息是用来消除随机不确定性的东西。 如果带分类的事物集合可以划分为多个类别中,则某个类xix_ixi的信息定义如下: I(X=xi)=−log2p(xi)I(X=x_i)=-log_2 p (x_i)I(X=xi)=−log2p(xi) I(X)I(X)I(X)表示随机变量的信息...原创 2018-10-02 11:57:05 · 451 阅读 · 0 评论 -
如何用Python和机器学习训练中文文本情感分类模型?
# 数据 我的一个学生,利用爬虫抓取了大众点评网站上的数万条餐厅评论数据。 这些数据在爬取时,包含了丰富的元数据类型。 我从中抽取了评论文本和评星(1-5星),用于本文的演示。 从这些数据里,我们随机筛选评星为1,2,4,5的,各500条评论数据。一共2000条。 为什么只甩下评星数量为3的没有选择? 你先思考10秒钟,然后往下看,核对答案。 答案是这样的: 因为我们只希望对情感做出(正和负)二元...转载 2018-08-21 20:41:23 · 2214 阅读 · 2 评论 -
Python+sklearn完成机器学习任务
任务 祝贺你,成功进入了一家金融公司实习。 第一天上班,你还处在兴奋中。这时主管把你叫过去,给你看了一个文件。 文件内容是这个样子的: 主管说这是公司宝贵的数据资产。嘱咐你认真阅读,并且从数字中找出规律,以便做出明智的贷款决策。 每一行数据,都代表了之前的一次贷款信息。你琢磨了很久,终于弄明白了每一列究竟代表什么意思: grade:贷款级别 sub_grade: 贷款细分...转载 2018-08-21 20:20:48 · 719 阅读 · 0 评论