
机器学习
grt要一直一直努力呀
好好工作 好好生活 好好爱人
展开
-
机器学习笔记
机器学习算法的分类为 监督学习和无监督学习。监督学习是指会教给计算机如何完成任务,无监督学习是指让计算机自己去学习。 回归问题:预测连续的输出值。分类问题:预测离散的输出值。 在无监督学习中,数据都具有相同的标签或者没有标签。选用聚类算法。 对于线性回归问题,最常用的误差函数就是均方误差损失函数。 ...原创 2021-06-05 10:56:41 · 184 阅读 · 0 评论 -
自然语言处理 问答系统
自然语言处理包括自然语言理解(NLU)和自然语言生成(NLG)。自然语言理解是将文本语言转化成计算机可以表示并理解的信息。自然语言生成是将计算机的语言理解成人类所熟悉的自然语言。问答系统的发展历程可以分为三个阶段a)基于符号规则的第一代:系统基于规则产生回复,不涉及学习b)基于数据统计的第二代:问答为开放领域,产生了浅层学习c)基于深度学习的第三代:用更深层的学习来获取更深层次的语义特征非任务型问答系统的分类类别优点缺点基于检索式通俗易懂、易于理解依赖事先定义的.原创 2021-03-27 21:05:30 · 1051 阅读 · 0 评论 -
毕业设计练习_01——用keras实现鸢尾花分类
鸢尾花数据集介绍3种鸢尾花类别,每个类别有50个样本,每个样本中包括4种鸢尾花的属性特征和鸢尾花的品种(sepal length, sepal width, petal length, petal width, species )花萼长度,花萼宽度,花瓣长度,花瓣宽度,品种Species0——山鸢花setosa1——变色鸢尾 versicolour2——维吉尼亚鸢尾 virginica用keras构建神经网络八股import相关模块import numpy as npimport tens原创 2020-12-14 17:31:42 · 1139 阅读 · 0 评论 -
毕业设计练习_02——手写数字识别
mnist手写数字集介绍mnist手写数字集,包括60000条训练数据和10000条测试数据,每张是28乘28像素的灰度图像,存储在一个28乘28的二维数组中用keras搭建框架1)、import相关模块import tensorflow as tfimport matplotlib.pyplot as pltfrom tensorflow import kerasimport numpy as np2)、加载数据集使用keras自带的数据集mnist = tf.keras.datas原创 2020-12-14 20:00:41 · 1534 阅读 · 0 评论 -
毕业设计练习_03——用VGG13实现cifar10识别
ciffar10数据集的介绍keras内置的数据集,提供了5万张32乘32像素点的十分类彩色图片和标签,用于训练,提供了1万张32乘32像素点的十分类彩色图片和标签,用于测试十分类 :飞机 汽车 鸟 猫 鹿 狗 青蛙 马 船 卡车本例相比于手写数字识别来说更加复杂,因为要处理的是彩色图片,而且所搭建的模型层数更多。import matplotlib.pyplot as pltimport tensorflow as tfcifar10=tf.keras.datasets.cifar10(x_原创 2020-12-17 16:01:24 · 1213 阅读 · 0 评论 -
深度学习keras笔记
基本概念1、tensorflow是keras的后端2、tensor是张量,是向量和矩阵的推广。张量的阶数或维度称为轴(axis)import numpy as npa = np.array([[1,2],[3,4]])sum1 = np.sum(a,axis=0) # axis=0代表按行计算sum2 = np.sum(a,axis=1) # axis=1代表按列计算print(sum1)print(sum2)output:[4 6][3 7]3、在tensorflow中表示1原创 2020-12-17 20:39:54 · 416 阅读 · 0 评论 -
中文自然语言处理——jieba中文分词器
jieba分词器1.引入jieba库和语料import jiebacontent = '深度学习是机器学习的一个子集,传统机器学习中,人们需要对专业问题理解非常透彻,才能手工设计特征,然后把特征交给某个机器学习算法'1)、精准分词:把句子最精确的分开sens_1 = jieba.cut(content,cut_all=False)print('/'.join(sens_1))可以看到分词结果深度/学习/是/机器/学习/的/一个/子集/,/传统/机器/学习/中/,/人们/需要/对/专业/问原创 2021-02-16 17:57:17 · 472 阅读 · 1 评论 -
毕业设计练习_04——用CNN实现验证码识别
本次实践相比于原创 2020-12-18 19:35:01 · 900 阅读 · 0 评论 -
深度学习卷积神经网络笔记
在使用全连接层时,存在着参数量过多,内存占有量过大的问题,限制了神经网络朝着更深的层数发展,以此卷积神经网络得到了发展。原创 2020-12-19 20:44:33 · 372 阅读 · 1 评论 -
深度学习领域常用英文表达
语言模型 language modeling词性标注 part-of-speech tagging命名实体识别 named entity recognition情感分析 sentiment analysis深度神经网络 deep neural network(DNN)循环神经网络 recurrent neural network(RNN)双向长短时记忆网络 bidirectional LSTM...原创 2020-12-26 09:06:24 · 2284 阅读 · 0 评论 -
深度学习Python笔记
TensorFlow中的数据类型一、数值类型1、标量(scalar)单个的实数,dimension为0,shape为[ ]2、向量(vector)n的实数的有序集合,eg:[1,2,3,4] dimension为1.shape为[n]3、矩阵(matrix)m行n列实数的有序集合eg:[[1,2],[3,4]]dimension为2,shape为[m,n]4、张量(tensor)维度数>2的向量成为张量,张量的维度也称为轴(axis)用TensorFlow创建张量import numpy原创 2020-12-19 21:34:20 · 615 阅读 · 1 评论 -
ROC曲线与AUC
ROC(Receiver Operating Characteristic)ROC为受试者工作特征曲线,是一种度量二分类性能的指标。TPR(真正率) ☞所有正例中,分类正确的比例FPR(假正率) ☞所有负例中,分类错误的比例ROC曲线即为以FPR为横轴,TPR为纵轴绘制的曲线。AUC(Area Under Curve)AUC表示绘制一条曲线的曲线下的面积。ROC-AUC曲线表征了一个模型对正负例的区分能力,越接近1表示模型越好,值为0时表示正好判断相反你,将1判为0,将0判为1。值为0.5时表原创 2021-03-01 17:04:07 · 317 阅读 · 0 评论