
机器学习
tedist
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
为什么说随机最速下降法(SGD)是一个很好的方法?
确实在实际实验中我也发现,很多时候在**充分调参**后采用SGD得到的最终效果反而是最好的转载 2020-10-08 14:55:32 · 216 阅读 · 0 评论 -
关系抽取数据集介绍
最近由于实验需要,收集整理了关系抽取方向的数据集,主要包括SemEval、Wiki80、NYT10。目前来说全监督的关系抽取任务一般在SemEval上做,远程监督的关系抽取任务一般在NYT10上做。SemEval数据集来源SemEval数据集来自于2010年的国际语义评测大会中Task 8:” Multi-Way Classification of Semantic Relations Be...原创 2020-03-05 16:55:24 · 14086 阅读 · 5 评论 -
尝试将BERT应用于IMDB情感分类任务
前言之前在学习《Python深度学习》这本书的时候记得在书中有一个 使用GloVe词嵌入的方式进行IMDB数据集的情感分类任务,而最近在网上学习了一个使用BERT进行关系抽取的项目,于是乎考虑尝试用BERT来再次尝试对IMDB数据集的情感分类任务。同样的这次也是采取随机的200个数据集作为训练集,10000个数据集作为测试集。全部代码在github上已经给出。步骤本次实验的大致步骤同书中的例...原创 2020-02-25 12:04:34 · 2663 阅读 · 4 评论 -
SGDClassifier() predict_proba()失败
今天在使用SGDClassifier()的时候发现,其无法使用predict_proba()这个方法,然后查阅Sklearn的中文文档发现如下解决方法:https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.SGDClassifier.html#sklearn.linear_model.SGDClass...原创 2019-09-30 21:02:54 · 2777 阅读 · 0 评论 -
吴恩达机器学习笔记
机器学习笔记1.吴恩达机器学习笔记(一)——线性回归2.吴恩达机器学习笔记(二)——逻辑回归3.吴恩达机器学习笔记(三)——矩阵运算4.吴恩达机器学习笔记(四)——神经网络5.吴恩达机器学习笔记(五)——机器学习拓展6.吴恩达机器学习笔记(六)——支持向量机7.吴恩达机器学习笔记(七)——无监督学习8.吴恩达机器学习笔记(八)——异常检测及推荐系统9.吴恩达机器...原创 2019-08-21 20:45:05 · 2457 阅读 · 0 评论 -
吴恩达机器学习笔记(九)——大规模机器学习
大规模机器学习1 大规模机器学习可行性 由之前机器学补充里的知识可知,有的时候并不是数据越多对算法越好,当方差偏小的时候,说明此时的拟合度会比较大,数据缺乏泛性,这个时候使用更大的数据集可能会对算法有帮助。 这个时候,我们可以绘制学习曲线,根据学习曲线判断是否需要更...原创 2019-08-21 20:25:24 · 2067 阅读 · 0 评论 -
吴恩达机器学习笔记(八)——异常检测及推荐系统
异常检测与推荐系统1 异常检测 例:假想你是一个飞机引擎制造商,当你生产的飞机引擎从生产线上流出时,你需要进行QA(质量控制测试),而作为这个测试的一部分,你测量了飞机引擎的一些特征变量,比如引擎运转时产生的热量,或者引擎的振动等等。 当以前看到这样的问题时,我首先想到的应该是...原创 2019-08-21 20:25:17 · 2097 阅读 · 0 评论 -
吴恩达机器学习笔记(七)——无监督学习
无监督学习1 概述 与监督学习不同,在无监督学习中我们所拥有的数据集是不带有标签的。我们需要做的是将一系列无标签的训练数据代入到算法当中,让算法告诉我们这组数据的一些内在结构特点。2 K-MEANS2.1 主要目的 K-均值是最普及的聚类算法...原创 2019-08-21 20:25:11 · 2131 阅读 · 0 评论 -
吴恩达机器学习笔记(六)——支持向量机
支持向量机1 概述 支持向量机(Support Vector Machine, SVM)是一类按监督学习(supervised learning)方式对数据进行二元分类的广义线性分类器(generalized linear classifier),其决策边界是对学习样本求解的最大边...原创 2019-08-21 20:25:04 · 2328 阅读 · 0 评论 -
吴恩达机器学习笔记(五)——机器学习拓展
机器学习拓展1 主要内容 这一周的学习内容主要是在上面所学习到的机器学习算法基础上,如何选择对算法进一步优化的方向以及如何对算法更合理的进行评估。2 优化算法的几个方向(1).获得更多的训练样本(2).尝试减少特征的数量(3).尝试获得更多的特征(4)....原创 2019-08-21 20:24:57 · 2064 阅读 · 0 评论 -
吴恩达机器学习笔记(四)——神经网络
神经网络学习笔记1 为什么选择神经网络 无论是线性回归还是逻辑回归,当特征太多时计算的负荷会变得很大。例如当我们的训练对象是一组50X50分辨率的图片时,我们将会有2500个特征,当我们进一步将其构成一个两两组合的多项式模型时就会有2500的平方个特征。因此我们需要更适合的模型。2 神经...原创 2019-08-21 20:24:48 · 2515 阅读 · 0 评论 -
吴恩达机器学习笔记(三)——矩阵运算
矩阵运算1 主要内容 在目前所学习到的算法里,当具体实现的时候很多情况下都会用到数学公式转矩阵运算的应用,在这里我以一个2X3维的特征矩阵和一个对应的目标值矩阵,以及一个参数向量来推导一遍,加深对于这方面的理解。2 代价函数矩阵运算转换 首先我们将假设函...原创 2019-08-21 20:24:37 · 2847 阅读 · 0 评论 -
吴恩达机器学习笔记(二)——逻辑回归
逻辑回归学习笔记1 主要内容 由于上周学习了线性回归的内容,因此这次回顾我想从两者之间的不同以及新学习到的通用知识来进行。2 应对问题不同 在所研究的问题上,线性回归要做的是得出拟合度高且具有泛型的回归线,最终能对给定特征值做出预测;逻辑回归要做的是分类,要做...原创 2019-08-21 20:24:25 · 2247 阅读 · 0 评论 -
吴恩达机器学习笔记(一)——线性回归
线性回归学习笔记1.线性回归概述 线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。其在金融、医疗等领域有着广泛的应用。y=ax+b 一元线性回归可以看作是多元线性回归的一个特例,因此只要分析多元线性回归的特性。2.算法...原创 2019-08-21 20:24:18 · 2410 阅读 · 1 评论