
machine learning
文章平均质量分 56
52Pig
这个作者很懒,什么都没留下…
展开
-
ChatGPT: Optimizing Language Models for Dialogue
一个这样的模型是ChatGPT,这是一个基于transformer的语言模型优化的对话。总之,ChatGPT模型是一个强大的语言模型,专门为对话而设计。在一个应用中,使用ChatGPT模型开发的聊天机器人达到了67%的准确率,这远远高于传统方法所能达到的准确率。除了能够生成真实和吸引人的对话外,ChatGPT还可以接受训练,以识别对话中的重要关键词和主题,从而轻松理解用户输入。ChatGPT是一种聊天机器人,其语言模型基于OpenAI的GPT-3模型,但专门设计为能够提供更自然、更吸引人的对话。翻译 2023-02-08 21:31:27 · 1925 阅读 · 0 评论 -
BERT原理
预训练模型架构中的不同。BERT使用双向Transformer。OpenAI GPT使用left-to-right的Transformer。ELMo使用训练好的left-to-right和right-to-left的LSTM的拼接为下游任务形成特征。在这3方面中,只有BERT表示在所有层中同时受坐上下文和右上下文约束。层数L,隐藏层大小H,自注意力头(self-attentio...原创 2019-11-07 20:25:47 · 643 阅读 · 0 评论 -
winpython升级tensorflow遇到的小问题
pip install tensorflowFatal error in launcher: Unable to create process using '"此时需要强制升级pip,使用下列命令即可:python -m pip install --upgrade --force-reinstall tensorflow当安装好winpython后 自带版本0.5.0很老。再次原创 2017-08-21 23:37:42 · 1419 阅读 · 0 评论 -
mllib之高数篇
机器学习的目标是:对于给定的一个训练数据集,通过不断地分析和学习产生一个联系属性集合和类标的分类函数(Classification Function)或预测函数(Prediction Function),这个函数称为分类模型(Classification Model)或预测模型(Prediction Model).通过这个模型可以对输入对象的特征向量预测或对对象的类标进行分类。超定方程原创 2015-03-24 21:40:01 · 1007 阅读 · 0 评论 -
mllib之梯度下降公式推导
梯度下降(GD)是最小化风险函数、损失函数的一种常用方法,随机梯度下降和批量梯度下降是两种迭代求解思路,下面从公式和实现的角度对两者进行分析,如有哪个方面写的不对,希望网友纠正。下面的h(x)是要拟合的函数,J(theta)损失函数,theta是参数,要迭代求解的值,theta求解出来了那最终要拟合的函数h(theta)就出来了。其中m是训练集的记录条数,j是参数的个数。原创 2015-03-25 00:15:14 · 2238 阅读 · 0 评论 -
spark WARNTaskSchedulerImpl:Initial job has not accepted any resources; check your cluster UI to
spark在提交任务时,出现如下错误:从警告信息上看,初始化job时没有获取到任何资源;提示检查集群,确保workers可以被注册并有足够的内存资源。如上问题产生的原因是多方面的,可能原因如下:1.因为提交任务的节点不能和spark工作节点交互,因为提交完任务后提交任务节点上会起一个进程,展示任务进度,大多端口为4044,工作节点需要反馈进度给该该端口,所以如果原创 2015-03-26 22:26:03 · 28575 阅读 · 3 评论 -
mllib:java.lang.IllegalArgumentException: GiniAggregator given label 2.0 but requires label < numCla
报错信息 : java.lang.IllegalArgumentException: GiniAggregator given label 2.0 but requires label 在用mllib做分类,当用到一些分类算法时,常常需要加入基尼系数。程序代码:RandomForest.trainClassifier(validData,2,Map[In原创 2015-04-09 21:16:31 · 3996 阅读 · 0 评论 -
mllib:Exception in thread "main" org.apache.spark.SparkException: Input validation failed.
当我们使用mllib做分类,用到逻辑回归或线性支持向量机做分类时,可能会出现下面的错误:15/04/09 21:27:25 ERROR DataValidators: Classification labels should be 0 or 1. Found 3000000 invalid labelsException in thread "main" org.apache.spark.S原创 2015-04-09 22:31:30 · 3599 阅读 · 1 评论 -
mllib之随机森林与梯度提升树
随机森林和GBTs都是集成学习算法,它们通过集成多棵决策树来实现强分类器。集成学习方法就是基于其他的机器学习算法,并把它们有效的组合起来的一种机器学习算法。组合产生的算法相比其中任何一种算法模型更强大、准确。随机森林和梯度提升树(GBTs)。两者之间主要差别在于每棵树训练的顺序。随机森林通过对数据随机采样来单独训练每一棵树。这种随机性也使得模型相对于单决策树更健壮,原创 2015-04-13 21:53:22 · 2416 阅读 · 1 评论