
深度学习
文章平均质量分 75
Every DAV inci
这个作者很懒,什么都没留下…
展开
-
文本词向量嵌入方法对比
下面对文本表示进行一个归纳,也就是对于一篇文本可以如何用数学语言表示呢?- 词袋模型(bag-of-words):基于one-hot、tf-idf、textrank等的;- 主题模型:LSA(SVD)、pLSA、LDA;- 基于词向量的固定表征:word2vec、fastText、glove- 基于词向量的动态表征:elmo、GPT、bert原创 2023-08-06 17:59:25 · 477 阅读 · 0 评论 -
模型权重和深度学习训练框架之间的关系
那么该团队如果使用TensorFlow框架, 权重文件保存的形式就是TensorFlow的。不过要注意的是,虽然神经网络的权重是可以在不同的框架之间转换的,但。如果是Caffe, 那么权重文件的保存形式就是Caffe的。比如使用Caffe的团队发布了Caffe格式的模型权重文件。不同的团队可能会使用不同的深度学习训练框架, 然后使用其。将Caffe格式的权重文件转化为Pytorch格式的即可。但是其保存的都是神经网络层与层之间的权重, 这是不变的。例如,某些特定的层(比如自定义的层)或某些特定的操作。原创 2023-06-24 16:16:28 · 1505 阅读 · 0 评论 -
torch.cuda模块获取信息
GPU的数量最多是128块, index到127, 不然就溢出了。如果输出True则表示可以使用GPU。输出1就表示只有一块可以用。如果有多块,就写一个循环。原创 2023-06-24 16:14:31 · 1076 阅读 · 0 评论 -
数据相关性和非独立性与模型过拟合的联系
数据不是独立的带来的问题是数据之间会有一个或多个明显的特征关联,而这会更容易被模型捕捉到,从而导致模型更关注该特征,然而遇到可能是相互之间没有该相关性的测试数据时出现预测误差。例如,在图像分类任务中,如果训练数据中某个类别的样本主要是在特定的光照条件下拍摄的,而测试数据中该类别的样本具有不同的光照条件,那么模型可能会过度拟合训练数据中的光照特征。数据不是独立的确实会导致模型更容易捕捉到这些关联特征,从而在训练集上表现很好,但在遇到新的、未见过的数据时泛化能力较差,这可能导致预测误差。原创 2023-03-29 07:18:21 · 1102 阅读 · 0 评论 -
在线学习和离线学习的区别
在线学习和离线学习的区别在于数据的来源以及训练方式。原创 2023-03-22 00:28:55 · 1241 阅读 · 0 评论 -
AutoGluon安装及示例
Autogluon的发明人是李沐(Mu Li)和他在亚利桑那州立大学的研究团队。Autogluon是一种**自动化机器学习工具**, 可以同时支持两种模式:**迁移学习模式**和**自动机器学习模式**。原创 2023-03-19 23:53:15 · 6365 阅读 · 0 评论 -
Anaconda环境安装pytorch
我这次要下载的是pytorch1.10, 由于版本有些老旧, 所以进入previous versions中进行下载。选择wheel下载, 搭配豆瓣或者清华或者阿里镜像网站, 直接下载wheel文件, 速度较快。以pytorch1.10.1为例, 直接复制官网上的命令下载即可。进去之后会发现有conda文件和wheel文件两种下载方式。原创 2023-03-15 00:03:54 · 784 阅读 · 0 评论 -
Could not load dynamic library ‘cudart64_110.dll‘的解决方法
问题本质就是GPU调用问题tensorflow要调用GPU对程序进行训练, 但是并没有找到相应的驱动文件。原创 2022-11-23 11:06:23 · 2748 阅读 · 0 评论 -
分类和回归算法之间的区别
就是通过相关样本进行训练,从而得到样本特征到样本标签之间的映射,再利用该映射来得到。回归算法同样是要训练样本数据,从而得到样本特征到样本标签之间的映射。需要注意的是:logistic回归是一个分类算法。的标签,最终达到将样本划分到不同类别的目的。,接受一系列连续数据,寻找一个最适合数据的。根据样本的特征将样本划分到不同的分类当中。分类算法和回归算法都是监督学习算法。通过事物已有的特征来判断事物的类别。对特定的值进行预测。分类算法和回归算法的。原创 2022-10-23 23:05:27 · 2611 阅读 · 0 评论 -
tensorflow学习笔记
因为均方误差采用的是sigmoid激活函数, 在求偏导进行梯度下降时, 在值域趋近于1时, sigmoid的值不会发生太大的变化, 导致sigmoid的导数无限趋近于0, 参数的梯度不会发生太大的变化, 导致可能出现梯度消失的情况, 使得参数更新非常缓慢。但是我们想要的是唯一确定的结果, 独热编码将每一个值进行0和1的编码, 当要预测误差时, 就进行两个值之间的独热编码的相减, 然后取平均值, 以此来预测误差。则会认为预测3会比预测8的误差小, 因为3和1的距离比8和1的距离近。原创 2022-10-23 22:32:33 · 477 阅读 · 0 评论 -
专利申请文件格式
申请发明专利或者实用新型专利应当提交说明书摘要,一式一份。原创 2022-08-14 21:39:53 · 2947 阅读 · 0 评论