- 博客(23)
- 资源 (1)
- 收藏
- 关注
转载 斯坦福NLP提出EFT:如何不实际微调而“假装”微调了LLM?
语言模型(LM)的训练经历两个关键阶段:首先,利用大量多样化的文本数据进行预训练;接着,对模型针对特定目标进行微调。尽管业界普遍认为预训练阶段是模型获取核心知识和技能的关键,而微调更偏重于调整和优化这些能力,这一观念却鲜少得到深入探究。为了深入解析这两个阶段各自的贡献,来自斯坦福大学的最近研究提出了一种新的技术——模拟微调(EFT)。该方法让我们能够模拟在不同规模下的预训练和微调结果,从而更清晰地探讨不同训练阶段的影响。实验结果揭示,加强微调的规模能够显著增强模型的帮助性,而扩大预训练规模则能更好地
2023-11-04 12:27:05
262
原创 使用mtool.download_data_as_frame下载数据出现:‘,’ expect after ‘“‘ 或者 line 不能对齐等问题
mtool.download_data_as_frame()下载数据出错解决方案
2023-10-25 19:56:40
373
原创 从零开始构建基于milvus向量数据库的文本搜索引擎
在这篇文章中,我们将手动构建一个语义相似性搜索引擎,该引擎将单个论文作为“查询”输入,并查找Top-K的最类似论文。主要包括以下内容:1.搭建milvus矢量数据库2.使用MILVUS矢量数据库搭建语义相似性搜索引擎3.从Kaggle下载ARXIV数据,使用dask将数据加载到Python中,并构建一个论文搜索引擎...
2022-08-27 13:35:31
2726
转载 python 文件操作 包括txt xml
python 文件操作 包括txt xmlhttps://blog.youkuaiyun.com/qq_36009964/article/details/90903254
2021-03-22 09:01:15
117
转载 VOC2007.annotation文件解读
VOC2007.annotation文件解读分类专栏: DataSet版权<annotation> <folder>VOC2007</folder> <filename>000001.jpg</filename> #文件名 <source> #文件来源(不重要) <databa...
2021-03-04 19:58:33
564
1
原创 深度学习分类常见评价指标:accuracy recall precision specificity sensitivity AUC ROC 曲线
深度学习分类时常用到以下指标,这里做一个总结:首先介绍一些指标的定义:(1)若一个实例是正类,但是被预测成为正类,即为真正类(True Postive TP)(2)若一个实例是负类,但是被预测成为负类,即为真负类(True Negative TN)(3)若一个实例是负类,但是被预测成为正类,即为假正类(False Postive FP)(4)若一个实例是正类,但是被预测成为负类,即为假负类(False Negative FN)这四个部分可以构成一个混淆矩阵: ...
2020-05-22 12:00:49
4317
原创 机器学习技法8-Adboost算法
注:本文转载自:https://blog.youkuaiyun.com/weixin_30641999/article/details/98417986仅作学习交流使用。文章中所有的图片均来自台湾大学林轩田《机器学习技法》课程。笔记原作者:红色石头微信公众号:AI有道上节课主要开始介绍Aggregation Models,目的是将不同的hypothesis得到的gtgt集合起来,利用集体智慧得到...
2020-02-14 16:26:16
377
原创 python 用SimpleITK+pydicom 将4dnii图像转为单张dicom,并重新添加图像头信息
最近在处理一套心脏数据,需要将4dnii图像转换成单张的dicom图像进行试验,看了很多博客,发现SimpleITK是一个处理医学图像的很好用的包,里面支持很多医学图像的读取以及处理,以及对图像头信息的查看及修改。首先,可以用sitk.ReadImage读取4dnii图像,如下:itk_img = sitk.ReadImage('E:/cardic_data/training/patie...
2020-01-15 10:54:37
4989
6
原创 python数组[...,1]的用法
记录一下数组[...,1]所表达的意思例如一个数组:C = np.arange(240).reshape(10,8,3)输出C>>> carray([[[ 0, 1, 2], [ 3, 4, 5], [ 6, 7, 8], [ 9, 10, 11], [ 12, ...
2019-12-16 20:14:30
2426
python 用SimpleITK+pydicom 将4dnii图像转为单张dicom,并重新添加图像头信息
2020-12-08
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人