- 博客(36)
- 收藏
- 关注
原创 单机部署kubernetes环境下Overleaf-基于MicroK8s的Overleaf应用部署指南
在本文中,我们将探讨如何使用MicroK8s在本地或云环境中快速部署Overleaf应用。MicroK8s是一个轻量级的Kubernetes发行版,它为开发者提供了一个简单的方式来部署和管理容器化应用。需要使用Kompose转换Overleaf官方Docker Compose配置得到适用于kubernetes的部署格式。
2024-11-22 01:19:12
642
1
原创 强化学习:通过Self-Play来扩增多轮次Text-to-SQL数据集 Augmenting Multi-Turn Text-to-SQL Datasets with Self-Play
• Self-Play有助于文本到SQL模型学习各种会话主题关系并改善跨领域的泛化能力。• Self-Play提高了多数SQL类型的性能。模型在中等难度的查询上表现尤其出色。• Self-Play提高了束搜索的性能。我们探索了在跨领域会话语义解析任务中使用Self-Play作为生成合成对话的数据增强方法,以应对数据稀缺和跨领域泛化的挑战。
2024-01-11 19:27:48
1344
1
原创 Transformer 源码中文解读 《The Annotated Transformer》 notebook 中文翻译版
这篇文章不仅对原版论文进行了重新排序和删减,还在全文中添加了大量的注释,帮助您更好地理解Transformer的核心思想和实现细节。jupytext==1.13: Jupyter 笔记本扩展,支持将 Jupyter 笔记本转换为其他格式。torchdata==0.3.0: PyTorch 数据加载和预处理库。torch==1.11.0+cu113: PyTorch 深度学习库。torchtext==0.12: PyTorch 文本处理库。pandas==1.3.5: 数据处理和分析库。获得相关的代码资源。
2023-12-27 16:56:41
1267
原创 大模型在Text-to-sql领域的应用和论文
阿里团队名为DAIL-SQL的新的综合解决方案。使用开源LLM对比OpenAI LLM。文档比较了几种prompt engineering方法,探索高效的提示工程。提出了一种新的Text - to - SQL提示工程方法,命名为DAIL - SQL,该方法以86.6 %的执行准确率刷新了Spider排行榜中的最佳性能。
2023-11-19 22:07:43
2646
原创 简述大模型微调方案:Prefix-Tuning Prompt-Tuning P-Tuning Lora QLora IA3 PEFT
2021年斯坦福的研究人员在论文《》中提出了 Prefix Tuning 方法。与Full-finetuning 更新所有参数的方式不同,该方法是在输入 token 之前构造一段任务相关的 virtual tokens 作为 Prefix,然后训练的时候只更新 Prefix 部分的参数,而 Transformer 中的其他部分参数固定。该方法其实和构造 Prompt 类似,只是 Prompt 是人为构造的“显式”的提示,并且无法更新参数,而Prefix 则是可以学习的“隐式”的提示。
2023-10-29 22:14:34
1111
原创 机器学习初学-多种集成学习算法
根据分类器的训练方式和组合预测的方法,集成学习模型中有可以降低方差的Bagging、有降低偏差的Boosting,以及各种模型结果的集成,如Stacking、Blending、Voting和Averaging…
2023-09-25 15:27:36
426
原创 使用GridSearchCV网格搜索超参调优
此处选择了准确率作为各个参数组合的评估指标,并且应用10折验证以提高准确率。程序开始运行之后,10个“后台工作者”开始分批同步对54种参数(3*3*3*2=54)组合中的每一组参数,用10折验证的方式对训练集进行训练(因为是10折验证,所以共需训练540次)并比较,试图找到最佳参数。将数据集分成十份,轮流将其中9份作为训练数据,1份作为测试数据,进行试验。每次试验都会得出相应的正确率(或差错率)10折验证是一种常用的交叉验证方法,可以更全面地评估模型性能、减少过拟合风险、评估模型稳定性以及进行参数调优。
2023-09-24 18:36:50
427
原创 机器学习初学-RNN+CNN处理时序问题
仔细观察上面输出的这几行数据,在大多数恒星拥有行星的概率值小于0.1的情况下,其中一些行所显示的约0.2的概率值显著大于其他结果,这个“相对较大”的概率值可能就为我们指向一个有行星的星球。输出显示张量形状为(5 087,3 197,1),符合时序数据结构的规则:5 087个样本,3 197个时戳,1维的特征(光线的强度)。- 参数较少:相比于 LSTM(Long Short-Term Memory)层,GRU 层的参数较少,计算效率也较高,因此在一些轻量级模型和资源受限的场景下更具优势。
2023-09-23 18:14:51
1078
原创 机器学习初学-简易循环神经网络SimpleRNN和LSTM鉴定商品评价文本
而且,每一个维度上的值不再是二维的0,1值,而是一个有意义的数字(如59、68、0.73等),这样的值包含的信息量大。同时,在词嵌入的各个维度的组合过程中还会包含词和词之间的语义关系信息(也可以视为特征向量空间的关系)。学习过程中,一开始产生的都是随机的词向量,然后通过对这些词向量进行学习,词嵌入张量被不断地完善。然而,损失函数可能会受到那些样本数量较少的类别的影响,而产生较高的损失值。损失越小,模型对真实类别的预测就越准确。因为这个训练集的标签,是1,2,3,4,5这样的整数,而不是one-hot编码。
2023-09-21 21:55:42
319
原创 机器学习初学-卷积神经网络识别StanfordDogsDataset狗狗图像
通过观察这些特征通道的中间激活图就能发现,卷积网络中的各个通道并不是漫无目地进行特征提取,而是各负其责,忽略不相关的噪声信息,专门聚焦于自己所负责的那部分特征,激活各个特征点。这些特征点(也就是小模式)进行组合,就实现了高效率的图像识别。
2023-09-20 21:28:26
937
原创 如何选择StandardScaler、MinMaxScaler和RobustScaler做标准化的对比解释和示例代码
选择合适的标准化方法取决于数据的特点和需求。如果数据分布接近正态分布且无异常值,可以使用。如果需要将数据映射到特定范围内并保持相对关系,可以使用。如果数据中存在异常值或离群点,可以使用进行鲁棒标准化。在分类、聚类算法中,需要使用距离来度量相似性的时候、或者使用PCA技术进行降维的时候,StandardScaler表现更好(避免不同量纲对方差、协方差计算的影响);在不涉及距离度量、协方差、数据不符合正态分布、异常值较少的时候,可使用MinMaxScaler。
2023-09-18 20:15:44
3000
原创 机器学习初学-Keras从单隐层神经网络到深度神经网络预测客户流失率
零基础学机器学习实践机器学习模型评估:我们谈论了评估机器学习模型性能的重要性,并提到了准确率、精确率、召回率、F1 值等常用的性能指标。我们强调了在评估模型时,需要综合考虑数据集的类别平衡、验证集的使用以及与实际业务场景的结合等因素。绘制损失函数和准确率曲线:我们展示了如何使用 matplotlib 库绘制训练过程中的损失函数和准确率曲线,并通过设置横坐标范围实现集中于后部分的效果。数据科学代码实践:我们提到了使用 history.history 获取训练过程中的指标数据,并对其进行可视化展示的方法
2023-09-14 22:02:07
339
原创 均方损失函数为什么需要平方
均方损失函数,并不是唯一可用的损失函数。为什么这里要选用它呢?如果目的仅是计算损失,把误差的绝对值加起来取平均值就足够了(即平均绝对误差函数)。但是之所以还要平方,是为了让L(w,b)形成相对于w和b而言的凸函数,从而实现梯度下降。凸函数的图像会流畅、连续地形成相对于y轴的全局最低点,也就是说存在着全局最小损失点。当权重为100, 偏置为1时, 损失为: 1613.9121019596591。当权重为5, 偏置为3时, 损失为: 0.00634428903806015。
2023-09-05 21:00:19
242
原创 sklearn.preprocessing使用MinMaxScale进行数据归一化
是 Scikit-learn(一个流行的机器学习库)中的数据预处理模块,它提供了对数据进行标准化、归一化、缩放等常见操作的功能。其中,在进行数据归一化时,可以使用。
2023-09-05 20:53:04
993
原创 机器学习初学-Seaborn绘制好看的热力图
导入数据可视化所需要的库import matplotlib.pyplot as plt #Matplotlib为Python画图工具库import seaborn as sns #Seaborn为统计学数据可视化工具库#对所有的标签和特征两两显示其相关性的热力图plt.show() #plt代表英文plot, 就是画图的意思。
2023-09-03 15:35:11
961
原创 机器学习初学-使用Keras波士顿房价boston_housing数据集使用sklearn Linear Regression线性回归算法建模
加载波士顿房价数据集,创建一个线性回归模型,并使用训练集对模型进行拟合。对测试集进行预测,绘制真实值和预测值的折线图。计算模型的决定系数和r2均方误差。
2023-08-30 21:28:27
1533
1
原创 解决node报错解opensslErrorStack: [ ‘error:03000086:digital envelope routines::initialization error‘]
出现这个错误原因是因为node更新到18后出现这个node高版本加入了的更严格的限制。具体错误原因:ERR_OSSL_EVP_UNSUPPORTED 错误SSL 数字信封不支持。网上找了一些解决方案但是最实用好使的方法是直接在项目的package.json文件下更改加上这行代码。在运行老的react项目时报错。
2023-08-23 21:13:29
873
2
原创 React Native+第三方库(react-native-splash-screen)实现APP启动页
更完整的使用react-native-splash-screen实现android启动图的正确配置文档
2023-07-18 01:58:49
761
1
原创 strapi?populate=*创建的relation查不到解决
get查teacher找不到对应的creater的relation关联内容。public里要给两个表的find权限都打开才可↓。首先给teachers表加上和user表的关系。网上没找到相关解决方案官方文档也没说明。问题困扰挺久,按照官方文档。并没有查到我要的关系。
2023-06-03 12:28:59
278
原创 居然可以这么写-2021年哈理工新生赛KIKI看球赛
kiki看了一场非常激烈的球赛,他在比赛过程中分几次记录了当前两队的分数。意犹未尽的kiki取出了自己记录的比分,想根据自己记录的不同时刻的比分推断一下最多有多少次两队比分是持平的(包括0:0)。kiki希望你能帮助他计算这个结果。第一行一个整数n(1
2022-10-19 21:48:12
216
原创 fpow!快速幂是怎么简化处理过程的
当然,为了解决多次乘法(n次幂),我们只需要关注第三条,每一次乘以底数的同时对结果取模。几个例题实操,用位运算简化快速幂,快速幂原理和例题
2022-10-18 11:50:15
395
原创 Jay的小迷弟-字符串&溢出处理取模例题
现在,只要他能得到最多的”Jay”的碎片数量,他就能获得Jay演唱会的门票了。但兴奋的他现在正在打包行李,无暇考虑如何得到最多的”Jay”的碎片数量,请聪明的你告诉他该怎么做。4.未被使用过的且连续的“Jay”字符串如果用于魔法,那么该连续的“Jay”字符将不能用于得到一个“Jay”的碎片。有一天,他意外地发现他买的《周杰伦的床边故事》上出现了一行神秘的字符串,并且这本书给了他一个神奇的魔法。如果原字符串中有’J’,’a’,’y’这三个字符,那么LakerV可以用它们得到一个“Jay”的碎片。
2022-10-18 00:29:53
321
1
原创 关于定义数组不能乱用变量的小tips
1.定义数组时已经涉及到在内存的分配,编译器如果在给数组分配空间时发现数组的大小竟然没有直接给出,而是一个变量,如果这个变量又刚好没有初始化,系统随便分配了一个值,数组大小也是不确定的了。注意:上面这种定义方式是错误的,因为在定义数组时,必须明确确定数组的大小,如int a[5],数组大小一定要是一个常量,这样编译器才能给数据分配出确定且准确的空间。2.如果是出于想要根据需求动态分配数组大小的话,采用指针+malloc的方法,在堆中动态分配出一个数组,用指针去访问这个数组,是一种更为灵活的方式。
2022-10-18 00:20:15
1049
原创 关于用c++ sort(a+1,a+n); 排序(懒得写for的话)
STL: (Standard Template Library) 标准模板库>包含一些常用的算法如排序查找,还有常用的数据结构如可变长数组、链表 、字典等。>使用方便,效率较高>要使用其中的算法,需要#include
2022-09-27 22:00:08
1032
原创 strcmp()函数:将指定的两个字符串进行比较。
特别注意:strcmp(const char *s1,const char * s2)这里面只能比较字符串,即可用于比较两个字符串常量,或比较数组和字符串常量,不能比较数字等其他形式的参数。直到出现不同的字符或遇'\0'为止。比如判断输入的双十一:11 11。输入11 11不通过。
2022-09-25 09:34:44
1622
原创 int、long、long long/unsigned整数取值和不同位编译器的字节数
运算需要低于十个数的时候用int低于二十用long/longlong。unsigned(无符号)则正数范围*2。
2022-09-22 10:40:54
3063
原创 条件运算符举例
(3)条件表达式中3个表达式的类型可以不同,其中表达式2和表达式3中类型较高的一个决定条件表达式的类型;(1)条件运算符的优先级高于赋值运算符,而低于其他所有的运算符;如:flag=a>0?如:max=a>b?如:min=a>b?(2)条件运算符是左结合的;
2022-09-21 23:19:32
1101
原创 简单的循环&判断switch do while for if if else while 以及涉及getchar putchar的解释
当程序调用 getchar 时,程序就等着用户按键。用户输入的字符被存放在键盘缓冲区中,直到用户按回车为止(回车字符 \n 也放在缓冲区中),当用户键入回车之后,getchar() 函数才开始从输入缓冲区中每次读取一个字符,getchar 函数的返回值是用户输入的字符的 ASCII 码,若遇到文件结尾 (End-Of-File) 则返回 -1 (EOF),并将用户输入的字符回显到屏幕,如果用户在按回车之前输入了不止一个字符,其他字符会保留在键盘缓存区中,等待后续 getchar 调用读取。
2022-09-21 23:09:34
155
原创 几种基本门电路有关符号&内容&汇总
学习汇总表格基本逻辑门符号表达规则与ANDF=A·B有0就出0或ORF=A+B有1就出1与非NANDF=反的与或非NORF=反的或异或XORF=A⊕B=B+A相异出1同或XNORF=A⊙B=AB+相同出1B%7DB%7D。
2022-09-13 14:02:00
12011
原创 C/C++ printf/cout格式化输出相关合集
当需要输出浮点数时保留小数点后面几位数,以十六进制输出整数,输出整数时按几个数字的宽度输出,宽度不足时左边(默认)/右边补“0”,等等。C语言中的 printf() 函数使用以%);C++中的 cout 对象则使用格式控制符(流操作算子)或者成员函数进行控制。使用格式控制符(.c)CC++流操纵算子可以用来干什么?使用流操作算子关于SETW
2022-09-09 11:17:17
2012
1
原创 存储单元,字,MAR,存储字长,存储字,存储容量
存储容量是指存储器可以容纳的二进制信息量,用存储器中存储地址寄存器MAR的编址数与存储字位数的乘积表示。(存储容量=地址寄存器MAR的编址数*存储字位数(存储字长,也是存储单元的大小))—-计算出来的是所能存储的二进制代码的总位数(不是字节)存储字长:一个存储单元存储一串二进制代码(存储字),这串二进制代码的位数称为存储字长,存储字长可以是8位、16位、32位等。地址线一次确定一个存储单元,地址线上值可能取的所有组合确定了存储单元的个数。
2022-09-08 16:55:50
8396
3
TabularSemanticParsing论文: 使用BERT模型将自然语言问题转换为SQL
2023-09-03
Expo Go for Android最新版安装包0积分下载
2023-07-10
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人