自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 RAG之微调垂域BGE的经验之谈【总结】

1、数据集格式{"query": "小孩做胃镜有哪几种方法","pos": ["儿童做胃镜常用的方法有如下两种:1、有痛胃镜,不在麻醉状态下做胃镜;2、无痛胃镜,在麻醉状态下做胃镜。国内通用的方法,不建议麻醉。因为小孩子麻醉,有很多副反应,包括麻醉药本身的副作用和麻醉后的复苏,都有副反应。不麻醉,即不使用麻醉药,目前通用的方法是抓麻,即把小孩抓住,做胃镜。这种情况虽然恢复快,但也有不好的地方。因为小孩害怕做该检查。

2024-07-29 01:03:51 1511

原创 大模型中文问答场景下的模型选择

C-MTP综合了标注数据和未标注数据,来自于多种来源,如Wudao语料库、科学文献、XLSUM-Zh、Wiki-Atomic-Edit、AmazonReviews-Zh等,确保了数据的大规模、多样性和质量。架构:BGE-Large-zh模型是基于BERT-like(类BERT)架构,特别是在特殊的[CLS]标记的最后一层隐藏状态被训练来作为文本的嵌入表示。的embedding。采用Distilling step-by-step分步蒸馏可以在较少的训练数据和较小的模型下,训练出性能超越LLM的小模型。

2024-07-26 01:02:07 1325

原创 知识库大模型的召回模型调查

然后,通过优化目标函数来调整模型参数,使得相似句子的余弦相似度提高,而不相似句子的余弦相似度降低。SimCSE的基本思想是对比学习,对比学习的目标是学习编码器f(下面是目标函数),其中前者为相似的正样本,后者为不相似的负样本,score是相似度度量函数。对应到SimCSE中,x和x+是两个相似的句子,x和x-是不相似的句子。对比学习的目标是学习一个编码器,使得相似的正样本(即相似的句子)在编码后的向量空间中更接近,而不相似的负样本(即不相似的句子)在空间中更远离。它的基本原理是对比学习。

2024-07-24 01:36:13 1731

原创 大模型的几个要点

TCN:时序卷积网络(Temporal Convolutional Network,TCN)是一种使用卷积操作来处理序列数据的模型,旨在克服 RNN 的一些缺点。即query与query的相似度,而不是query召回answer的相似度。query计算query与title的相似度,设定一个阈值0.9筛选0.9以上的title,再人工打标label,相似1,不相似0。TCN 通过因果卷积和扩张卷积处理序列数据,能够并行计算,捕捉长时间依赖关系,并缓解梯度消失问题,但参数量较大。

2024-07-23 01:49:17 373 1

原创 大模型应用开发教程阅读

GPT 的 Tokenizer:实际上 GPT 的 Tokenizer 采用了 BPE 算法,即将单个字符的 二进制表示,不断提取重复的字符对,进行压缩,最终用一个较为合理大小的词汇表表示 Token 到数字的映射。Prompt 其实是通过提供一个外部的 Context 帮助大模型更好的预测下一个词, 大模型本身有着海量的互联网数据学习过,它可以利用本身学习过的知识之间的权重\联系,更好完成补全提示词后的输出的任务。2 不限制,是带来幻觉的原因,它的回答取决于训练的数据,学到什么回答什么(待求证)

2024-07-23 01:47:18 1488

原创 Q:vscode导出markdown为pdf且显示数学公式

vscode导出markdown为pdf且显示数学公式

2023-03-23 20:19:38 962

原创 蚁群算法流程图

2022-05-13 22:39:21 2395

原创 关于蚁群算法的概述与应用——思维导图

2022-05-13 18:18:30 289

原创 蚁群算法流程图

2022-05-13 18:06:34 1218

原创 Python——import导入模块

Python导入第三方库或者使用标准库。如使用数学函数,import math ,如余弦函数cos,绝对值函数fabs();import numpy as np,解决矩阵数组问题等。import主要有以下两种用法:import 模块名1 [as 别名1], 模块名2 [as 别名2],…: 使用这种语法格式的 import 语句,会导入指定模块中的所有成员(包括变量、函数、类等)。 使用该模块的成员时,需要用该模块名或者别名加前缀; 如:import mathmath

2022-05-13 18:04:34 2927

基于Python的滚动回测框架,用于对信用债收益率曲线进行建模与预测

内容概要:本文介绍了一个基于Python的滚动回测框架,用于对信用债收益率曲线进行建模与预测。通过Nelson-Siegel(NS)模型提取利率曲线因子,并结合VECM模型和Johansen协整方法预测下一交易日的因子值,进而重构预测收益率曲线。代码实现了自动识别期限列、鲁棒拟合、滚动窗口训练及9:1样本外预测等功能,输出每日预测值、实际值及误差指标(如MSE、逐日平方误差),支持负利率裁剪和结果保存。; 适合人群:具备一定金融工程背景和Python编程能力的数据分析师、量化研究员或固定收益领域研究人员;熟悉时间序列分析与统计建模的硕士及以上学历者亦可适用;

2025-10-24

基于Nelson-Siegel模型与向量自回归(VAR)相结合的方法,用于拟合和预测收益率曲线

内容概要:本文介绍了一种基于Nelson-Siegel模型与向量自回归(VAR)相结合的方法,用于拟合和预测收益率曲线。首先从FRED获取多期限美债收益率数据,利用Nelson-Siegel模型提取每日利率曲线的三个核心因子——水平(Level)、斜率(Slope)和曲率(Curvature);随后采用VAR或VECM模型对这三个时间序列因子进行联合建模,并实现多步向前预测;最后将预测出的因子重新代入Nelson-Siegel公式,重构未来的整条收益率曲线。代码还支持动态选择Nelson-Siegel参数λ的时间变化路径、鲁棒拟合以及中国交易日历处理等功能,适用于信用债和国债等多种收益率数据。; 使用场景及目标:① 构建动态收益率曲线预测系统,辅助债券投资决策;② 研究利率期限结构的变化特征与趋势;③ 实现NS模型与多元时间序列模型(VAR/VECM)的集成应用;④ 学习如何将理论模型转化为可运行的金融数据分析流程;

2025-10-24

【金融数据分析】基于Nelson-Siegel模型的信用债收益率曲线拟合与补全:面向缺失数据的鲁棒优化方法研究

内容概要:本文介绍了一种基于Nelson-Siegel(NS)模型的债券收益率曲线拟合与补全方法,重点实现了对缺失数据的鲁棒性插值。通过加载信用债收益率数据,将零值转换为NaN,并利用NS模型载荷矩阵进行每日横截面拟合。采用约束性优化和“地板”惩罚机制防止负利率出现,同时引入λ参数的网格搜索以优化每日曲线拟合效果。最终通过逐日独立拟合并保留真实成交点的方式,生成完整的信用债收益率曲线面板数据,并输出到Excel文件。; ①用于补全不完整或稀疏的债券市场收益率数据; ②构建动态时变的信用债收益率曲线;

2025-10-24

flare-sm-acl flare-sm-bigdata flare-sm-cikm from hugging face

flare_sm_acl flare_sm_bigdata flare_sm_cikm from hugging face

2025-05-09

zzzbge-reranker-large-tokenizer

zzzbge-reranker-large_tokenizer

2024-07-29

zzzbge-large-zh-v1.5-model

zzzbge-large-zh-v1.5_model

2024-07-24

zzzall-mpnet-base-v2-model

zzzall-mpnet-base-v2_model

2024-07-23

zzzmulti-qa-mpnet-base-dot-v1-model

zzzmulti-qa-mpnet-base-dot-v1_model

2024-07-23

tokenizer-source

tokenizer_source

2024-07-22

github-issues

github_issues

2024-07-22

zzzmulti-qa-MiniLM-L6-cos-v1-model

zzzmulti-qa-MiniLM-L6-cos-v1_model

2024-07-12

zzzcross-encoder-model

zzzcross_encoder_model

2024-07-12

zzzparaphrase-multilingual-MiniLM-L12-v2-model

zzzparaphrase-multilingual-MiniLM-L12-v2_model

2024-07-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除