自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 资源 (2)
  • 收藏
  • 关注

原创 强化学习在语言、视觉、多模态大模型精调中的应用

代理(Agent):执行动作的模型或算法。环境(Environment):代理与之交互的外部系统。状态(State):环境的当前情况,代理根据状态做出决策。动作(Action):代理在特定状态下可以采取的行为。奖励(Reward):代理执行动作后,环境反馈给代理的数值,用于评估动作的好坏。策略(Policy):代理在给定状态下选择动作的策略。即各个动作被选择的概率分布或从状态到动作的确定性映射。

2025-03-02 14:02:39 711

原创 提升deepseek构建的RAG系统

针对 DeepSeek 模型的特性进行优化,可以充分发挥其强大的语言理解和生成能力,提高 RAG 系统的性能。请务必查阅 DeepSeek 模型的官方文档,了解其最新的功能和推荐的实践方法。使用 DeepSeek 模型构建 RAG 系统,可以利用其强大的语言理解和生成能力,但同时也需要针对 DeepSeek 模型的特性进行优化。将重排序链和检索器结合起来,实现了基于 DeepSeek 模型的重排序检索。使用 DeepSeek 模型对检索到的文档进行评分,并根据评分重新排序。),以便重排序链有更多的选择。

2025-03-01 13:40:06 50

原创 langchain做论文集RAG提升效果手段

使用数据增强技术,例如回译、同义词替换等,可以增加数据集的多样性,提高 RAG 系统的鲁棒性。作为压缩器,它可以从检索到的文档中提取与查询最相关的部分,从而提高检索的准确性。将压缩器和检索器结合起来,实现了上下文感知的检索。使用新的数据不断训练 RAG 系统,可以提高 RAG 系统的性能。使用 A/B 测试比较不同的 RAG 配置,找到最佳的配置。分析 RAG 系统的错误,找出改进的方向。(块重叠) 参数,找到最佳的分割策略。衡量检索到的文档与用户查询的相关性。衡量 LLM 生成的答案的质量。

2025-03-01 13:12:18 43

原创 LLM配合llamaindex搭建本地知识库

PEFT库通过引入适配器模块和提示调优等技术,实现了高效、低资源消耗的模型微调。其广泛的应用场景和灵活的配置使其成为大型预训练模型在实际任务中的重要工具[1][2][4]。

2025-03-01 00:37:00 819

原创 如何提升 mobile segment anything在自有数据集上表现

动态调整,预热阶段使用较高值,后续逐渐减小。

2025-03-01 00:34:52 56

原创 如何提升grounding dino视觉大模型在自有数据集上表现?

Decoder中加adapter, 冻结编码器,仅微调decoder中adapter和box head,保留跨模态理解,适配下游任务,逐层调整跨模态交互过程,减少资源消耗,防止过拟合,不影响其他类检测性能,初始学习率设为预训练的1/10,混合自有数据和公开数据,混合标注数据和伪标签数据。软标签损失: 让学生模型学习教师模型的“思考方式”,即学习教师模型的输出概率分布。使用领域相关的预训练模型: 可以使用在领域相关的数据集上预训练的模型作为 Grounding DINO 的 backbone。

2025-02-28 21:54:57 130

原创 一创聚宽之新手第一课

实盘手机上即可开通,开通后可以根据指定策略的某一次回测新建实盘交易(同一个策略的不同回测体现为策略的超参数不同)具体监管要求体现如下,简而言之,不能有过高的下单频率,撤单频率,以及下单金额。第一创业证券开户,注册一创聚宽后点击我的策略可以看到一个样板策略如下。以上面的简单策略为例进行回测,结果报表会显示策略的各种评价指标。创建实盘策略的步骤如下,策略会被审核以确保满足监管要求。点击模拟交易,可以根据既有策略和回测创建模拟交易。点击右上角导出,可以导出交易详情等细节信息。

2023-08-26 14:36:11 404

原创 一创聚宽之策略详解(一)

一个完整策略只需要两步:设置初始化函数: initialize,上面的例子中, 只操作一支股票: ‘000001.XSHE’, 平安银行实现一个函数, 来根据历史数据调整仓位.示例如下股票数据:我们拥有所有A股上市公司2005年以来的股票行情数据、市值数据、财务数据、上市公司基本信息、融资融券信息等。为了避免幸存者偏差,我们包括了已经退市的股票数据。商品期货:我们支持从2005年以来上海国际能源交易中心、上期所、郑商所、大商所的行情数据,并包含历史产品的数据。

2023-08-25 22:32:37 890 2

原创 如何编译为库文件?如何编译为可执行文件?

它仍然是一个C++函数,只是链接约定被修改为C风格。第一行命令将 CPP 文件编译为目标文件(.o 文件),并使用 -fPIC 选项指定生成位置无关的代码(Position-Independent Code),这对于生成共享库是必要的。如果你的目标是创建一个动态链接库(.so文件),你需要确保CPP文件中至少包含一个可导出的函数。可以,一个包含实现代码的 CPP 文件和一个声明函数的 H 头文件可以被编译成一个共享库(.so 文件)。要将C++文件中的函数变为可导出的函数,您需要使用适当的修饰符和语法。

2023-08-15 23:18:04 382 1

原创 一创果仁之新手第一课

例如,在筛选条件里,加入“换手率最大全部 10” 是得到当日全市场换手率最大的10只股票,这个使用每日选股,其中的含义便一目了然,如果有疑惑,还可以更换条件为 “换手率最小全部 10” 或者 “换手率最大全部 20”,再看结果。在每一个调仓日,卖出满足卖出条件的股票,把余下的资金等权重买入符合买入条件的新股票。当选股策略既有筛选条件又有排名条件时,筛选条件将首先被使用,从几千只股票里选出一批股票做为候选股票,然后排名条件将被用来对这些候选股票做出排名,排名最靠前的N只股票将被买入(N是最大持仓股票数)。

2023-08-15 22:33:46 722 1

原创 triton操作干货

Triton Inference Server 的自定义后端(backends)通常需要以共享库(SO库)的形式实现,这是因为 Triton 使用插件架构,可以加载和卸载这些库以实现不同的模型后端。作为实现后端的共享库。请求的URL应该是Triton Inference Server的推理端点,例如http://:/v2/infer,其中是服务器IP地址,是Triton的端口号。然而,Triton本身有一个主配置文件,通常是以YAML格式编写的,用于定义Triton推理服务的整体配置,包括多个模型的配置。

2023-08-13 22:40:29 791 1

原创 tensorrt实战要点

tensorrt使用最关键的两个问题

2023-08-11 00:36:32 109 1

原创 RAW格式图片及其与RGB和灰度图的关系

以问答的形式解密关于RAW格式图像的几个关键问题,项目实战中遇到

2023-08-09 08:33:37 1152 1

原创 基于人脸的常见表情识别——模型搭建、训练与测试¶

人脸表情分类模型的训练和测试

2022-11-15 22:36:23 746

原创 基于人脸的常见表情识别实战--数据集制作

生成人脸嘴唇局部数据集,用来识别表情

2022-11-15 21:30:03 1234

使用detectron2框架训练微软最新dyhead动态检测头目标检测模型

微软最新state of art目标检测模型,训练自己数据集,详细步骤,detectron2框架pytorch源码

2022-01-31

detectron2安装及微软最新state of the art目标检测模型DynamicHead训练自己数据全程指南

独家dynamichead训练自有数据教程

2022-01-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除