自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

原创 paper reading 03 Evaluating Expert Contributions in a MoE LLM for Quiz-Based Tasks

对于最后一层MoE,只有3个专家在超过95%的情况下被激活,这为门控网络在选择不同专家时提供了更大的灵活性。就准确率而言,我们观察到与第一层MoE相似的模式:一些专家的准确率显著高于平均水平(例如,专家12),而另一些专家的表现则明显较差(例如,专家34和30)。根据表格中报告的熵值,我们得出结论:每个专家的分布远非稀疏,而是更趋向于均匀。这些发现表明,未来研究的一个潜在方向可能是通过增加高准确率专家的概率和/或减少表现不佳专家的概率来调整门控输出概率。第一层具有最低的熵,而最后一层则拥有最高的熵之一。

2025-03-15 19:20:37 359

原创 结构体排序

分数有可能相同,所以不能作为map的键。

2025-03-10 15:48:27 161

原创 每日一库系列01 go的logrus库介绍

有时候需要在输出中添加一些字段,可以通过调用和实现。接受一个类型的参数,其底层实际上为"age": 18,})实际上,WithFields返回一个类型的值,它将和设置的保存下来。调用Entry相关方法输出日志时,保存下来的也会随之输出。Hook: 接口,需实现Levels()和Fire()方法。Levels()方法返回感兴趣的日志级别,输出其他日志时不会触发钩子。Fire是日志输出前调用的钩子方法。LevelHooks: 这是一个类型别名,表示一个映射,键是日志级别,值是一个包含多个钩子的切片。

2025-03-06 19:55:29 682

原创 论文精读02 Symbol-LLM: Towards Foundational Symbol-centric Interface For Large Language Models

我看了下这个论文和代码仓库。感觉它是给大模型提供通用的训练成符号大模型的接口,具体是通过LoRA 微调的方式实现。可以在hugging face 下载需要的模型和LoRA进行微调。然后这个论文基于LLaMA-2-chat 做了全量微调。然后我看了一下LoRA的原理和实现。相关链接。

2025-02-25 15:43:28 143

原创 两天速成sft微调大模型(LoRA)

Q:lora的预训练矩阵是不是下载的原模型的原来的参数矩阵,然后lora在这个基础上再加了一层矩阵?

2025-02-23 21:05:24 1256

原创 精读 paper系列01《A Watermark for Large Language Models》

论文主要讲解了如何在不影响输出效果的前提下,为大模型增加额外的水印,以确保其大模型不被随意滥用。核心代码之WayermarkBase参数解析:self:Python类方法的第一个参数总是self,它代表类的实例本身。通过self,可以在类的方法中访问实例的属性和其他方法。◦ vocab 是一个整数列表,默认值为 None。这个列表通常表示模型词汇表中的所有单词或token的ID。在文本生成或自然语言处理任务中,词汇表是必要的,因为它定义了模型可以使用的全部单词。

2025-02-16 11:16:05 916

原创 llm book阅读day01

数据预处理代码实践。

2025-02-10 00:15:37 402

原创 无穷背包板子(滚动数组+一维数组优化)

【代码】无穷背包板子(滚动数组+一维数组优化)

2025-02-06 13:01:50 99

原创 背包问题滚动数组优化(+一维数组优化板子)

【代码】背包问题滚动数组优化。

2025-02-05 20:25:00 144

原创 背包问题板子

【代码】背包问题板子。

2025-02-02 17:57:00 166

原创 大模型推理训练营day05

std::shared_ptr 是一种通过指针保持对象共享所有权的智能指针。:主要用例是在两个或多个实例相互指向的情况下中断循环引用,从而导致引用计数循环,从而阻止正确清理对象。2.最后剩下的持有对象的 shared_ptr 被通过 operator= 或 reset() 赋值为另一指针。):A 不会增加对象的引用计数。它允许对对象进行安全访问,但不会阻止在最后一个对象重置或超出范围时销毁对象。:要访问由 管理的对象,您可以使用该方法将 转换为 a。拥有该对象,但引用计数不会与以前的值 3 相比发生变化。

2025-01-31 16:16:53 179

原创 大模型推理训练营day04

大模型推理训练营day04

2025-01-31 16:14:04 787

原创 大模型推理训练营day03

constexpr:该函数是常量表达式函数,可以在编译时求值。int:该函数返回一个整数类型的值。get(int i):该函数接受一个整数类型的参数i,用于索引斐波那契数列中的元素。const:该函数不会修改类的成员变量,只是读取数据。因此,get函数能够根据索引i返回numbers[i],并且能在编译时被计算,从而优化性能。

2025-01-31 16:08:46 307

原创 大模型推理训练营day02

return语句会先根据static_的原始值决定返回什么值给调用者,然后才对static_进行自增。这意味着如果static_的原始值是5,那么func(5)将会返回5,但是在下一次访问static_时它的值将是6。的递归调用深度超过了编译器在常量表达式计算时的允许范围,导致编译器无法在编译期计算出结果。也不会被销毁,而是会在下一次调用时继续保持其上次的值。这一点对于理解该函数的行为至关重要,因为它的值会在多个。的值将持续保持上次修改的状态,而不会重新初始化。被外部调用,通常在封装内部实现时使用。

2025-01-11 18:33:41 299

原创 大模型推理训练营day01

冬季大模型与人工智能系统训练营

2025-01-10 01:06:37 172

原创 go中defer大杂烩

defer是go中一种延迟调用机制,defer后面的函数只有在当前函数执行完毕后才能执行。多个defer出现的时候,它会把defer之后的函数压入一个栈中延迟执行,也就是先进后出。defer后面的函数值在入栈的时候就决定了。defer 最大的功能是 panic 后依然有效,我们可以在defer中进行recover,如果defer中包含recover,则程序将不会再进行panic,实现try catch机制。juejin.cn通过八个demo搞明白Go语言defer的五大特性 | Go 技术论坛。

2024-07-19 23:57:41 920

原创 数据库 关系依赖笔记

第三范式:消除传递依赖,like $ A (主键)\rightarrow B(一般属性) , B \rightarrow Y(一般属性) 则A\rightarrow Y$第二范式:若主键为联合主键,不可以出现单独一个键决定其他属性的情况。

2024-05-22 19:22:07 166 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除