m0_73358879-优快云博客

原创 paper reading 03 Evaluating Expert Contributions in a MoE LLM for Quiz-Based Tasks

对于最后一层MoE，只有3个专家在超过95%的情况下被激活，这为门控网络在选择不同专家时提供了更大的灵活性。就准确率而言，我们观察到与第一层MoE相似的模式：一些专家的准确率显著高于平均水平（例如，专家12），而另一些专家的表现则明显较差（例如，专家34和30）。根据表格中报告的熵值，我们得出结论：每个专家的分布远非稀疏，而是更趋向于均匀。这些发现表明，未来研究的一个潜在方向可能是通过增加高准确率专家的概率和/或减少表现不佳专家的概率来调整门控输出概率。第一层具有最低的熵，而最后一层则拥有最高的熵之一。

2025-03-15 19:20:37 410

原创结构体排序

分数有可能相同，所以不能作为map的键。

2025-03-10 15:48:27 223

原创每日一库系列01 go的logrus库介绍

有时候需要在输出中添加一些字段，可以通过调用和实现。接受一个类型的参数，其底层实际上为"age": 18,})实际上，WithFields返回一个类型的值，它将和设置的保存下来。调用Entry相关方法输出日志时，保存下来的也会随之输出。Hook: 接口，需实现Levels()和Fire()方法。Levels()方法返回感兴趣的日志级别，输出其他日志时不会触发钩子。Fire是日志输出前调用的钩子方法。LevelHooks: 这是一个类型别名，表示一个映射，键是日志级别，值是一个包含多个钩子的切片。

2025-03-06 19:55:29 800

原创论文精读02 Symbol-LLM: Towards Foundational Symbol-centric Interface For Large Language Models

我看了下这个论文和代码仓库。感觉它是给大模型提供通用的训练成符号大模型的接口，具体是通过LoRA 微调的方式实现。可以在hugging face 下载需要的模型和LoRA进行微调。然后这个论文基于LLaMA-2-chat 做了全量微调。然后我看了一下LoRA的原理和实现。相关链接。

2025-02-25 15:43:28 220

原创两天速成sft微调大模型（LoRA）

Q:lora的预训练矩阵是不是下载的原模型的原来的参数矩阵，然后lora在这个基础上再加了一层矩阵?

2025-02-23 21:05:24 1853

原创精读 paper系列01《A Watermark for Large Language Models》

论文主要讲解了如何在不影响输出效果的前提下，为大模型增加额外的水印，以确保其大模型不被随意滥用。核心代码之WayermarkBase参数解析：self:Python类方法的第一个参数总是self，它代表类的实例本身。通过self，可以在类的方法中访问实例的属性和其他方法。◦ vocab 是一个整数列表，默认值为 None。这个列表通常表示模型词汇表中的所有单词或token的ID。在文本生成或自然语言处理任务中，词汇表是必要的，因为它定义了模型可以使用的全部单词。

2025-02-16 11:16:05 1658

原创 llm book阅读day01

数据预处理代码实践。

2025-02-10 00:15:37 500

原创无穷背包板子（滚动数组+一维数组优化）

【代码】无穷背包板子（滚动数组+一维数组优化）

2025-02-06 13:01:50 131

原创背包问题滚动数组优化(+一维数组优化板子)

【代码】背包问题滚动数组优化。

2025-02-05 20:25:00 169

原创背包问题板子

【代码】背包问题板子。

2025-02-02 17:57:00 190

原创大模型推理训练营day05

std::shared_ptr 是一种通过指针保持对象共享所有权的智能指针。：主要用例是在两个或多个实例相互指向的情况下中断循环引用，从而导致引用计数循环，从而阻止正确清理对象。2.最后剩下的持有对象的 shared_ptr 被通过 operator= 或 reset() 赋值为另一指针。）：A 不会增加对象的引用计数。它允许对对象进行安全访问，但不会阻止在最后一个对象重置或超出范围时销毁对象。：要访问由管理的对象，您可以使用该方法将转换为 a。拥有该对象，但引用计数不会与以前的值 3 相比发生变化。

2025-01-31 16:16:53 243

原创大模型推理训练营day04

大模型推理训练营day04

2025-01-31 16:14:04 858

原创大模型推理训练营day03

constexpr：该函数是常量表达式函数，可以在编译时求值。int：该函数返回一个整数类型的值。get(int i)：该函数接受一个整数类型的参数i，用于索引斐波那契数列中的元素。const：该函数不会修改类的成员变量，只是读取数据。因此，get函数能够根据索引i返回numbers[i]，并且能在编译时被计算，从而优化性能。

2025-01-31 16:08:46 364

原创大模型推理训练营day02

return语句会先根据static_的原始值决定返回什么值给调用者，然后才对static_进行自增。这意味着如果static_的原始值是5，那么func(5)将会返回5，但是在下一次访问static_时它的值将是6。的递归调用深度超过了编译器在常量表达式计算时的允许范围，导致编译器无法在编译期计算出结果。也不会被销毁，而是会在下一次调用时继续保持其上次的值。这一点对于理解该函数的行为至关重要，因为它的值会在多个。的值将持续保持上次修改的状态，而不会重新初始化。被外部调用，通常在封装内部实现时使用。

2025-01-11 18:33:41 346

m0_73358879的博客