nlp之路-优快云博客

原创 500G！BAAI发布高质量预训练中文语料库CCI3.0-HQ

北京人工智能研究院（BAAI）发布了500GB高质量的中文语料库CCI3.0-HQ，它是中文互联网语料库3.0（CCI3.0）的子集，通过两阶段混合过滤，显著提高了数据质量。为了评估有效性，在各种数据集上从头开始训练了一个0.5B参数模型，使用100B个token，在零样本设置下，在10个基准测试中取得了比CCI3.0、SkyPile和WanjuanV1更优越的性能。（2.2）做训练数据。总体性能：在总体平均值方面，FineWeb-edu以0.350的得分保持了轻微的优势，超过了DCLM的0.348。

2024-10-27 18:51:16 689

原创从Turtor Copilot探讨AI在教育领域的落地

技术的车轮滚滚向前，但用户的需求却相对稳定。不管是初创公司还是大厂，如果在新技术范式吹起来的这股风停下来之前，没能及时找到有希望的落地方向（能满足用户真实需求+有市场机会），风一停，就会跌落进泥土里，消失在空中；而如果落地应用难做起来的话，那些想在淘金热里靠卖铲子赚钱的业务，也不过是短暂的捞快钱，终将随之枯萎。我的草稿箱中一直有一篇关于LLM产品落地的文章，躺了很久，但迟迟成不出稿，因为确实很难写好。一方面如果是简单罗列各种LLM赋能的场景，容易显得杂碎和混乱，且当中很多应用都是锦上添花，非核心；

2024-10-15 13:23:48 957

原创人大&百度提出个性化插件式LLM

在最前面拼接Instruction embedding（前人研究这有助于让模型注意到指令需求，和其他常规任务区分开，其实就是soft prompt），然后是上面得到的user embedding，接着是用户当前输入，让LLM输出。这个头一开，接下来就可以把推荐的那些用户行为序列建模的各种套路都抄过来了，什么各种类型的序列，超长序列，各种attention交互，来提炼更好的user embedding，enjoy yourselves。以通用人工智能著称的LLM又要怎么开启个性化服务呢？那怎么输入LLM呢？

2024-09-30 14:55:41 966

原创北邮&剑桥最新SLM（小语言模型）研究综述

他们根据模型在常识推理和问题解决任务上的平均准确率，将过去三年的SLMs分为小于0.5B、1B、2B和3B的参数组，并分析了这些数据集的质量。这些训练算法的引入和应用，为SLMs的性能提升和应用范围拓展提供了新的可能性。通过这些方法，研究者能够更有效地利用有限的资源来训练出性能更强的模型，同时保持模型的尺寸和运行成本在可接受的范围内。知识蒸馏是大型语言模型（LLMs）领域的一个重要概念，它涉及从大型复杂的教师模型中提取有价值的知识，并将其传递给更小、更高效的学生模型。

2024-09-28 23:56:31 1454

原创 SIGIR2024 best short paper！RAG中如何评估检索质量

回到检索问题的本质，其实就是看检索出的doc是否包含目标输出的正确答案/答案片段，可以根据检索出的doc和groudtruth的匹配度作为query-doc的软标签训一个打分模型，后对doc进行打分，匹配度可以是文本相关性，也可以是精确匹配，根据实际任务调整，等价于搜索场景的相关性模型，若无现成的模型重训一个成本也较高；检索模型R，根据query q检索出doc列表R_k，对每个doc d，和q一起输入下游目标应用的模型LLM M，得到输出，与标准答案y进行比较评估。怎样的信息是补充，怎样的信息是干扰？

2024-09-22 18:57:31 638

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

jude2013的专栏

原创 500G！BAAI发布高质量预训练中文语料库CCI3.0-HQ

原创从Turtor Copilot探讨AI在教育领域的落地

原创人大&百度提出个性化插件式LLM

原创北邮&剑桥最新SLM（小语言模型）研究综述

原创 SIGIR2024 best short paper！RAG中如何评估检索质量

原创基于LLM的文本表示优化

原创 OpenAI o1的开源平替版self-replay RL来了！

原创 LLM新里程碑！OpenAI o1！

原创基于困惑度相关性的预训练数据质量调优

原创如何设计能让基于LLM的embedding模型更有效？

原创北大&阿里最新LLM偏好学习/反馈学习论文综述

原创 LLM的上下文学习中示例样本的作用研究

原创 RLPF：用于LLM用户摘要的预测反馈

原创最新LLM的attention head的机制研究报告

阿里广告中的机器学习平台

最优化原理与方法

机器人视觉技术

机器人学经典教材

隐马尔科夫模型

arm体系结构与编程

智能车程序

波动足机器人

Excel使用技巧大全

LabVIEW入门教程

空空如也