
LLM每日更新
文章平均质量分 92
hinmer
这个作者很懒,什么都没留下…
展开
-
【LLM】25.1.15 arxiv更新37篇
====链接1摘要: 本文提出了一个全新的架构框架,从三个方面理解和分析AI安全性:可信赖的AI、负责任的AI和安全的AI。文章广泛回顾了当前AI安全领域的研究进展,并重点介绍了各个方面的关键挑战和缓解措施。通过大语言模型等最新技术的案例,提出了设计和测试AI安全的创新机制、方法和技术。该研究旨在推动AI安全研究的进步,最终增强人们对数字化转型的信任。总结: 本文提出了一个全面的AI安全架构框架,包括可信赖、负责任和安全三个方面,并针对现有技术如大语言模型提出创新性的设计和测试方法。原创 2025-01-16 17:01:53 · 879 阅读 · 0 评论 -
【LLM】25.1.14 arxiv更新59篇
PDF链接摘要: 在大规模软件开发中,理解复杂代码库的功能和意图对于有效的开发和维护至关重要。尽管代码摘要已被广泛研究,但现有方法主要关注较小的代码单元,如函数,并且在处理较大的代码工件(如文件和包)时存在困难。此外,当前的摘要模型往往强调低级实现细节,常常忽视对现实应用至关重要的领域和业务上下文。本文提出了一种针对业务应用的仓库级代码摘要的两步层次化方法。首先,使用语法分析识别较小的代码单元如函数和变量,并利用本地大语言模型进行摘要。这些摘要随后被聚合以生成更高级别的文件和包摘要。原创 2025-01-15 13:03:21 · 923 阅读 · 0 评论 -
【LLM】25.1.13 Arxiv LLM论文速递
====原创 2025-01-14 16:49:13 · 1225 阅读 · 0 评论 -
【LLM】25.1.11 Arxiv LLM论文速递
我们介绍了HRMCR(HAE-RAE多步常识推理),该基准旨在评估大型语言模型在文化特定的背景下进行多步推理的能力,重点关注韩国语。问题通过模板和算法自动生成,要求大型语言模型在连续的推理步骤中整合韩国的文化知识。与先前关于出现能力的观察一致,我们的实验表明,训练FLOPs低于(2 \cdot 10^{25})的模型在解决任何问题上表现近乎为零。在这一阈值以上,性能有显著提升。最先进的模型(例如O1)仍然得分不到50%,强调了我们任务的难度。原创 2025-01-13 16:19:46 · 1021 阅读 · 0 评论 -
【LLM】25.1.10 Arxiv LLM论文速递
LLM 相关文章 UCT+8 时间 1月9日 12:00 - 1月10日 12:00 共更新 44 篇原创 2025-01-10 14:48:37 · 464 阅读 · 0 评论 -
【LLM】25.1.8 Arxiv 论文速递
LLM 新增 50 篇原创 2025-01-09 17:34:59 · 1125 阅读 · 0 评论 -
【LLM】25.1.7 Arxiv 论文速递
##【arXiv编号】2501.03989v1###【git】无###【期刊】无###【领域】计算机科学,信息检索,数据隐私总结: 通过强化学习优化调度策略,实现了对大型语言模型工作负载的智能负载均衡,显著降低了推理延迟。###【arXiv编号】2408.13510###【git】###【期刊】无###【领域】计算机科学###【arXiv编号】2501.03968v1###【git】###【期刊】无###【领域】机器人学, 人工智能。原创 2025-01-08 19:53:20 · 1027 阅读 · 0 评论