大模型(LLM)是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。LLM的特点是规模庞大,包含数十亿的参数,帮助它们学习语言数据中的复杂模式。这些模型通常基于深度学习架构,如转化器,这有助于它们在各种NLP任务上取得令人印象深刻的表现。
2022年底,OpenAI 推出的基于 GPT-3.5 的大型语言模型 ChatGPT,由于其优秀的表现,ChatGPT 及其背后的大型语言模型迅速成为人工智能领域的热门话题,吸引了广大科研人员和开发者的关注和参与。
为了方便大家阅读,只列出了论文标题、AMiner AI综述等信息,如果感兴趣可点击查看原文,PC端数据同步(收藏即可在PC端查看),每日新论文也可登录小程序查看。
如果想要对某篇论文进行深入对话,可以直接复制论文链接到浏览器上或者直达AMiner AI页面:
https://www.aminer.cn/chat/g/explain
JuStRank: Benchmarking LLM Judges for System Ranking
【要点】:论文提出了JuStRank,一种使用大型语言模型(LLM)作为评判器对AI系统进行排名的方法,并首次在大规模研究中评估了LLM评判器在系统级别排名中的质量,发现了其决定性和偏见特性。
【方法】:作者通过聚合LLM评判器对多个系统输出的评分来生成系统分数,并将基于LLM的排名与人类专家的排名进行比较,以验证LLM评判器的质量。
【实验】:研究通过广泛的实验,使用未知的数据集进行了系统排名,分析了LLM评判器的行为特性,包括其判断的果断性和对特定系统的偏倚。
【链接】:https://www.aminer.cn/pub/675ba353ae8580e7ff221601/
Birth and Death of a Rose
【要点】:本文提出了一种基于预训练2D扩散模型生成时间变化的物体内部属性(几何、反射率和纹理)的方法,通过神经模板实现时间状态引导的蒸馏,实现了对自然现象如玫瑰花开过程的高质量动态渲染。
【方法】:作者使用预训练的2D扩散模型提取信号,并引入神经模板进行时间状态引导的蒸馏,从而生成时间变化的物体内部属性。
【实验】:实验使用了自监督学习自动提取的图像特征,生成了一系列自然现象的物体内部属性,并在项目网站(https://chen-geng.com/rose4d)上展示了结果。文中未提及具体的数据集名称。
【链接】:https://www.aminer.cn/pub/67565a52ae8580e7ff8e2b68/
Forking Paths in Neural Text Generation
【要点】:本文提出了一种新的方法来估计大型语言模型(LLMs)的不确定性,发现关键分叉标记对生成文本结果具有显著影响,并验证了这些分叉标记的存在。
【方法】:通过在文本生成的每个标记上应用统计模型,研究不确定性动态,并测试了特定标记重采样后导致不同结果的现象。
【实验】:在7个不同任务和4个领域的广泛应用中,使用该方法分析了LLMs的响应,发现许多分叉标记,包括标点符号等,表明LLMs在生成文本时往往仅差一个标记即可产生显著不同的结果。数据集名称未在摘要中明确提及。
【链接】:https://www.aminer.cn/pub/675a520fae8580e7ff72e870/
No Free Lunch from Random Feature Ensembles
【要点】:论文探讨了在预算限制下,单个大型神经网络与多个小型神经网络组合的性能对比,证明了在给定的参数预算下,单个模型性能最优,并提出了在特定条件下随机特征集成模型的近最优扩展规律。
【方法】:研究采用理论分析和实验验证的方法,通过对随机特征集成模型进行推导,证明了在参数分配和调节正则化参数时,单个模型性能优于多个小模型的集成。
【实验】:作者使用CIFAR-10数据集对深度卷积神经网络和C4数据集对变换器架构进行了实验,结果表明在调整权重衰减和特征学习强度至最佳值时,单个大型网络性能超过相同参数量的网络集成。
【链接】:https://www.aminer.cn/pub/6757af9fae8580e7ffb2a938
Intelligent System for Automated Molecular Patent Infringement Assessment
【要点】:本文提出了PatentFinder,一种新颖的工具增强多代理框架,能够准确全面评估小分子专利侵权问题,解决了自动化药物发现中的关键挑战,并通过任务分解实现了更高效的专利侵权判断。
【方法】:研究采用了将复杂任务分解为子任务的方法,结合启发式和基于模型的工具,包括MarkushParser用于光学化学结构识别和MarkushMatcher用于提高大型语言模型准确提取分子取代基的能力。
【实验】:在自定义的MolPatent-240数据集上进行的实验显示,PatentFinder相较于仅依赖大型语言模型的基础方法,F1分数提高了13.8%,准确性上升了12%,有效减少了标签偏差,并能够自主生成详细的、可解释的专利侵权报告。
【链接】:https://www.aminer.cn/pub/675a520fae8580e7ff72e7da/