- 博客(31)
- 收藏
- 关注
原创 2024年 电工杯 (B题)大学生数学建模挑战赛 | 大学生平衡膳食食谱的优化设计 | 数学建模完整代码解析
问题1:膳食食谱的营养分析评价及调整数学方法:线性规划模型、营养素评价模型、比较分析可视化数据图:营养素含量表、营养素摄入量对比图、营养素缺乏情况图问题2:基于附件3的日平衡膳食食谱的优化设计数学方法:线性规划模型、经济性评价模型、多目标优化模型可视化数据图:蛋白质氨基酸评分图、用餐费用对比图、营养素含量对比图问题3:基于附件3的周平衡膳食食谱的优化设计数学方法:线性规划模型、经济性评价模型、多目标优化模型可视化数据图:蛋白质氨基酸评分图、用餐费用对比图、营养素含量对比图。
2024-05-24 12:22:06
3498
2
原创 2024年 电工杯 (A题)大学生数学建模挑战赛 | 园区微电网风光储协调优化配置 | 数学建模完整代码解析
DeepVisionary 每日深度学习前沿科技推送&顶会论文&数学建模与科技信息前沿资讯分享,与你一起了解前沿科技知识!本次DeepVisionary带来的是电工杯的详细解读:完整内容可以在文章末尾全文免费领取&阅读!问题重述及方法概述问题 1:各园区独立运营储能配置方案及其经济性分析经济性分析采用成本-效益分析方法,计算购电量、弃风弃光电量、总供电成本和单位电量平均供电成本等指标。问题 2:联合园区储能配置方案及其经济性分析经济性分析采用成本-效益分析方法,计算总
2024-05-24 12:11:06
1181
1
原创 ICML2024 定义新隐私保护升级:DP-BITFIT新型微调技术让AI模型学习更安全
1. 差分隐私的基本概念差分隐私(Differential Privacy,简称DP)是一种隐私保护技术,它通过在数据发布或查询过程中添加随机噪声,来保护个体数据的隐私。差分隐私的核心思想是,通过算法对数据集进行处理后,即使攻击者拥有除了某个个体之外的所有其他数据,也很难判断该个体是否存在于原始数据集中。2. BiTFiT方法的基础BiTFiT是一种参数高效的微调方法,它主要优化模型的偏置项(bias terms),而不是所有参数。
2024-05-19 00:53:31
1528
2
原创 ICLR2024 spotlight文章!革新AI文本生成:模型算术实现精细控制,降低文本毒性
模型算术是一种新颖的推理框架,用于组合和偏置大型语言模型(LLMs),而无需对模型进行(重新)训练或使用高度特定的数据集。这种方法允许在不直接提示的情况下更精确地控制生成的文本,比以前的受控文本生成(CTG)技术更为有效。通过模型算术,我们可以将先前的CTG技术表达为简单的公式,并自然地将它们扩展到新的、更有效的公式中。在模型算术中,我们可以自然地结合多个模型和属性,以精确控制每个组成部分的影响。
2024-05-17 23:37:33
1135
原创 新鲜出炉!ACL2024主会文章:实体关系分析助力大型语言模型攻克复杂推理挑战
1. 实体关系分析的重要性在自然语言处理任务中,大型语言模型(LLMs)虽然取得了显著的成就,但在涉及多个实体的复杂场景中,它们仍面临着显著的挑战。这些挑战源于场景中存在的隐含关系,这些关系需要多步推理来理解。为了解决这一问题,我们提出了一种新颖的方法——实体关系分析与思维链(ERA-CoT),它通过捕捉实体之间的关系来帮助LLMs理解上下文,并通过思维链(CoT)支持多样化任务的推理。2. ERA-CoT框架的五个步骤ERA-CoT框架包括五个阶段,每个阶段都涉及对实体关系理解的不同程度的增强。实体提取。
2024-05-16 18:30:41
2440
原创 超越人工智能:AnyTool,一款基于GPT-4的智能代理,引领API调用新纪元
在本文中,我们介绍了AnyTool,这是一个先进的代理工具,能够利用超过16,000个API来有效处理现实用户查询。AnyTool的核心是一个分层的API检索器和一个解决器,此外,它还整合了一个独特的自反思机制,提高了对用户查询的响应能力。我们还修订了之前的评估协议,使其更好地反映现实应用场景。在ToolBench和我们自己的AnyToolBench上进行的严格实验显示,我们的方法优于现有模型。
2024-05-15 11:27:55
1095
原创 全新Transformer模型:全球与局部双重突破!
1. Vision Transformer (ViT)的基本工作原理Vision Transformer(ViT)通过将图像分解为重叠的图像块,并将每个块线性投影到一个高维空间,从而获得一系列的向量。这些向量通过多头自注意力机制进行信息聚合,使模型能够关注长距离依赖,从而捕捉全局信息。2. 全局聚合编码器(GAE)的设计与功能全局聚合编码器(GAE)利用从ViT的最后几层获得的类标记,通过一个全连接层和GeLU激活函数生成一个综合的全局特征表示。
2024-05-13 12:39:04
1322
原创 革新机器人任务规划:TREE-PLANNER引领高效、准确的机器人动作生成新趋势
TREE-PLANNER是一种新型的任务规划方法,它通过将任务规划过程分解为三个阶段来提高效率和减少错误:计划采样、动作树构建和基于环境的决策。这种方法首先利用大型语言模型(LLM)来采样可能的任务计划,然后将这些计划聚合成一个动作树,最后在执行过程中根据实时环境信息对动作树进行决策。1. 计划采样(Plan Sampling)在这一阶段,TREE-PLANNER利用LLM根据任务的全局信息和初始观察来生成一系列潜在的任务计划。这些计划是基于LLM的常识性知识生成的,每个计划都是一系列动作的序列。
2024-05-12 23:11:01
1587
原创 Vision Mamba:高效视觉表示学习双向状态空间模型,超越Vision Transformer!
1. Mamba模型的基本原理Mamba模型是基于状态空间模型(SSM)的一种深度学习模型,它通过时间变化的参数和硬件感知的算法来实现高效的训练和推理。Mamba的优越性能表明它是语言建模中Transformer的一个有前途的替代品。Mamba模型的设计灵感来源于经典的卡尔曼滤波器模型,特别擅长捕捉长范围依赖关系,并且能够从并行训练中受益。2. Vim模型的创新之处Vim模型是在Mamba的基础上为视觉数据设计的一种新型视觉主干网络。
2024-05-10 20:07:12
4448
原创 英特尔StoryTTS:新数据集让文本到语音(TTS)表达更具丰富性和灵感
文本表达性是指文本在书写时所蕴含的情感和语调变化,这些特性能够影响语音的韵律和节奏,从而传达更丰富的情感和意境。例如,在叙述一个激动人心的故事时,文本中的感叹句和修辞手法可以增强语音的感染力,使听众能够感受到文字背后的情感波动。
2024-05-09 22:09:51
948
1
原创 夜晚也清晰可见!ContextualFusion技术突破传统传感器限制,3D对象检测性能显著提升
1. 模型概述ContextualFusion是一个多传感器融合模型,专为在恶劣操作条件下进行3D对象检测而设计。该模型利用环境上下文信息,通过智能地分配激光雷达和摄像头模态在不同光照和雨天条件下的重要性,显著提高感知性能。例如,在夜间或低光照条件下,ContextualFusion能够准确地检测到激光雷达和摄像头视图中都可见的车辆,而现有的一些基于摄像头的方法则无法做到。2. 3D对象检测。
2024-05-08 23:39:27
998
原创 Parts2Whole革新:多参照图定制人像,创新自定义肖像生成框架!
在数字内容创作领域,可控的人像生成技术正逐渐成为一个重要的研究方向。这项技术能够根据特定的文本描述、结构信号或更精确的外观条件来合成人像,为用户提供了一种定制化的肖像解决方案。然而,由于控制条件的复杂性,尤其是在多种类型的条件输入和控制人体外观的各个方面时,这项任务呈现出显著的挑战性。最近,我们介绍了一个名为Parts2Whole的新框架,它旨在从多个参考图像生成定制化的人像,包括姿势图像和人体外观的各个方面。
2024-05-07 21:07:01
868
原创 性能超越!新模型Dragoman打造高质量英译乌翻译系统,打败现有SOTA模型
少样本学习通常指的是在只有很少训练样本的情况下训练模型的能力。这种方法在数据稀缺的语言或领域中特别有用,例如在处理乌克兰语这样的资源较少的语言时。通过少样本学习,模型能够快速适应新任务,无需大量数据即可进行有效的预测。
2024-05-06 21:02:07
1107
1
原创 AI新突破:多标签预测技术助力语言模型提速3倍
1. 实验的设计方法本研究提出了一种多标记预测(multi-token prediction)的训练方法,旨在提高大型语言模型(LLMs)的样本效率。在传统的下一标记预测(next-token prediction)任务中,模型在每个训练步骤只预测一个未来的标记。与此相对,多标记预测任务要求模型在每个位置同时预测未来的多个标记。这种方法通过在共享模型主干(shared model trunk)的基础上操作,使用多个独立的输出头(output heads)来预测接下来的n个标记。
2024-05-05 22:38:27
1480
原创 大型语言模型的新挑战:AMR语义表示的神秘力量
1. AMRCOT的概念和设计原理AMRCOT是一种基于抽象意义表示(AMR)的NLP任务提示方法。AMR通过提取文本中的关键语义信息(如实体、关系等),为语言模型提供了一种中间语义表示。这种表示旨在帮助语言模型更有效地理解和处理复杂的语言任务。AMRCOT方法通过将输入文本与其对应的AMR一起呈现给预训练的大型语言模型(LLM),来探索AMR在没有模型训练的情况下,对LLM性能的潜在影响。2. 选择的五个NLP任务和数据集:使用PAWS数据集,测试模型是否能识别两个句子是否为同义重述。
2024-05-04 12:30:15
2329
原创 解锁工业场景下的时序因果发现,清华&阿里巴巴&伯克利联合提出RealTCD框架:通过大语言模型提升发现质量!
1. 框架概述RealTCD框架设计了两个主要模块:基于分数的时间因果发现(Score-based Temporal Causal Discovery)和LLM引导的元初始化(LLM-guided Meta Initialization)。这两个模块共同作用,利用大型语言模型(LLMs)处理文本信息,并从中提取元知识来初始化因果结构,进而优化和发现时间因果关系。2. 基于分数的时间因果发现此模块首先开发了一种基于分数的方法,通过策略性掩蔽和正则化学习因果关系。
2024-05-03 14:27:00
1195
1
原创 Mamba3D革新3D点云分析:超越Transformer,提升本地特征提取效率与性能!
Mamba3D是一种专为3D点云学习设计的状态空间模型,它在处理无序点云数据时展现出卓越的性能和高效率。与传统的Transformer模型相比,Mamba3D通过其线性复杂度优势,能够处理更大规模的数据集,同时保持较低的参数数量和计算成本。Mamba3D的设计灵感来源于Mamba模型,该模型是基于状态空间模型(SSM)的一种高效实现。Mamba模型通过引入选择机制,有效压缩上下文信息,使其能够处理长序列数据。
2024-05-02 21:48:05
2843
1
原创 2024年第二十一届 五一杯 (C题)大学生数学建模挑战赛 | 多目标优化问题,深度学习分析 | 数学建模完整代码解析
DeepVisionary 每日深度学习前沿科技推送&顶会论文&数学建模与科技信息前沿资讯分享,与你一起了解前沿科技知识!本次DeepVisionary带来的是五一杯的详细解读:完整内容可以在文章末尾全文免费领取&阅读!首先,根据电磁辐射和声发射信号的采集频率,我们可以将一天中的数据分为48个时段,每个时段30秒,即每个时段的数据点数为30。根据题意,A类和B类为工作面正常生产时的数据,因此可以认为这些时段内采集的数据是稳定的,不会出现干扰信号。对于C类数据,由于存在干扰信号
2024-05-01 20:23:39
1592
原创 2024年第二十一届 五一杯 (B题)大学生数学建模挑战赛 | 最大流问题,深度学习分析 | 数学建模完整代码解析
DeepVisionary 每日深度学习前沿科技推送&顶会论文&数学建模与科技信息前沿资讯分享,与你一起了解前沿科技知识!本次DeepVisionary带来的是五一杯的详细解读:完整内容可以在文章末尾全文免费领取&阅读!第一个问题是建立数学模型,给出各(起点,终点)对之间交通需求分配到对应路径上的交通量,使得网络中任意1条路段出现突发状况时,网络中所有交通需求的期望可达率最大。首先,我们需要定义一些变量来表示问题中的数据:DijD_{ij}Dij:表示从起点i到终点j的
2024-05-01 20:00:07
6661
原创 2024年第二十一届 五一杯 (A题)大学生数学建模挑战赛 | 多目标优化问题,深度学习分析 | 数学建模完整代码解析
DeepVisionary 每日深度学习前沿科技推送&顶会论文&数学建模与科技信息前沿资讯分享,与你一起了解前沿科技知识!本次DeepVisionary带来的是五一杯的详细解读:完整内容可以在文章末尾全文免费领取&阅读!第一个问题:给定如图2所示的下料切割布局N1,建立数学模型,设计最优切割路径方案,并给出最优切割路径的空程总长度。首先,根据题意,切割路径应满足空程最短的原则,即切割线的总长度应最小。假设钢板的宽度为w,长度为l,切割起始点为A(0,0),切割终点为B(w,
2024-05-01 19:14:27
5928
9
原创 重定义大语言模型的记忆能力:对抗性压缩如何挑战现有测量法
1. ACR的概念及其重要性对抗压缩比(Adversarial Compression Ratio, ACR)是一种新提出的衡量大型语言模型(LLM)记忆化程度的指标。这一指标基于一个压缩论点:如果一个训练数据中的字符串可以通过一个比该字符串本身短的提示被模型复现出来,则认为该字符串被记忆了。换句话说,这些字符串可以通过计算对抗性提示的方式在模型中被“压缩”。
2024-05-01 18:13:53
1617
原创 破解复杂真实场景:UniMERNet革新数学表达式识别,数据达百万级别,性能全面领先!
UniMER数据集是为了应对现实世界中公式识别的多样性挑战而特别设计的。该数据集分为两个子集:UniMER-1M训练集和UniMER-Test测试集。UniMER-1M训练集涵盖了现实世界中遇到的各种数学表达式,而UniMER-Test则用于全面、准确、多维度的评估。具体来说,UniMER-1M包含1,061,791个Latex-Image样本对,涵盖了从简短到复杂、长公式的表达式。其构建的一个关键方面是仔细平衡不同长度分布的需要。
2024-04-30 23:48:32
1355
1
原创 中科院突破:TalkingGaussian技术实现3D人脸动态无失真,高效同步嘴唇运动!
3D高斯喷溅(3D Gaussian Splatting, 3DGS)是一种用于表达三维空间信息的技术,通过一组3D高斯原始数据来实现。这些高斯原始数据包括中心位置、缩放因子、旋转四元数、不透明度和颜色特征。在渲染过程中,根据相机模型信息,这些高斯原始数据被用来计算观察视图下的像素颜色。3DGS的核心优势在于其明确的空间表达和优化策略。通过梯度下降法优化高斯原始数据的参数,结合密集化策略控制原始数据的增长,并剪除不必要的数据,从而实现高效的颜色监督。
2024-04-29 15:19:19
3279
3
原创 揭秘DeepMind如何对抗操纵性AI:新研究为减轻说服性AI的危害铺路
在探讨人工智能(AI)的应用领域中,AI劝说技术逐渐成为一个重要的研究和应用方向。AI劝说可以定义为AI系统通过交互影响用户的信念和行为的过程。这种技术的应用范围广泛,从商业广告到心理健康干预等多个领域都有涉及。然而,随着AI劝说技术的发展和应用,其潜在的风险和伦理问题也逐渐显现,引发了广泛的关注和讨论。1. AI劝说的基本定义AI劝说主要指的是AI系统通过语言、图像或其他交互方式,改变或影响用户的决策和行为。这种影响可以是显性的,也可以是隐性的,其目的可能是为了提供帮助,也可能是出于商业利益的驱动。
2024-04-28 11:03:24
1116
原创 解锁图像新维度:剑桥联手英特尔,利用大语言模型重构逆向图形学!
逆图形学(Inverse Graphics)是计算机视觉和图形学中的一个基本挑战,其任务是将图像反转为物理变量,这些变量在渲染时能够再现观察到的场景。这一过程涉及到将图像解构为其构成元素,如场景中物体的形状、颜色和材料属性等。逆图形学的概念可以追溯到至少1974年的Baumgart,并在后续的研究中不断发展,如Kersten & Yuille (1996) 和 Yuille & Kersten (2006) 的工作。
2024-04-27 14:05:04
1474
原创 微软联手清华,打造VisionPrefer:AI注释让文本到图像生成的对齐更符合人类偏好!
1. VisionPrefer和VP-Score的贡献与限制VisionPrefer通过集成AI生成的细粒度反馈,为文本到图像生成模型提供了一个高质量的训练和微调平台。VP-Score作为基于此数据集训练的奖励模型,展示了与人类偏好高度相关的性能。然而,这些研究主要集中在通过AI进行注释的可行性上,未来研究可以探索如何更有效地利用文本解释数据,以进一步提高模型的解释能力和透明度。2. 文本解释数据的潜在应用及未来探索方向。
2024-04-26 12:44:16
1258
1
原创 复旦新突破:用全球元组抽取革新文本到表格生成,超越传统大模型!
LIVESUM数据集是为了评估模型在文本到表格生成任务中的信息整合能力而设计的新型基准数据集。该数据集包含了3,771场实时足球比赛的文本评论,这些评论来自真实世界的比赛。与以往的数据集不同,LIVESUM要求模型不仅仅是复制文本中的信息,而是需要展示出从复杂文本数据中提取正确且有意义信息的能力,特别强调信息整合、推理和概念化技能。例如,数据集中的评论可能在时间上非常接近或语义上相似,可能描述的是同一事件,而具有相似含义的动词可能指代同一类事件。
2024-04-24 22:20:04
1231
原创 Llama3效果席卷大语言模型,香港大学发布量化Llama3实验性研究结果
量化技术,尤其是针对大型语言模型(LLM)的低比特量化,已成为模型压缩领域的热点。从最基本的后训练量化(Post-Training Quantization, PTQ)到最新的低秩微调(LoRA-FineTuning, LoRA-FT)方法,量化技术的进步使得LLM在资源受限的设备上也能高效运行。PTQ主要通过简化权重和激活的精度来减小模型大小,常见的技术如四舍五入量化(RTN)和高级权重量化(AWQ)。而LoRA-FT则通过在低秩空间对模型进行微调,进一步提升了量化后的模型性能。
2024-04-23 20:59:27
1477
原创 Meta与卡内基梅隆大学突破:G-HOP模型全新定义3D手物交互与抓握合成
G-HOP模型是一种基于去噪扩散(Denoising Diffusion)的生成模型,用于学习和生成手和物体在3D空间中的联合分布。模型的核心在于采用了一种统一的手-物体互动(HOI)表示方式——交互格网(Interaction Grids)。该表示将手的骨架距离场和物体的隐式距离场(latent signed distance field)结合在一起,以便模型能够有效地处理和生成复杂的手物互动形态。交互格网的构建交互格网是一个融合了手的骨架距离场和物体的隐式距离场的3D网格。
2024-04-22 11:37:38
1572
原创 伯克利最新研究揭示:如何“验证验证者”?LLM辅助评估与人类偏好更加对齐的新方法
EvalGen的用户界面设计注重简洁性和功能性,以支持用户高效地进行评估工作。界面包括几个主要部分:准则选择、断言生成与执行、以及评分和报告卡显示。用户首先在准则选择界面中定义和编辑评估标准,然后进入断言生成和执行界面,这里显示了对LLM输出执行断言的实时结果。评分界面提供了简单的好坏按钮,用户通过这些按钮对LLM的输出进行评价。系统根据用户的评分调整断言的选择和优化。
2024-04-21 11:05:45
1186
1
原创 论文分享:突破视觉边界:新型CPA-Enhancer模型助力目标检测在恶劣环境下精准识别
CPA-Enhancer作为一种新颖的目标检测增强模块,成功地解决了在多种未知退化条件下进行目标检测的问题。通过生成CoT提示,CPA-Enhancer能够根据退化类型动态调整其增强策略。实验结果表明,CPA-Enhancer在多种退化条件下都能提升下游视觉任务的性能,并超越了现有的最先进方法。未来的研究将致力于创建一个更通用的模型,涵盖更广泛的退化类型,并进一步减少模型参数,以实现更高效的实时应用。
2024-04-20 16:12:21
2435
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人