自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(921)
  • 收藏
  • 关注

原创 31.3K star!开源免费本地AI神器,一键部署多模态大模型!

🤖 完全开源、本地优先的AI解决方案,支持文本/语音/图像/视频生成,消费级硬件即可运行!LocalAI 是一款革命性的开源AI框架,专为本地化部署设计。

2025-04-04 10:45:00 533

原创 人工智能与实验室自动化在金属有机骨架的发现和合成中的应用综述

MOFs作为一种具有独特可调性、极高比表面积和广泛应用前景的材料,在能源存储、药物传递和环境修复等领域展现出巨大潜力。然而,MOFs的合成过程复杂,结构多样性高,传统研究方法难以高效探索其庞大的参数空间,限制了发现和优化新MOF材料的速度和质量。实验室自动化技术的发展,使得高通量实验(HTE)成为可能,通过同时执行多个实验,显著提高了实验效率和数据获取速度。

2025-04-03 20:33:09 465

原创 全自动零代码LLM智能体框架AutoAgent

欢迎来到 AutoAgent!AutoAgent 是一个全自动且高度自发展的框架,用户仅通过自然语言即可创建和部署LLM智能体。AutoAgent 是一个“全自动、零代码”的 LLM Agent 框架,能让你通过日常语言(比如“帮我写个总结”)告诉系统你想要什么,然后它自动帮你生成一个智能助手(AI Agent)。这些助手是用像 GPT-4 或 Claude 这样的大模型驱动的,但你不需要懂技术也能用。

2025-04-01 19:32:40 841

原创 2025风口指南:万字长文带你吃透大模型Agent,涵盖应用、场景与发展

Agent 由多个组件协同工作,以实现高效决策和任务执行。看到很多文章都提到说:***大模型Agent由规划、记忆、工具与行动四大关键部分组成***,分别负责任务拆解与策略评估、信息存储与回忆、环境感知与决策辅助、以及将思维转化为实际行动。但实际上现在的大模型Agent最主要几个关键部分为:base大模型的动态推理规划、工具模块、记忆模块。**

2025-04-01 19:21:17 668

原创 DeepSeek 电子政务应用中的创新实践案例

DeepSeek 在电子政务中的创新实践案例已覆盖全国多地,形成了多领域、多层次的智能化应用体系,以下是具有代表性的创新案例:一、*政务流程智能化升级*1. *深圳福田区 AI 数智员工*部署全尺寸 DeepSeek 大模型,推出 70 名“数智员工”,覆盖 11 大类 240 个政务场景,显著提升效率:- 执法文书生成:笔录秒级转初稿,错误率降低 90%;- 安全生产管理:演练脚本生成效率提升 100 倍;- 招商引资:企业分析筛选效率提高 30%,耗时缩至分钟级。2. *无锡市全尺寸模型部署*在政务信创

2025-03-31 17:09:07 335

原创 Dense与MoE大模型架构后续发展解读

Snowflake Arctic 模型作为一个引人注目的真实案例,验证了混合 MoE 架构在特定的商业相关任务上实现最先进的智能,并且与更传统的Dense或纯 MoE 模型相比,具有显著更高的效率和更低的训练成本的潜力。这种透明度有助于建立用户对系统的信任。此外,研究人员正在探索各种技术,例如金字塔残差 MoE (PR-MoE) 架构,以通过仅在网络中那些能够提供最大收益的部分策略性地应用计算成本更高的 MoE 层,从而进一步提高训练效率,最终在不显着影响模型质量的情况下降低整体参数规模和计算成本。

2025-03-31 17:08:22 376

原创 可以本地部署的最强OCR大模型:OlmOCR

支持结构化精准提取复杂PDF文件内容!完美识别中英文文档、模糊扫描件与复杂表格!本地部署与实际测试全过程!医疗法律行业必备!轻松应对企业级PDF批量转换需求!

2025-03-30 10:45:00 1265

原创 一个强大的AI提示词优化工具!成熟的AI应该学会自己动!

这段时间大家都感受到了AI技术的大爆炸带来的改变,AI已经成为区分工作能力的因素之一。AI应用能力的关键就是能否写出优秀的提示词,如果我们自己写不好提示词,为什么不让AI帮你写呢?试试Prompt Optimizer[1]——让你写提示词像喝快乐水一样简单!

2025-03-29 11:11:04 870

原创 IF=10.7,集成变换器的多实例学习预测子宫内膜癌和结直肠癌组织病理学全切片图像中的病理亚型和肿瘤突变负荷

提出了一种深度学习框架(ETMIL-SSLViT),用于直接从EC和CRC患者的H&E染色WSIs中预测病理亚型和TMB状态,有助于病理分类和癌症治疗规划。

2025-03-29 11:06:39 981

原创 TIM 2025 | 基于稀疏表示和自适应双通道PCNN模型的红外与可见光图像融合

图像融合的原理是将异构图像中的互补信息进行整合,以获得更符合人眼视觉效果的融合图像。然而,大多数分解方法无法区分图像中的纹理和边缘,容易在边缘周围产生光晕伪影。本文提出了一种新的图像分解策略——共现分析剪切波变换(CAST),根据共现统计信息对输入图像进行预处理,生成基础层和细节层分量。为了提高基础层的稀疏性,引入了测量域中的分类稀疏字典,以增强对错误配准的鲁棒性。

2025-03-28 11:53:07 772

原创 智慧农业 | 基于物联网的智慧农业能力平台建设及平台架构功能方案解析

本文主要介绍智慧农业物联网平台解决方案,涵盖智慧农业概念、中国农业面临的问题、产业化和信息化发展方向、物联网在农业中的应用,以及智慧农业能力平台架构、典型扩展性应用等内容,旨在通过物联网技术解决农业生产中的诸多问题,推动农业现代化发展。

2025-03-28 11:52:12 869

原创 AAAI2025:一种用于非对齐医学图像融合的双向逐步特征对齐网络BSAFusion

本文提出了一种创新的单阶段多模态医学影像配准与融合框架(BSAFusion),旨在解决未对齐医学影像的精准配准与融合问题。通过引入双向步进式特征对齐(BSFA)和模态无关特征表示(MDF-FR)技术,BSAFusion有效减少了不同模态影像间的特征差异,提升了跨模态图像配准的精度和融合的质量。实验结果表明,BSAFusion在多个数据集上取得了优异的性能,展示了其在医学影像处理中的潜力和应用前景。

2025-03-28 11:50:52 1009

原创 Nature首发!微软推出MatterGen,AI从零生成可合成的无机材料,颠覆无机材料设计范式!

在能源存储、碳捕获、催化等关键技术不断发展的当下,功能材料的设计已成为推动科技进步的重要驱动力。传统材料发现主要依赖人类专家的经验和实验反复试错,不仅周期长、成本高,而且探索空间有限。近年来,随着高通量筛选方法、开放材料数据库和机器学习性能预测模型的发展,材料设计进入数据驱动时代,使得数十万种材料可以被快速筛选,从而显著加速了发现过程。然而,这种筛选范式本质上仍受限于已有材料的组合,难以跳出“已知材料”的边界,无法系统性地发现具有特定性质的新型结构。

2025-03-27 11:16:11 340

原创 AI助手要觉醒?揭秘RAG、Agent、MCP三大超能力如何让它无所不能!

AI的这波进化,像极了人类从“背字典”到“用工具”再到“动脑子”的过程。或许有一天,你的AI助手会比你更清楚——什么时候该查资料、什么时候要自己做主、什么时候调用哪个工具。而我们要做的,就是用好这些“觉醒”的AI超能力,让自己活得更像个“指挥官”。

2025-03-27 11:15:03 682

原创 双热点新突破:GNN-Transformer超越传统起飞!

GNN-Transformer融合模型的核心在于利用Transformer的自注意力机制增强GNN的全局信息聚合能力,同时通过GNN的图结构归纳偏置提升Transformer在处理非欧几里得数据时的效率。例如,Graph Transformer通过将节点特征和边特征嵌入到Transformer的输入序列中,实现了对图结构数据的端到端学习;而Graph-BERT则通过引入图感知的位置编码和节点上下文采样策略,进一步优化了Transformer在图数据上的表现。

2025-03-27 11:13:46 902

原创 CryptoPulse:结合宏观波动、技术指标和货币价格变化的加密货币日收盘价预测模型

加密货币市场波动性大,给投资者带来挑战。

2025-03-26 10:22:48 667

原创 李飞飞ReKep论文解读:大模型直接驱动机器人操作,无需数据集

近日,Google DeepMind发布了基于 Gemini 2.0 的具身推理模型Gemini Robotics-ER以及动作模型Gemini Robotics。Gemini Robotics-ER 通过增强的具身推理(ER)能力,将语义理解扩展至物理几何(如 3D 结构、物体位姿)和动态场景(如运动轨迹、接触效应),使机器人从“感知环境”升级为“理解物理规律”。例如,它能识别咖啡杯的把手并规划安全抓取路径,甚至动态生成控制代码以适应突发变化,而无需预先的数据训练。

2025-03-26 10:20:56 779

原创 5000字!一文读懂大型语言模型的六大定制化策略

本文详细介绍了六种常见的LLM定制化策略,包括提示工程、解码策略、RAG、代理、微调和RLHF。每种策略都有其独特的优势和权衡,选择合适的策略取决于你的具体需求和资源。

2025-03-26 10:19:37 713

原创 大模型 RAG 终极指南:信息检索 + 文本向量化 + BGE-M3 实践全解析!

本文整理一些文本向量化(embedding)和信息检索的知识,它们是如今大模型生成文本时常用的技术 —— “增强检索生成”(RAG)—— 的基础。RAG (Retrieval-Augmented Generation,检索增强生成),是一种利用信息检索(Information Retrieval) 技术增强大模型生成效果(generation)的技术。RAG 在步骤上很简单。本文主要关注以上 1 & 2 步骤中的 embedding & retrieval 阶段。

2025-03-25 10:13:03 1145 1

原创 天翼云:Apache Doris + Iceberg 超大规模湖仓一体实践

天翼云是中国电信旗下一家科技型、平台型、服务型公司,以“云网融合、安全可信、绿色低碳、生态开放”四大优势向客户提供公有云、私有云、专属云、混合云、边缘云全栈云服务。。天翼云基于 Apache Doris 和 Apache Iceberg 构建的湖仓一体方案,兼具灵活性、高性能和低成本优势,同时满足了报表和 BI 分析、湖仓融合分析、日志存储分析、高并发实时分析、MPPDB 国产化替代等多种场景需求。天翼云数据来源众多,在数据整合和共享方面面临挑战。

2025-03-25 10:11:55 668

原创 一文详解!模型压缩四剑客:量化、剪枝、蒸馏、二值化

在深度学习的世界里,模型压缩技术如同魔法般,能让庞大的模型在资源受限的环境中“瘦身”并高效运行。本文将带你一探究竟,用清晰明白的话语,对比量化、剪枝、蒸馏和二值化这四大压缩“剑客”的原理、效果和优缺点。

2025-03-25 10:09:54 1016

原创 Light-R1-32B之R1复现认识:兼看R1蒸馏模型所用800K数据细节问题

所以,还是那样,很多细节信息,其实都在论文里,大家都可以多深挖。

2025-03-24 11:48:06 925

原创 首篇多模态 RAG 全栈技术综述出炉~

和为 Multimodal RAG:多模态RAG*多模态检索增强生成(RAG)通用框架*查询预处理、多模态数据库、检索策略(*模态为中心*)、融合机制、增强技术、生成阶段、训练策略(*噪声管理技术*)*:数据集、评估指标、基准测试、评估方法以及检索、融合、增强和生成方面的创新检索策略是多模态RAG系统的核心部分,主要通过高效搜索和相似性检索来提升信息检索的准确性和效率。融合机制的目标是将来自不同模态的数据整合到统一的表示中,以支持跨模态推理。增强技术通过优化检索到的文档,提升多模态RAG系统的性能。

2025-03-24 11:46:20 569

原创 突破LSTM!结合CNN多变量时间序列预测 !!

LSTM 是一种特殊的循环神经网络(RNN),旨在解决 RNN 的梯度消失与梯度爆炸问题。它通过引入“门控机制”,能够在时间序列中记住长时间的依赖关系,同时避免对无关信息的记忆。LSTM 单元的核心在于一个“细胞状态” (),它能够通过线性传递保留重要信息。此外,LSTM 包括三个门控单元:遗忘门、输入门和输出门,用于控制信息的流动。

2025-03-24 11:44:16 829

原创 最新「大模型简史」整理!从Transformer(2017)到DeepSeek-R1

语言模型」是一种「人工智能系统」,旨在处理、理解和生成类似人类的语言。它们从大型数据集中学习模式和结构,使得能够产生连贯且上下文相关的文本,应用于翻译、摘要、聊天机器人和内容生成等领域。

2025-03-23 10:45:00 1868

原创 NatureLM:驱动科学发现与创新的跨领域AI大模型

在跨学科研究中,打破知识壁垒一直是科学家们追求的目标。如今,微软研究院科学智能中心推出的 Nature Language Model(NatureLM)为这一目标带来了新的曙光。NatureLM 是一种基于序列的自然科学基础语言模型。通过整合生物学、化学和材料科学等领域的海量数据,NatureLM 构建了一个统一的知识框架,能够实现小分子、蛋白质、材料、DNA 和 RNA 等不同科学领域的生成与优化,为跨学科研究和前沿科学探索提供了强大助力。

2025-03-22 10:50:49 900

原创 化学中的大型语言模型与自主智能体综述

总结展望本文全面综述了LLMs和自主智能体在化学领域的应用,强调了这些技术在加速科学发现和推动化学研究创新方面的潜力。尽管取得了显著进展,但仍面临数据质量、模型可解释性和与实验方法的整合等挑战。未来的发展方向包括开发更复杂的多模态智能体、增强智能体与实验方法的协作以及建立更高质量的化学数据集。随着这些技术的不断发展,LLMs和自主智能体有望在化学研究中发挥更大的作用,推动化学科学的进步。

2025-03-22 10:49:38 695

原创 使用RAG技术构建企业级文档问答系统:新架构(3)借助DeepSeek R1的反思型RAG

DeepSeek R1出现后,得益于其出色的推理能力,使得它在任务规划、反思等方面的可以发挥更大的作用。

2025-03-21 11:09:37 346

原创 EMNLP 2024 | 从知识图谱中学习大语言模型的规划能力

在使用大语言模型(LLMs)处理复杂问答任务时,通常需要先对复杂问题进行规划(Planning),将其分解为多个子问题,然后分别对每个子问题进行检索和回答,最终综合得出原始问题的答案。然而,对于参数量较小的模型(小于10B),进行复杂问题的规划并不容易,通常需要依赖监督训练。这引发了一个关键问题:如何获取规划任务所需的监督训练样本?人工标注虽然可行,但成本过高,难以大规模应用;常见的替代方法是从更大的语言模型中蒸馏出规划路径来训练小型模型,但这种方法无法确保蒸馏出的知识完全准确。

2025-03-21 11:08:30 571

原创 PlanGEN:让 AI 规划更智能的多智能体框架

PlanGEN 的优势在于它能够动态适应不同复杂度的任务,通过多智能体的协作,显著提升了 AI 的规划和推理能力。然而,它也有一些局限性。比如,它在选择推理算法时依赖于预定义的启发式规则,这可能在某些任务上不够灵活。此外,PlanGEN 的计算开销相对较大,可能需要进一步优化以适应更广泛的应用场景。尽管存在一些局限性,PlanGEN 无疑为 AI 的规划和推理能力带来了新的可能性。PlanGEN 的出现,让我们看到了 AI 在复杂问题求解方面的巨大潜力。

2025-03-21 11:07:10 863

原创 深入探讨AI Agent在2025年的发展

AI Agent是一个能够推理问题、制定计划并使用工具执行任务的系统。

2025-03-20 10:59:05 539

原创 融合LSTM与Transformer做时间序列预测,发高分轻轻松松!

不仅巧妙融合了二者的优势,还构建了一个强大而灵活的预测框架,为我们处理复杂时间序列数据提供了更牛x的工具。这方向如今是深度学习领域的热门研究主题,前景非常可观,在工业物联网(如设备故障预警)、智慧城市(如交通流量预测)、生物医学、环境科学(如气象预测)等领域都有广泛应用。相关成果频繁发表于顶会顶刊,尤其是跨学科相关的。

2025-03-20 10:53:10 884

原创 为什么说Agentic RAG是RAG领域的王者?

我们了解RAG的核心思想是将检索机制与大模型相结合,通过动态检索外部知识库来增强模型的生成能力,并生成上下文相关且准确的响应。RAG突破了目前大模型的静态知识限制,拓展了大模型开启了“生成+检索”协同工作的新范式。

2025-03-20 10:50:48 753

原创 用LangChain还是LangGraph?官方终于站出来表态了

这使得 LangChain 更容易应用于简单的使用场景。而 LangGraph 则允许。

2025-03-19 21:25:17 969

原创 Nature最新!AI药物发现:从35亿化合物中快速筛选目标分子成本减少1000倍

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。:为了优化超大规模库的性能,进一步分析了包含2.35亿化合物的ZINC15库的数据集,重点关注两个基准蛋白(A2AR和D2R)。对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

2025-03-19 21:23:30 938

原创 EMNLP 24|EDC:基于大模型的知识图谱构建

许多实际应用中,用户可能没有预定义模式,但希望自动构建高质量KG。现有方法无法动态生成模式,导致冗余和歧义(如“职业”可能被表达为“job”“occupation”等不同形式)。

2025-03-19 21:22:37 652

原创 论文浅尝 | 综述:关于不同种类知识图谱的推理研究(IEEE TPAMI 2024)

综述文章中基于双层分类体系,系统地回顾了现有的知识图谱推理(KGR)模型。顶层分类为图类型(包括静态、时序和多模态知识图谱),底层分类为技术和场景。文章中涵盖了三种图类型、十四种技术和四种推理场景,为知识图谱推理提供了系统的综述。此外,还总结了知识图谱推理面临的挑战,并指出了潜在的发展机遇,以启发读者。为了方便研究,社区在GitHub上共享了221个最先进的KGR模型(包括论文和代码)以及69个典型数据集的集合。

2025-03-18 15:38:57 1019

原创 基于AI大模型的智能工厂建设方案

1.1 智能工厂定义与特征1.1.1 高度自动化与智能化智能工厂通过先进的自动化设备和机器人技术,实现生产过程的高度自动化,减少人工干预,提高生产效率和产品质量。例如,自动化流水线能够精准地完成零部件的组装,机器人可以24小时不间断工作,确保生产过程的连续性和稳定性。1.1.2 数据驱动与灵活生产利用物联网、大数据分析和人工智能技术,实时收集生产数据并进行智能化决策,优化生产流程和资源利用。智能工厂能够快速调整生产线,满足小批量、多品种的生产需求,适应市场多样化的变化。

2025-03-18 15:31:15 660

原创 Nature文章速递!光子计算新突破:非对称训练法破解深度光子神经网络训练难题!

光子神经网络(PNN)作为具有高速传播特性和高带宽特性的新型范式,旨在通过更高效率和更低成本实现可复现的神经网络加速。然而,PNN训练因器件间差异和系统间差异导致的网络状态认知偏差而极具挑战性。尽管基于反向传播(BP)的训练算法凭借其鲁棒性、通用性和快速梯度收敛特性,已成为数字训练领域的行业标准,但现有PNN-BP方法仍严重依赖精确的中间状态提取,且训练深度光子神经网络(DPNN)时需消耗大量计算资源。光子信号传播的截断特性和计算开销问题制约了DPNN的运行效率,并增加了系统构建成本。

2025-03-18 15:27:48 658

原创 从快思考到慢思考综述:AI如何实现人类般的推理能力?

OpenAI和DeepSeek近期的革命性模型,揭示了AI迈向深度思考的关键路径想一想:你是如何解决复杂问题的?是立即做出直觉判断,还是会停下来,一步步分析推理?人类大脑在面对不同任务时,会自动切换"快思考"和"慢思考"两种模式。而如今,AI正在经历一场从"快速直觉"到"深度思考"的革命性转变。

2025-03-17 21:13:47 666

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除