自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1011)
  • 收藏
  • 关注

原创 DeepSeek本地部署+投喂数据训练AI教程!!

DeepSeek-R1,是深度求索(DeepSeek)研发的推理模型,本地部署后完全免费,无使用次数限制。DeepSeek-R1采用的大规模强化学习技术,尤其擅长数学、代码和自然语言推理等复杂任务。DeepSeek-R1系列模型(1.5b~671b)开源且免费,进一步降低了AI应用门槛,赋能开源社区发展。使用教程❶Win版安装教程(Ollama+AnythingLLM安装、DeepSeek模型下载)❷Mac版安装教程(Ollama+AnythingLLM安装、DeepSeek模型下载)

2025-02-05 13:49:42 135439 20

原创 【手把手教你】搭建私有大模型+私有知识库

就是把目前最流行的开源大模型部署到自己的电脑上,无需联网、也不用买会员,隐私可不会泄露,直接可以和AI聊天。就是你可以把你喜欢的资料统统喂给大模型,然后让AI查询你指定的材料,再来回复你的问题。若是在公司搭建这套组合,可以把公司的介绍、产品数据、销售数据等等都发给私有大模型,回复用户的信息就更有针对性。大模型搭建已经分享过了,就不在此赘述,直接进入主题,知识库搭建。AnthingLLM可以直接在其界面上对话,导入各种形式的资料。也可以把本地AI大模型和知识库做成接口API,在企业的其他应用里面去调用。

2024-12-09 17:49:19 3879

原创 【人工智能】未来已来,国内10家AI大模型盘点

阿里达摩院推出的大模型,拥有千亿参数,可用于智能问答、知识检索、文案创作等场景。

2024-06-14 11:24:11 7250

原创 Llama3微调教程:超简单,人人都可以打造属于自己的GPT!

本教程详细介绍了如何使用Unsloth和Google Colab环境对Llama 3进行微调。使用Colab基本上是无脑点击运行就好了。经过这个教程,我们发现微调模型主要有三个核心环节:数据准备,这一步决定了质量;模型训练,这一步硬件资源决定了时间;模型测试,因为我们初步体验,所以比较简略,后续可以进一步探讨。通过本教程,即使是AI领域的新手也能够掌握大模型的微调技术。Unsloth不仅降低了技术门槛,也为个人和小团队提供了强大的工具。如果还有问题,可以查看我的notebook或者进群讨论。

2024-05-29 17:45:59 10956 2

原创 『保姆级』大模型教程来了(从入门到实战)

在大模型的构建之下,AI自动化交互,将会决定世界的未来,谁的大模型更强大,将决定在遥远的未来的话语权,同时,大模型会成为AI基础设施。AI大模型,正在构建的颠覆力,为了更好的入局AI大模型,🔻 针对ChatGLM大模型,介绍ChatGLM模型微调。🔻 大模型的定义和特点,如预训练、微调、指令学习等。🔻 05 精读大模型-3论文、Instruct论文。🔻 04 GLM-130B训练营——论文泛读。🔻 05 GLM-130B训练营——论文精读。🔻 08 Alpaca训练营——论文精读。

2024-04-01 17:50:11 5506

原创 重磅!340页PPT!互联网女王Mary Meeker《2025 AI趋势报告》完整版发布,这十大趋势将颠覆未来!

北京时间6月3日凌晨,科技圈迎来了一年一度的“朝圣时刻”。被誉为“互联网女王”的Mary Meeker及其团队Bond Capital,正式发布了备受瞩目的《2025年人工智能趋势报告》(AI Trends 2025)。与往年的《互联网趋势报告》不同,今年的报告完全聚焦于人工智能。这份长达340页的PPT,以前所未有的深度和广度,全景式地描绘了AI技术如何以前所未有的速度重塑全球经济、社会结构和地缘政治版图。这不仅是一份报告,更是一份预示未来的行动指南。

2025-06-15 13:15:00 368

原创 AI能力图谱全解:AI产品经理构建智能产品的核心认知框架

在AI驱动的时代,产品经理如何不再只是“对接需求的人”,而是成为连接技术与业务的桥梁,设计真正有“智能”的产品?答案就是:掌握一张全面、系统的AI能力图谱。它不仅是一张技术地图,更是一份通向AI产品成功落地的思维工具箱。本文将逐层深入,从产品落地的视角彻底解读这张图谱,帮助你理解它为何是AI产品经理的核心能力之一。

2025-06-15 12:45:00 376

原创 如果你正在研究RAG,那么这10个开源框架非常值得一看!

检索增强生成(RAG)已成为增强大型语言模型能力的一种强大技术。RAG 框架结合了基于检索系统的优点与生成模型的能力,使得响应更加准确、上下文相关且实时更新。随着对复杂 AI 解决方案需求的增长,GitHub 上涌现出众多开源 RAG 框架,每个框架都提供了独特的特性和能力。

2025-06-13 15:49:42 728

原创 一图胜千言!AI大模型应用架构全景图(建议收藏)

接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。所以我综合了大模型的所有知识点,给大家带来一套。我们这套大模型资料呢,会从。

2025-06-13 15:46:43 392

原创 什么是检索增强生成 (RAG)?简单易懂,一文说清其组成和作用原理

在LLM(大型语言模型)新时代的到来之前,我们通常会通过简单的微调来使用新数据扩展模型的能力。然而,如今我们使用的模型规模越来越大,训练所使用的数据量也随之增加,仅仅依赖微调已经无法满足大部分场景的需求。微调虽然在调整模型的语气和风格方面表现出色,但在向模型添加大量新知识时,其效果就显得乏力了。

2025-06-12 14:29:20 1010

原创 北京大学:AI Agent与Agentic AI原理与应用(附221页PPT下载)

今天分享的报告是《2025年AI Agent与Agentic AI原理与应用报告》,版权归北京大学所有。本文主要介绍了AI Agent与Agentic AI的原理与应用。AI Agent是一种具备环境感知、智能决策乃至自主行动能力的智能实体,而Agentic AI则是追求更高阶的智能,强调AI系统的自主性、目标驱动、环境交互和学习能力。

2025-06-12 14:22:30 874

原创 AI大模型时代的人才画像:这些岗位核心能力你具备了吗?

自OpenAI发布ChatGPT以来,AI大模型产业在全球范围内迅速崛起,引发了前所未有的关注。2024年,被业内公认为大模型应用的元年,众多大模型科技公司如雨后春笋般涌现,这不仅体现在产业的蓬勃发展上,也在人才需求方面引发了深刻变革。2024年9月,工业和信息化部人才交流中心更是发布《大模型技术与应用产业人才岗位能力要求》文件,为各企业在大模型技术与应用产业的人才培养、评价、招聘以及引进等方面提供了明确的指导方向。

2025-06-11 15:05:20 1040

原创 智能体开发框架:一文讲清楚Langgraph基础流程和理论梳理

在大模型技术的应用过程中,智能体算是一个主要的技术方向;如果说把大模型比作人的大脑,那么智能体就是人的手和脚;大脑能够思考,但具体的事情还是需要手和脚才能做。

2025-06-11 15:01:26 886

原创 2025大模型2.0产业发展报告:商业落地创涌而现(附65页PDF下载)

近几年,大模型超越了人工智能过去几十年的发展速度。正因如此,大模型也正在引领着以人工智能为代表的新一代信息技术深入到人类的社会生活和经济发展。从技术萌芽到产业应用,是一次巨大的技术跃升,大模型技术也是如此,这也是我们这一产业发展报告的价值所在。

2025-06-10 14:45:32 811

原创 深度解析 Qwen3 Embedding:基于大模型的文本嵌入与重排序技术突破

在自然语言处理与信息检索领域,文本嵌入与重排序技术始终是支撑搜索引擎、问答系统、推荐系统等核心应用的底层基石。随着大语言模型(LLM)的快速发展,如何将其强大的语义理解能力注入传统嵌入与重排序框架,成为学术界与工业界共同探索的前沿方向。近日,阿里巴巴通义实验室的研究员们提出了基于Qwen3大模型的新一代文本嵌入与重排序模型系列,在多语言语义表征、复杂指令理解及跨模态检索等任务上实现了突破性进展。

2025-06-10 14:44:04 725

原创 2025年大模型2.0产业发展报告-商业落地创涌而现|附67页文件下载

本报告通过对我国大模型及人工智能产业发展进行了全景式扫描,并通过大模型的实际应用现状分析,提出了大模型发展2.0的产业论断,并对大模型的产业和行业应用提出了具体的方法论,对我国的大模型产业发展总结了经验。

2025-06-09 15:59:32 381

原创 从零用 Python 构建 200 万参数推理型 LLM(含预训练、SFT、RLHF 全流程)

你可能已经看过很多关于用 Transformer 架构训练大模型的文章了。但现在,像 OpenAI 的 o3、谷歌的 Gemini 2.5 Pro,以及国内开源表现亮眼的 DeepSeek-R1 等新一代模型,已经不仅仅是在“给答案”,而是能像人一样,先思考、再回答。那么问题来了:我们能不能自己动手打造一个“会思考”的推理型 LLM?

2025-06-09 15:04:01 1476

原创 中国信通院 | “机器人+人工智能”工业应用研究报告 2025(附下载)

本报告分为研究背景、技术趋势分析、应用现状分析和前景展望四个部分。首先,从技术突破、大国竞争和市场前景三个角度,分析“机器人+人工智能”工业应用的发展背景;其次,从技术趋势的角度,回顾人工智能与机器人融合的三大技术方向,分析在人工智能大模型推动下,以人形机器人为代表的具身智能技术的前沿进展;接着,从应用场景的角度,通过全球88个案例分析“机器人+人工智能”在典型场景、行业中应用情况;最后,从技术、产品和应用三个方面,展望“机器人+人工智能”在工业场景中的应用前景。

2025-06-07 15:13:15 557

原创 智能体框架怎么选?LangChain、Dify、CrewAI、AutoGen五大框架横向对比

智能体定制开发,选择框架是第一步。

2025-06-07 15:10:08 1053

原创 Ollama 五月更新解读:多模态、工具调用、模型思考,AI 本地化再进一步!

五月对于 Ollama 社区来说是激动人心的一个月!这个致力于让每个人都能轻松在本地运行强大AI模型的开源项目,在短短几周内接连发布了三项重大更新,极大地扩展了其功能和用户体验。如果你关注本地化 AI 的发展,或者已经是 Ollama 的忠实用户,那么这些新特性绝对不容错过。让我们一起来看看 Ollama 在这个五月都为我们带来了哪些惊喜。

2025-06-06 14:55:34 755

原创 全网最全,一文全面汇总大模型技术生态!

大语言模型(Large Language Model, LLM)是人工智能领域的核心技术,基于Transformer架构,通过海量数据预训练和微调,实现对自然语言的深度理解与生成能力。其核心原理包含以下关键要素:

2025-06-06 14:51:59 586

原创 【一文看懂】大白话解释大模型的技术原理,为什么它那么聪明?

在人工智能领域,大模型已然成为炙手可热的明星,它能写诗作画、答疑解惑,甚至辅助科研,仿佛拥有无穷智慧。那么,大模型究竟是什么?它又为何如此聪明?接下来,就让我们用通俗易懂的语言,层层揭开大模型的神秘面纱。

2025-06-05 15:30:16 931

原创 一文读懂大模型在客户服务中的场景应用和架构

在数字化转型的浪潮中,客户服务领域正迎来一场颠覆性的变革。而大模型技术的崛起,不仅仅是技术的突破,更为各行各业开辟了全新的可能性。想象一下,您的客户问题能够被瞬间识别、精准解答;繁琐的客服流程被大幅简化,企业运营效率大幅提升。这一切都指向一个全新的方向——“面向客户服务全场景的行业大模型”。今天,我们将带您一探究竟。

2025-06-05 15:14:21 588

原创 台大李宏毅2025最新AI Agent资料(96页PPT)| 附下载

本课件系统阐述了 AI Agent 的概念、技术演进、应用场景及关键能力。AI Agent 作为自主实现目标的智能体,从早期依赖强化学习转向以大型语言模型(LLM)为核心,通过 “观察 - 目标 - 行动” 框架处理复杂任务。课件通过棋类博弈、虚拟角色、电脑操作等多场景案例,展示其在不同领域的应用潜力,深入分析记忆管理、工具调用、计划制定等核心能力的技术细节与挑战,如记忆过载的过滤机制、工具错误的识别判断、长程规划的可靠性提升等。课件指出现有技术的优势与局限,展望了更自然的交互模式、优化的规划算法及记忆

2025-06-04 15:05:40 606

原创 Spring AI:Java开发者的智能应用神器,快速上手攻略!

你是否想过在Java应用中快速集成AI能力,却苦于不同厂商的接口差异和复杂的配置?Spring AI来啦!这个由Spring官方推出的开源框架,让Java开发者像搭积木一样轻松构建智能应用。无需深入底层细节,今天我们就用大白话,带你玩转Spring AI!

2025-06-04 14:57:18 660

原创 深度解析AI爬虫工具:crawl4ai、FireCrawl、Scrapegraph-ai、Jina、SearXNG、Tavily

在AI大模型时代,数据获取与处理是构建智能应用的核心环节。传统爬虫面临技术门槛高、反爬应对复杂、动态内容处理困难等挑战,而AI驱动的爬虫工具通过融合大语言模型(LLM)、图神经网络、自动化解析等技术,正在重塑数据抓取范式。本文将深度测评6款主流AI爬虫工具,从技术原理、核心功能、实战场景到性能对比,为开发者提供一站式选型指南。

2025-06-03 16:58:55 1385

原创 检索增强生成(RAG)是什么?一文详解RAG的工作原理!

检索增强生成(Retrieval-Augmented Generation,RAG)是指对大型语言模型输出进行优化,使其能够在生成响应之前引用训练数据来源之外的权威知识库。大型语言模型(LLM)用海量数据进行训练,使用数十亿个参数为回答问题、翻译语言和完成句子等任务生成原始输出。在LLM本就强大的功能基础上,RAG将其扩展为能访问特定领域或组织的内部知识库,所有这些都无需重新训练模型。这是一种经济高效地改进LLM输出的方法,让它在各种情境下都能保持相关性、准确性和实用性。

2025-06-03 16:48:22 809

原创 【玩转大模型的API】 2025年最全大模型API申请与调用实战指南!教你一键使用146个大模型

在人工智能迅猛发展的今天,大模型(如DeepSeek、文心一言、Claude等)已经成为各行各业创新的核心动力。作为开发者或产品经理,你是否也想快速接入这些强大的AI能力,却被繁琐的API申请流程和调用细节搞得头疼?别担心,今天我就带你从零开始,系统讲解大模型API的申请方法和实战调用技巧,一键助你轻松玩转AI接口!

2025-06-02 13:45:00 1293

原创 2025年金融行业大模型应用实践报告 ||(附下载方式)

《2025年金融行业大模型应用实践报告》是由容联云副总裁兼诸葛智能创始人孔淼撰写的一份深度报告,旨在探讨金融行业如何借助大模型技术实现从“场景探索”到“业务引擎”的跨越,推动数智化转型。

2025-06-02 12:45:00 1230

原创 大模型是什么?一文详解大模型的原理与应用领域!

大模型通常指的是大规模的人工智能模型,是一种基于深度学习技术,具有海量参数、强大的学习能力和泛化能力,能够处理和生成多种类型数据的人工智能模型

2025-05-31 10:00:00 691

原创 2025年AI时代的商业进化蓝图-CEIBS&增长黑盒 (附下载)

AI 技术正迅速改变商业环境,企业对 AI 的投入也不断增加。在这份报告中,详细探讨了 AI 在商业领域的应用与影响。首先,AI 已成为企业提升效率和创新能力的关键驱动力。通过自动化和智能化的流程,企业能够大幅提高生产效率,降低运营成本。同时,AI 还能帮助企业更好地分析市场数据,预测消费者行为,从而制定更精准的商业策略。其次,AI 时代的商业竞争格局正在发生深刻变化。那些能够快速适应并应用 AI 技术的企业,将在市场竞争中占据优势地位。报告指出,企业需要建立强大的数据基础设施,培养和吸引 AI

2025-05-31 07:30:00 664

原创 Manus AI智能体:AGI发展新范式的实践与测评报告(附PDF下载)

《Manus AI 智能体:AGI 发展新范式的实践与测评报告》聚焦 Manus AI 智能体在 AGI 发展中的探索。报告指出,该智能体基于创新架构,融合多种前沿技术,构建起强大的认知和决策体系。在实践应用中,它能灵活应对复杂任务,像在工业场景实现智能生产调度,有效提升生产效率;在服务领域,提供个性化、高效的服务体验。通过多维度严格测评,Manus AI 智能体在知识理解、推理能力和任务执行等方面表现出色,展现出接近人类水平的智能表现。不过,报告也指出其在复杂环境适应性、长期记忆稳定性等方面存在一定局

2025-05-30 14:14:57 680

原创 RAG有什么用?一文剖析RAG跨领域成功应用案例!

RAG技术不仅仅停留在理论层面,它已经在多个行业展现出巨大的应用潜力,并成功落地于各种实际场景中,赋能不同领域的智能化升级。本节将通过一些具体的案例,展示RAG是如何解决实际问题并创造价值的。

2025-05-30 14:03:49 1088

原创 2025 程序员转行做大模型:职业发展前景、可选岗位及选择策略

在科技飞速发展的 2025 年,大模型技术宛如一颗璀璨的新星,照亮了人工智能领域的天空,也为众多程序员提供了一个全新的职业发展方向。随着 DeepSeek 等技术的横空出世,大模型技术不断突破创新,AI 行业迎来了前所未有的热潮。对于许多程序员而言,这无疑是一个不容错过的转行良机。那么,2025 年程序员转行做大模型,职业发展前景究竟如何?又有哪些岗位可供选择?该如何做出合适的选择呢?

2025-05-29 16:35:07 794

原创 本地运行大模型的利器:Ollama架构和对话处理流程全解析

Ollama 是一个旨在快速运行大语言模型(LLM)的简便工具。通过 Ollama,用户无需复杂的环境配置,即可轻松与大语言模型进行交互。本文将分析 Ollama 的整体架构,并详细解释用户在与 Ollama 进行对话时的处理流程。

2025-05-29 16:27:41 840

原创 2025年大模型能力来源与边界报告-复旦大学 (附下载)

预训练是大模型能力的基础,通过对海量语料的统计分析,模型能够记忆知识并学习语义分布表示。例如,直接依据训练语料的统计,可计算出知识记忆概率,且模型准确率与语义互信息(SMI)呈高度正相关(R²>0.85)。这表明预训练使模型具备了知识存储的能力,为后续能力的发展奠定了基础。

2025-05-28 16:04:49 603

原创 大模型入门:一文详解算力与CPU、GPU、GPGPU、TPU、DPU

“算力准备是大模型私有化部署的必要前提,那什么是算力?大模型算力芯片的种类有哪些?”无论是大模型训练阶段还是推理阶段都需要强大的算力支撑,什么是“算力”?大模型所需要的算力有何特点?

2025-05-28 15:44:54 726

原创 一文讲明白所有RAG概念!附带完整RAG实践过程!

检索增强生成技术,通过「检索外部知识 + 大模型生成」的组合模式,让 AI 在回答时既能调用预训练知识,又能实时查询专属知识库,解决传统大模型 “幻觉” 和 “数据滞后” 问题。

2025-05-27 15:31:49 1454

原创 2025新质生产力:大模型在各医疗场景的赋能实践|附61页PDF文件下载

人工智能技术在医疗领域应用多年,大模型技术的出现为其应用价值和范围又带来了新的可能。2024年底爆火的国产开源语言大模型DeepSeek极大助力市场教育,将大模型在医疗场景的应用迫切度也提到历史新高点。医疗领域已经出现数百个垂直大模型应用于各个环节,企业从自身数据及市场优势出发自研专业大模型。产品虽众多,但是产品到商品还受政策、市场等影响。目前,医疗大模型在医疗领域的渗透率、应用情况、应用成果到底如何?本次报告,动脉智库联合成都高新区数智医疗创新联盟创作和发布,通过调研、访谈十余家创新企业、三家投资机构及数

2025-05-27 14:38:39 471

原创 2025年DeepSeek完全实用手册:技术原理、使用技巧、部署进展|附212页文件下载

本文主要介绍了DeepSeek模型的技术原理、使用技巧、部署进展以及趋势判断。DeepSeek是由杭州深度求索人工智能基础技术研究有限公司研发的开源大模型,包括V3对话模型和R1推理模型。V3模型采用混合专家架构,专注于多任务处理,而R1模型基于强化学习训练,专注于代码生成和复杂数学问题解决。DeepSeek模型已在我国地方政府、央企、地方国企以及智能终端中得到广泛部署,应用于智能问答、知识库、场景应用、智能决策、数据挖掘、智慧运维等多个领域。此外,本文还介绍了如何使用DeepSeek模型,包括独立使用和工

2025-05-26 14:29:49 759

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除