自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(981)
  • 收藏
  • 关注

原创 2024终极指南:AI大模型从入门到精通

AI大模型是指使用大规模数据和强大的计算能力训练出来的人工智能模型。这些模型通常具有高度的准确性和泛化能力,可以应用于各种领域,如自然语言处理、图像识别、语音识别等。

2024-07-05 16:42:03 2246

原创 OpenAI最强大模型ChatGPT-4o,论文降重小技巧,国内直接使用

写论文的时候,免不了要引经据典,要引用名人的话,要引用名人的故事,要使用公式,要把定义写明白,这些内容就决定了你的论文有着居高不下的重复率,甚至是后期无论如何怎么修改,都无法撼动改变一点点这个恼人的数字。因为你要知道,论文,老师是看你给他发的第一稿,而不是查重前的第一稿,你即使内容修改,但是愿意还在,就没有问题。不过,删除法的前提是你的论文字数足够多,假设学校的要求是4万字及以上,那么,写了五万字的你就可以通过这一方法降重。系统现在对于表格的检测还不完善,在表格中重合的字数是不计入到总的重合率中的。

2024-06-28 10:55:19 2539

原创 AGI大模型学习路线(超全面!超详细!)收藏这一篇就够了!

在深度学习领域,"大模型"通常指的是模型参数数量庞大、拥有深层结构的神经网络。这些模型的规模通常表现为网络中的参数数量,即模型中需要学习的权重和偏置的数量。具体来说,大模型可能包含数百万到数十亿的参数。

2025-04-01 15:33:32 910

原创 5分钟速成:大模型RAG(检索、增强、生成)轻松掌握!

因为这个行业不同于其他行业,知识体系实在是过于庞大,知识更新也非常快。作为一个普通人,无法全部学完,所以我们在提升技术的时候,首先需要明确一个目标,然后制定好完整的计划,同时找到好的学习方法,这样才能更快的提升自己。这份完整版的大模型 AI 学习资料已经上传优快云,朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费。

2025-04-01 14:39:53 462

原创 Cursor与Cline终极对决:商业VS开源,AI编程工具谁将引领未来?

随着2024年AI代码编辑器的崛起,软件开发者的工作效率得到了显著提升。在众多AI编程工具中,Cursor和Cline分别代表了商业和开源领域的两大领导者。Cursor作为一款付费工具,以其精细化的功能和高效的性能广受欢迎;而Cline作为开源工具,凭借强大的扩展性和零成本优势也受到不少开发者的青睐。那么,Cursor与Cline到底谁更强?国外知名网友Marvijo通过评测给出了答案,本文将基于该评测对两款工具进行全面比较,并探讨其优缺点。Cursor。

2025-04-01 14:37:46 404

原创 YiXin-Distill-Qwen-72B推理模型开箱实测:最新开源技术深度体验!

本文带大家本地部署并实测了 YiXin 最新开源的推理模型。体感非常棒,强烈推荐有需求的朋友去试下~效果媲美主流大厂模型,推理方面甚有超越。此外,72B 的尺寸很好平衡了通用能力和推理能力,作为垂直领域应用的基座模型,基于私有数据进行微调,香的很!

2025-04-01 14:34:24 494

原创 开源项目震撼发布:几分钟创建AI Agent,事件驱动工作流NB框架!

Motia主要面向需要自动化任务的软件工程师,特别是那些涉及 AI 代理和后端自动化的场景。它的核心是事件驱动架构,允许开发者通过定义步骤、流程、事件和主题来构建灵活、可扩展、可视化的工作流。

2025-04-01 14:31:48 398

原创 35程序员转行做大模型,可以选择哪些岗位,大模型这波红利首先吃到的程序员!

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

2025-03-31 19:54:51 814

原创 【AI大模型】应用开发秘籍:零基础入门到精通,一篇文章掌握全部!

1、了解大模型能做什么2、整体了解大模型应用开发技术栈3、浅尝OpenAI API的调用AI全栈工程师:懂AI、懂编程、懂业务的超级个体,会是AGI(Artificial General Intelligence 通用人工智能)时代最重要的人。

2025-03-31 19:52:24 439

原创 浙江大学揭秘:从大模型到产业大脑,61页AI应用系统构建指南免费下载!

根据报告的内容,本文主要概括了以下几个关键点:1、大模型推理能力快速提升:从早期的基于规则的少量数据处理,到模仿人脑进行大量数据的标记和训练,再到对人类学习过程的重点关注,大模型经历了多个发展阶段。2022年,ChatGPT的发布标志着对话式AI进入大众应用阶段。2023-2024年,OpenAI的o系列模型和DeepSeek-R1等模型在数学和代码推理任务上取得了突破性进展。2、推理模型和思维链(CoT):自动化思维链(CoT)的实现是新一代大模型的精髓之一。

2025-03-31 19:49:57 433

原创 深度学习必须掌握的五大算法模型

在深度学习技术日新月异的今天,掌握具有里程碑意义的五大核心算法架构,是突破技术瓶颈与拓展应用场景的关键。一、卷积特征提取网络(CNN)核心机制:通过多层级联的卷积核在输入矩阵上执行滑动窗口运算,形成特征响应图谱。核心模块包含:特征映射层:采用局部感受野提取纹理、边缘等空间模式降维采样层:通过最大/平均池化保留显著特征全局推理层:将空间特征编码为抽象语义向量技术优势:√ 具备平移不变性特征学习能力,适应图像/视频等规则网格数据。

2025-03-31 19:48:11 640

原创 阿里面试题合集-SFT系列【大模型面试】

微调是一种有监督的技术手段,是在已具备广泛知识基础的大型预训练语言模型上,利用针对性的数据集实施额外的训练过程,旨在使模型更精准地契合特定任务需求或深入某一专业领域。微调的核心目标在于实现知识的精细化灌输与指令系统的精确匹配,所以 SFT 的重点是学习样式和指令,而非知识注入。当前实践中,微调主要分为全参数微调和部分参数微调,下面详细说一下这两个方式的特点和技巧。01 全参数微调有什么技巧?主要是利用小学习率的方式,对大模型的全参数进行调整,以使其完全适应特定领域或任务。

2025-03-31 19:42:08 524

原创 大模型学习必备!12本精选书籍(附PDF版),助你少走一半弯路!你想要看的大模型书籍全都在这里!

随着AI在越来越多的行业被应用,AI赋能的价值逐步体现出来。本书从AI的本质出发,介绍AI技术过往的发展历程和最新的理论成果,然后讲解如何站在移动互联网和大数据的基础上,系统地学习、应用AI技术。本书希望向读者提供学习AI技术的资料、路径,以及打磨AI产品的观点、思路。此外,本书通过介绍笔者接触、打磨AI产品的实际经历,给大家指出AI赋能过程中需要避免的“坑”,期待我们在AI时代共同发展自己、发展生活,在未来遇到更好的AI产品、更好的自己。

2025-03-30 19:36:13 1076

原创 揭秘DeepSeek:4000字深度解析其革命性蒸馏技术!

模型蒸馏(Knowledge Distillation)是一种将大型复杂模型(教师模型)的知识迁移到小型高效模型(学生模型)的技术。其核心目标是在保持模型性能的同时,显著降低模型的计算复杂度和存储需求,使其更适合在资源受限的环境中部署。在机器学习中,模型蒸馏是一种优化技术,通过模仿教师模型的输出,训练一个较小的学生模型,从而实现知识的传递。教师模型通常具有较高的性能,但计算成本高昂,而学生模型则更加轻量级,推理速度更快,且内存占用更少。

2025-03-30 19:33:30 832

原创 DeepSeek全链图谱:15细分领域+151家公司|附16页文件下载

本文提供完整版报告下载,请查看文后提示。......文│华创证券。

2025-03-30 19:30:09 256

原创 3.4KStar 字节跳动扔出王炸LangManus,自动编程+爬虫二合一

LangManus 实现了一个分层的多智能体系统,其中有一个主管智能体协调专门的智能体来完成复杂任务. 其中:Qwen:提供开源语言模型Tavily:提供搜索能力Jina:提供网络爬虫技术Browser-use:提供浏览器控制能力LangChain:支撑 LLM 交互和链式操作LangGraph:为复杂多智能体编排提供支持LangManus 使用三层 LLM 系统,分别用于推理、基础任务和视觉语言任务。

2025-03-30 19:28:14 614 1

原创 2025风口指南:万字长文带你吃透大模型Agent,涵盖应用、场景与发展

•网址: https://www.langchain.com•功能: 构建基于LLM的应用程序,提供链式调用、工具整合和代理功能AutoGen•网址: https://microsoft.github.io/autogen•功能: 多代理对话框架,支持代理间协作LlamaIndex•网址: https://www.llamaindex.ai•功能: 数据连接和检索增强框架CrewAI•网址: https://www.crewai.io•功能: 协作代理框架,专注于角色分配和工作流XAgent。

2025-03-30 19:26:07 643

原创 大模型学习路线(2025最新)从零基础入门到精通,看完这一篇就够了

通过以上七个阶段的学习,您将能够建立起对大规模预训练模型的深刻理解,并掌握其在实际应用中的技巧。记得在学习过程中保持好奇心和探索精神,积极尝试新技术并参与社区讨论。希望这份学习路线图能帮助您成功踏上大规模模型的学习之旅!如果您对某个特定阶段或主题有更详细的问题,欢迎随时提问!

2025-03-29 16:53:57 1011

原创 快速教程:10分钟内将大模型私有化部署到本地!

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

2025-03-29 16:32:17 535

原创 智变·2025:互联网AI应用元年|附63页文件下载

我们认为以 DeepSeek引领中国AI大模型在模型性能、成本效用上实现突破开始,到阿里、字节、腾讯等大厂以capex开启新一轮科技基建周期,再到Manus等下游AI应用引起广泛讨论,2025年开始中国互联网AI或进入元年。AI模型层面,国内头部模型与海外差距正在日益缩小,在本就繁荣的消费互联网应用层或将迎来产品的百花齐放和商业化落地的全新机遇。基于此,我们提出全生态互联网大厂+“小而美”垂类赛道的两大投资主线,看好互联网大厂们以创新能力、执行力和企业家精神再次成为AI时代领头羊。......

2025-03-29 16:27:37 533

原创 Transformer | 一文了解:缩放、批量、多头、掩码、交叉注意力机制(Attention)

但是对于基础的Attention算法的细节整理的不够详细,今天这篇文章填补上这一点,并利用纯Python和Numpy实现注意力模块,并解释了整个过程中的所有向量维度的变化,对刚入门的新手非常友好。在下文中,NH代表头的数量,HS代表头的大小。将一个(B,N,D)数组乘以(D,HS)会在第一个数组的最后一维和第二个数组的第一维之间进行收缩,结果为(B,N,HS)。Q、K和V最初是(B,N,D),因此通过首先将D拆分成(NH,HS),然后改变维度的顺序,将它们重塑成更方便的形状,得到(B,NH,N,HS)。

2025-03-29 16:25:09 985

原创 MDTeamGPT:一种基于大模型的自进化多学科团队医疗咨询多智能体框架

大型语言模型(LLMs)已在各个领域取得了显著进展。然而,在多学科团队(MDT)医疗咨询中仍存在挑战。当前研究通过角色分配、任务分解和积累医学经验来增强推理能力。MDT咨询中的多角色合作往往导致过长的对话历史。这增加了模型的认知负担,并降低了效率和准确性。一些方法仅存储治疗历史。它们不提取有效经验或反思错误。这限制了知识泛化和系统进化。我们提出了一种基于LLMs的多智能体MDT医疗咨询框架来解决这些问题。我们的框架采用共识聚合和残差讨论结构进行多轮咨询。

2025-03-29 16:19:17 727

原创 【AI产品经理必看】AI产品经理需要哪些必备技能?如何成为AI产品经理?

回答这个问题前我们首先得理清楚什么是AI产品经理,它和传统的互联网产品经理有什么区别。主要职责一方面是规划如何将成熟的AI技术应用在各个领域不同场景中,提升原有场景的效率或效果等;另一方面是基于业务方的需求如何用现有的AI技术或者AI技术组合予以实现,甚至有可能联合技术团队孵化新的AI软件解决方案或者AI硬件产品。AI产品经理本身也只是产品经理的一种,并没有什么特殊性。只是这些年AI相对比较火,理解AI技术需要一定的技术门槛,和传统的交互产品经理、系统产品经理等对比起来入门门槛更高。

2025-03-28 16:49:55 1076

原创 智能客服系统搭建实战:从零到一,AI智能客服完全指南!

AI智能客服是新一代的智能化在线客服系统,它在传统的客服功能基础上,加入了大量的AI算法逻辑,实现了智能接待、自动客户资源获取、智能资源流动和分配的效果。• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。网上虽然也有很多的学习资源,但基本上都残缺不全的,这是我自己整理的大模型视频教程,上面路线图的每一个知识点,我都有配套的视频讲解。

2025-03-28 16:21:48 903

原创 大模型Dify(Agent + RAG)完全指南:一篇文章彻底掌握!

等,无需深入底层技术细节。2、 模块化设计:Dify采用模块化的设计,

2025-03-28 16:20:02 1103

原创 2024年中国人工智能产业研究报告|附51页文件下载

作为新一轮科技革命和产业变革的核心引擎,人工智能产业在2024年被中央及各地政府确立为重点发展方向,陆续出台了一系列针对性强、力度大的政策措施,旨在推动产业创新,提升区域经济的科技竞争力。经过多年持续投资布局,我国人工智能产业体系逐步完善,基础层、模型层及应用层不断升级优化,实现了人工智能、大数据等数据智能技术与实体经济的广泛融合。......文│艾瑞咨询。

2025-03-28 16:17:25 564

原创 AI大模型进医疗新突破:RadOnc-GPT帮助临床团队减轻医患沟通负担的深度分析

该图展示了从患者查询和临床团队回复的提取,到RadOnc-GPT生成回复,再到随机化评估数据集的创建过程,以及最终的NLP定量评估和临床人员单盲评分的完整流程。研究团队从Mayo诊所放射肿瘤科的in-basket消息数据库中筛选出90名非转移性前列腺癌患者,最终选取了158条患者询问及其对应的临床团队回复。通过这些患者询问,RadOnc-GPT生成了158条回复。

2025-03-28 16:15:52 597

原创 阿里开源Qwen2.5-Omni全模态模型,7B拿下全球第一

又是深夜,中国源神再次出击。今天凌晨1点,阿里发布了他们最新的全模态模型——Qwen2.5-Omni-7B。在OmniBench多模态基准上刷新了世界纪录,在seed-tts-eval语音生成基准上更是直接媲美人类水平。新模型发布不到12个小时,已经在huggingface上冲到了前六。不是,这Qwen2.5-Omni到底什么东西,一下子这么NB了?我仔细看了他们的技术论文,Omni就是全能的意思,全模态是指模型能够自适应文本、图像、音频和视频等多模态输入,并实时输出文本与语音。

2025-03-28 16:12:18 956

原创 LLM大模型学习指南:快速入门路径与持续更新教程!【AI大模型教程】

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

2025-03-27 16:19:29 948

原创 Deepseek入门指南:全网最详细,新手小白必备,建议收藏学习!

春节期间,Deepseek发布R1 模型,在推理和数学方面超越OpenAI O1 模型,关键还免费开源。小编体验了一下,比如说关于电影神话故事的分析,制作美食等等内容,它都回答的游刃有余。网络上有很多教程,有专业的还有行业应用,那么今天就教大家从0到1怎么使用它。以及怎么本地部署。最简单就是网页使用。打开网页,或者在应用商店搜索下载App。深度思考】,就是R1的推理模型,可以自动思考。联网搜索】,就可以搜索到最近最新的内容,特别是查看最新的新闻。

2025-03-27 16:17:38 385

原创 大模型面经 - 字节,差点就hold不住了

整体来说面试还是有一些难度的,还是要好好准备。

2025-03-27 16:15:45 864

原创 OpenAI采用Anthropic协议,MCP一夜爆红!Karpathy:是时候冷静思考了

Altman 确认采用Anthropic 的 MCP 协议美国当地时间 3 月 26 日,OpenAI CEO Sam Altman 在 X(原 Twitter)帖子中确认,OpenAI 将在旗下产品(包括 ChatGPT 桌面应用)中集成 Anthropic 的模型上下文协议(MCP)。Altman 指出,“MCP 的市场反响很好,我们也很高兴能在自家产品中支持这项协议。

2025-03-27 16:13:48 830

原创 AI Agent 今年大爆发,打工人该何去何从?

Manus AI 作为通用 Agent的初步探索,虽然还有些不成熟,但它让更多人见识到 Agent 模式下的无限可能。相比过去只能输出一段文本或一张图片的 AI,Agent 已经踏上了独立行动、跨工具完成任务的新赛道。未来,能自动反思、自主学习的 Agent 产品将进一步涌现,让我们在执行复杂工作时更加得心应手。最后,为大家推荐一份网上疯传的DeepSeek系列教程,全部6个清华+2个北大+浙大+厦大版,都给你打包好,直接领取。

2025-03-27 16:11:16 539

原创 AGI大模型学习路线:清华大学196小时讲完的AI大模型教程(LLM)零基础入门到精通全套教程_大模型学习路线

自学AI大模型需要扎实的基础知识、系统的学习路线和持续的实践与探索。希望这条学习路线能为新手小白们提供一个清晰的方向,帮助大家更好地进入和发展在AI大模型领域。祝大家学习顺利,早日成为AI领域的专家!​。

2025-03-26 15:41:17 975

原创 Dify全面指南:从安装到使用,一步到位的详细教程!

Dify是一个开源的LLM应用开发平台,今天咱们详细介绍下Dify的安装步骤和使用场景。

2025-03-26 15:37:50 1209

原创 4 月份,可能有一场大模型混战!

4月份可能有一场大模型混战。这两天刷到个帖子,有人咨询 QwQ Max 的问题,郑楚杰说他们正在忙着训练Qwen3。去年 9 月份发布了 Qwen2.5,到现在也有半年时间了,猜测估计4月份可能就发布。然后 Meta 前一阵确定了 Llama 开发者大会的时间是 4 月 29 日,感觉整个 2025 年,这个时间发布 Llama4 是最好的。据说 Llama 4 强化了语音能力,以方便和 Meta 的智能设备结合。

2025-03-26 15:34:24 241

原创 Qwen开源,牛了

Qwen2.5-VL-32B 开源,等了一天,一丁点用户体验的帖子都没有。32B的性能,打败上一代72B VL。deepseek出马,Qwen成牛夫人了。可能大伙更期待Qwen3开源了。只希望不会再次撞枪R2开源。博客: https://qwenlm.github.io/blog/qwen2.5-vl-32b/Qwen 聊天: https://chat.qwen.ai。

2025-03-26 15:32:37 552

原创 Dify+Ollama+Deepseek+BGE-M3来搭建本地知识库实操

智能体(Al Agent)是大模型与业务应用的桥梁,智能体=大模型+知识库+业务系统API+工作流编排。

2025-03-26 15:31:00 705

原创 《金融银行DeepSeek全场景落地使用指南》2227页,全网独家首发!

最近很多银行的朋友反馈很焦虑随着四大行宣布接入 DeepSeek 后,其他银行也纷纷加入 AI 数智化阵营,接入 AI 大模型似乎成了一道摆在所有银行面前的必答题。👇接下来,带领大家一起来解题。有朋友会问?你不会又开始讲大模型底层吧?不会又提深度学习、神经网络、算力参数……阿社,你的路走窄了好吧,今天只讲各位“领导”想听的干货,那些底层的科技,本文一笔带过。早在20年前,互联网的浪潮冲破信息枷锁的桎梏,不可抵挡地冲破新时代的大门,席卷了企业所有的传统工序,信息化、数字化逐渐成了企业的基石。

2025-03-26 15:29:26 733

原创 从这篇开始,2025年最新最全AI产品经理学习资源!【从零基础到精通】AI产品经理学习路线(非常详细)

市面上不同的公司对产品经理的定位有很大的差别,一名合格的产品经理是能对软件产品整个生命周期负责的人。AI产品经理和通用型软件产品经理的底层思考框架是一样的,都是要经历产品立项、需求分析、产品设计、产品执行管理(研发测试)、验收、分析迭代这几个阶段。:通用型产品经理,只需要把业务流程、痛点理清楚,在进行逻辑处理、界面流程化,软件化即可。而AI产品是AI技术为出发点,为各行各业提供全新的解决方案,甚至会变更原来的业务流程和使用方式。人工智能已经成为国家的重点发展方向之一,各行各业也加入到AI这个大家庭。

2025-03-25 10:22:00 1218

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除