- 博客(986)
- 收藏
- 关注

原创 2024终极指南:AI大模型从入门到精通
AI大模型是指使用大规模数据和强大的计算能力训练出来的人工智能模型。这些模型通常具有高度的准确性和泛化能力,可以应用于各种领域,如自然语言处理、图像识别、语音识别等。
2024-07-05 16:42:03
2247

原创 OpenAI最强大模型ChatGPT-4o,论文降重小技巧,国内直接使用
写论文的时候,免不了要引经据典,要引用名人的话,要引用名人的故事,要使用公式,要把定义写明白,这些内容就决定了你的论文有着居高不下的重复率,甚至是后期无论如何怎么修改,都无法撼动改变一点点这个恼人的数字。因为你要知道,论文,老师是看你给他发的第一稿,而不是查重前的第一稿,你即使内容修改,但是愿意还在,就没有问题。不过,删除法的前提是你的论文字数足够多,假设学校的要求是4万字及以上,那么,写了五万字的你就可以通过这一方法降重。系统现在对于表格的检测还不完善,在表格中重合的字数是不计入到总的重合率中的。
2024-06-28 10:55:19
2546
原创 普通产品经理转AI产品经理,这是时代趋势,需要做哪些准备?_AI产品经理学习路线
我认为的Ai产品经理,其实它是在通用产品经理的基础上,增加了一个显著能力,就是如何运用现有的AI技术去帮助客户解决问题,并在原有工作效率,或用户体验上起到增强的效果。
2025-04-02 13:05:25
548
原创 大模型面试面经|大模型面试八股含答案,金三银四看我拷打面试官!
前面在4.中提到了Lora,我也曾在别的回答中提过Lora真是本世纪最美女名,因为真的是个人微调的一大福音。如果你想细致了解,可以看看这篇CW不要無聊的風格:当红炸子鸡 LoRA,是当代微调 LLMs 的正确姿势?我在这里也具体来讲讲:首先肯定是要搬上来这张图的:
2025-04-02 13:02:56
494
原创 Manus工作原理深度解析:揭秘下一代AI Agent多智能体架构的设计奥秘!
多智能体系统(MAS)指的是一群相互协作、各司其职的智能体共同完成任务。Manus正是基于这种理念构建起来的。:负责上网搜索最新信息,确保资料时效性和准确性。Code Agent:作为智能编程助手,能够快速编写、调试各类代码。:专注于数据挖掘和分析,将大量数据转换为有用信息。:在文本生成和语义理解上有着出色表现,为你提供高质量文案和报告。这些智能体相互协作,既能分工明确,又能无缝衔接,正如一支训练有素的乐队,各司其职又合奏出和谐的交响曲。
2025-04-02 13:00:32
474
原创 MIT液体神经网络LNN:Transformer后的新趋势,引领AI技术革新!
科学家受线虫微型大脑启发,研发出革命性19节点液态神经网络系统。这一脑启发的AI架构在自动驾驶控制任务中展现出惊人表现:仅用传统神经网络万分之一规模的神经元数量,即实现更优性能表现。该系统的核心优势在于其动态适应能力——不同于固定架构的传统模型,液态神经网络能在运行时持续学习并适应新数据流,展现出类脑的灵活性与环境交互能力。研究证实,我精心整理的的论文将为大家提供更全面的模型创新思路~
2025-04-02 12:57:49
462
原创 DeepSeek R1架构与训练过程全图解,一篇文章轻松掌握!
为了让一切变得简单,我们将使用手绘流程图和简单的计算来帮助从头开始澄清DeeoSeek-R1的核心概念。
2025-04-02 12:55:37
326
原创 AGI大模型学习路线(超全面!超详细!)收藏这一篇就够了!
在深度学习领域,"大模型"通常指的是模型参数数量庞大、拥有深层结构的神经网络。这些模型的规模通常表现为网络中的参数数量,即模型中需要学习的权重和偏置的数量。具体来说,大模型可能包含数百万到数十亿的参数。
2025-04-01 15:33:32
1023
原创 5分钟速成:大模型RAG(检索、增强、生成)轻松掌握!
因为这个行业不同于其他行业,知识体系实在是过于庞大,知识更新也非常快。作为一个普通人,无法全部学完,所以我们在提升技术的时候,首先需要明确一个目标,然后制定好完整的计划,同时找到好的学习方法,这样才能更快的提升自己。这份完整版的大模型 AI 学习资料已经上传优快云,朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费。
2025-04-01 14:39:53
475
原创 Cursor与Cline终极对决:商业VS开源,AI编程工具谁将引领未来?
随着2024年AI代码编辑器的崛起,软件开发者的工作效率得到了显著提升。在众多AI编程工具中,Cursor和Cline分别代表了商业和开源领域的两大领导者。Cursor作为一款付费工具,以其精细化的功能和高效的性能广受欢迎;而Cline作为开源工具,凭借强大的扩展性和零成本优势也受到不少开发者的青睐。那么,Cursor与Cline到底谁更强?国外知名网友Marvijo通过评测给出了答案,本文将基于该评测对两款工具进行全面比较,并探讨其优缺点。Cursor。
2025-04-01 14:37:46
490
原创 YiXin-Distill-Qwen-72B推理模型开箱实测:最新开源技术深度体验!
本文带大家本地部署并实测了 YiXin 最新开源的推理模型。体感非常棒,强烈推荐有需求的朋友去试下~效果媲美主流大厂模型,推理方面甚有超越。此外,72B 的尺寸很好平衡了通用能力和推理能力,作为垂直领域应用的基座模型,基于私有数据进行微调,香的很!
2025-04-01 14:34:24
585
原创 开源项目震撼发布:几分钟创建AI Agent,事件驱动工作流NB框架!
Motia主要面向需要自动化任务的软件工程师,特别是那些涉及 AI 代理和后端自动化的场景。它的核心是事件驱动架构,允许开发者通过定义步骤、流程、事件和主题来构建灵活、可扩展、可视化的工作流。
2025-04-01 14:31:48
461
原创 35程序员转行做大模型,可以选择哪些岗位,大模型这波红利首先吃到的程序员!
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
2025-03-31 19:54:51
948
原创 【AI大模型】应用开发秘籍:零基础入门到精通,一篇文章掌握全部!
1、了解大模型能做什么2、整体了解大模型应用开发技术栈3、浅尝OpenAI API的调用AI全栈工程师:懂AI、懂编程、懂业务的超级个体,会是AGI(Artificial General Intelligence 通用人工智能)时代最重要的人。
2025-03-31 19:52:24
718
原创 浙江大学揭秘:从大模型到产业大脑,61页AI应用系统构建指南免费下载!
根据报告的内容,本文主要概括了以下几个关键点:1、大模型推理能力快速提升:从早期的基于规则的少量数据处理,到模仿人脑进行大量数据的标记和训练,再到对人类学习过程的重点关注,大模型经历了多个发展阶段。2022年,ChatGPT的发布标志着对话式AI进入大众应用阶段。2023-2024年,OpenAI的o系列模型和DeepSeek-R1等模型在数学和代码推理任务上取得了突破性进展。2、推理模型和思维链(CoT):自动化思维链(CoT)的实现是新一代大模型的精髓之一。
2025-03-31 19:49:57
486
原创 深度学习必须掌握的五大算法模型
在深度学习技术日新月异的今天,掌握具有里程碑意义的五大核心算法架构,是突破技术瓶颈与拓展应用场景的关键。一、卷积特征提取网络(CNN)核心机制:通过多层级联的卷积核在输入矩阵上执行滑动窗口运算,形成特征响应图谱。核心模块包含:特征映射层:采用局部感受野提取纹理、边缘等空间模式降维采样层:通过最大/平均池化保留显著特征全局推理层:将空间特征编码为抽象语义向量技术优势:√ 具备平移不变性特征学习能力,适应图像/视频等规则网格数据。
2025-03-31 19:48:11
694
原创 阿里面试题合集-SFT系列【大模型面试】
微调是一种有监督的技术手段,是在已具备广泛知识基础的大型预训练语言模型上,利用针对性的数据集实施额外的训练过程,旨在使模型更精准地契合特定任务需求或深入某一专业领域。微调的核心目标在于实现知识的精细化灌输与指令系统的精确匹配,所以 SFT 的重点是学习样式和指令,而非知识注入。当前实践中,微调主要分为全参数微调和部分参数微调,下面详细说一下这两个方式的特点和技巧。01 全参数微调有什么技巧?主要是利用小学习率的方式,对大模型的全参数进行调整,以使其完全适应特定领域或任务。
2025-03-31 19:42:08
779
原创 大模型学习必备!12本精选书籍(附PDF版),助你少走一半弯路!你想要看的大模型书籍全都在这里!
随着AI在越来越多的行业被应用,AI赋能的价值逐步体现出来。本书从AI的本质出发,介绍AI技术过往的发展历程和最新的理论成果,然后讲解如何站在移动互联网和大数据的基础上,系统地学习、应用AI技术。本书希望向读者提供学习AI技术的资料、路径,以及打磨AI产品的观点、思路。此外,本书通过介绍笔者接触、打磨AI产品的实际经历,给大家指出AI赋能过程中需要避免的“坑”,期待我们在AI时代共同发展自己、发展生活,在未来遇到更好的AI产品、更好的自己。
2025-03-30 19:36:13
1113
原创 揭秘DeepSeek:4000字深度解析其革命性蒸馏技术!
模型蒸馏(Knowledge Distillation)是一种将大型复杂模型(教师模型)的知识迁移到小型高效模型(学生模型)的技术。其核心目标是在保持模型性能的同时,显著降低模型的计算复杂度和存储需求,使其更适合在资源受限的环境中部署。在机器学习中,模型蒸馏是一种优化技术,通过模仿教师模型的输出,训练一个较小的学生模型,从而实现知识的传递。教师模型通常具有较高的性能,但计算成本高昂,而学生模型则更加轻量级,推理速度更快,且内存占用更少。
2025-03-30 19:33:30
1035
原创 3.4KStar 字节跳动扔出王炸LangManus,自动编程+爬虫二合一
LangManus 实现了一个分层的多智能体系统,其中有一个主管智能体协调专门的智能体来完成复杂任务. 其中:Qwen:提供开源语言模型Tavily:提供搜索能力Jina:提供网络爬虫技术Browser-use:提供浏览器控制能力LangChain:支撑 LLM 交互和链式操作LangGraph:为复杂多智能体编排提供支持LangManus 使用三层 LLM 系统,分别用于推理、基础任务和视觉语言任务。
2025-03-30 19:28:14
755
1
原创 2025风口指南:万字长文带你吃透大模型Agent,涵盖应用、场景与发展
•网址: https://www.langchain.com•功能: 构建基于LLM的应用程序,提供链式调用、工具整合和代理功能AutoGen•网址: https://microsoft.github.io/autogen•功能: 多代理对话框架,支持代理间协作LlamaIndex•网址: https://www.llamaindex.ai•功能: 数据连接和检索增强框架CrewAI•网址: https://www.crewai.io•功能: 协作代理框架,专注于角色分配和工作流XAgent。
2025-03-30 19:26:07
647
原创 大模型学习路线(2025最新)从零基础入门到精通,看完这一篇就够了
通过以上七个阶段的学习,您将能够建立起对大规模预训练模型的深刻理解,并掌握其在实际应用中的技巧。记得在学习过程中保持好奇心和探索精神,积极尝试新技术并参与社区讨论。希望这份学习路线图能帮助您成功踏上大规模模型的学习之旅!如果您对某个特定阶段或主题有更详细的问题,欢迎随时提问!
2025-03-29 16:53:57
1013
原创 快速教程:10分钟内将大模型私有化部署到本地!
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
2025-03-29 16:32:17
540
原创 智变·2025:互联网AI应用元年|附63页文件下载
我们认为以 DeepSeek引领中国AI大模型在模型性能、成本效用上实现突破开始,到阿里、字节、腾讯等大厂以capex开启新一轮科技基建周期,再到Manus等下游AI应用引起广泛讨论,2025年开始中国互联网AI或进入元年。AI模型层面,国内头部模型与海外差距正在日益缩小,在本就繁荣的消费互联网应用层或将迎来产品的百花齐放和商业化落地的全新机遇。基于此,我们提出全生态互联网大厂+“小而美”垂类赛道的两大投资主线,看好互联网大厂们以创新能力、执行力和企业家精神再次成为AI时代领头羊。......
2025-03-29 16:27:37
535
原创 Transformer | 一文了解:缩放、批量、多头、掩码、交叉注意力机制(Attention)
但是对于基础的Attention算法的细节整理的不够详细,今天这篇文章填补上这一点,并利用纯Python和Numpy实现注意力模块,并解释了整个过程中的所有向量维度的变化,对刚入门的新手非常友好。在下文中,NH代表头的数量,HS代表头的大小。将一个(B,N,D)数组乘以(D,HS)会在第一个数组的最后一维和第二个数组的第一维之间进行收缩,结果为(B,N,HS)。Q、K和V最初是(B,N,D),因此通过首先将D拆分成(NH,HS),然后改变维度的顺序,将它们重塑成更方便的形状,得到(B,NH,N,HS)。
2025-03-29 16:25:09
991
原创 MDTeamGPT:一种基于大模型的自进化多学科团队医疗咨询多智能体框架
大型语言模型(LLMs)已在各个领域取得了显著进展。然而,在多学科团队(MDT)医疗咨询中仍存在挑战。当前研究通过角色分配、任务分解和积累医学经验来增强推理能力。MDT咨询中的多角色合作往往导致过长的对话历史。这增加了模型的认知负担,并降低了效率和准确性。一些方法仅存储治疗历史。它们不提取有效经验或反思错误。这限制了知识泛化和系统进化。我们提出了一种基于LLMs的多智能体MDT医疗咨询框架来解决这些问题。我们的框架采用共识聚合和残差讨论结构进行多轮咨询。
2025-03-29 16:19:17
743
原创 【AI产品经理必看】AI产品经理需要哪些必备技能?如何成为AI产品经理?
回答这个问题前我们首先得理清楚什么是AI产品经理,它和传统的互联网产品经理有什么区别。主要职责一方面是规划如何将成熟的AI技术应用在各个领域不同场景中,提升原有场景的效率或效果等;另一方面是基于业务方的需求如何用现有的AI技术或者AI技术组合予以实现,甚至有可能联合技术团队孵化新的AI软件解决方案或者AI硬件产品。AI产品经理本身也只是产品经理的一种,并没有什么特殊性。只是这些年AI相对比较火,理解AI技术需要一定的技术门槛,和传统的交互产品经理、系统产品经理等对比起来入门门槛更高。
2025-03-28 16:49:55
1079
原创 智能客服系统搭建实战:从零到一,AI智能客服完全指南!
AI智能客服是新一代的智能化在线客服系统,它在传统的客服功能基础上,加入了大量的AI算法逻辑,实现了智能接待、自动客户资源获取、智能资源流动和分配的效果。• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。网上虽然也有很多的学习资源,但基本上都残缺不全的,这是我自己整理的大模型视频教程,上面路线图的每一个知识点,我都有配套的视频讲解。
2025-03-28 16:21:48
938
原创 2024年中国人工智能产业研究报告|附51页文件下载
作为新一轮科技革命和产业变革的核心引擎,人工智能产业在2024年被中央及各地政府确立为重点发展方向,陆续出台了一系列针对性强、力度大的政策措施,旨在推动产业创新,提升区域经济的科技竞争力。经过多年持续投资布局,我国人工智能产业体系逐步完善,基础层、模型层及应用层不断升级优化,实现了人工智能、大数据等数据智能技术与实体经济的广泛融合。......文│艾瑞咨询。
2025-03-28 16:17:25
566
原创 AI大模型进医疗新突破:RadOnc-GPT帮助临床团队减轻医患沟通负担的深度分析
该图展示了从患者查询和临床团队回复的提取,到RadOnc-GPT生成回复,再到随机化评估数据集的创建过程,以及最终的NLP定量评估和临床人员单盲评分的完整流程。研究团队从Mayo诊所放射肿瘤科的in-basket消息数据库中筛选出90名非转移性前列腺癌患者,最终选取了158条患者询问及其对应的临床团队回复。通过这些患者询问,RadOnc-GPT生成了158条回复。
2025-03-28 16:15:52
601
原创 阿里开源Qwen2.5-Omni全模态模型,7B拿下全球第一
又是深夜,中国源神再次出击。今天凌晨1点,阿里发布了他们最新的全模态模型——Qwen2.5-Omni-7B。在OmniBench多模态基准上刷新了世界纪录,在seed-tts-eval语音生成基准上更是直接媲美人类水平。新模型发布不到12个小时,已经在huggingface上冲到了前六。不是,这Qwen2.5-Omni到底什么东西,一下子这么NB了?我仔细看了他们的技术论文,Omni就是全能的意思,全模态是指模型能够自适应文本、图像、音频和视频等多模态输入,并实时输出文本与语音。
2025-03-28 16:12:18
997
原创 LLM大模型学习指南:快速入门路径与持续更新教程!【AI大模型教程】
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
2025-03-27 16:19:29
950
原创 Deepseek入门指南:全网最详细,新手小白必备,建议收藏学习!
春节期间,Deepseek发布R1 模型,在推理和数学方面超越OpenAI O1 模型,关键还免费开源。小编体验了一下,比如说关于电影神话故事的分析,制作美食等等内容,它都回答的游刃有余。网络上有很多教程,有专业的还有行业应用,那么今天就教大家从0到1怎么使用它。以及怎么本地部署。最简单就是网页使用。打开网页,或者在应用商店搜索下载App。深度思考】,就是R1的推理模型,可以自动思考。联网搜索】,就可以搜索到最近最新的内容,特别是查看最新的新闻。
2025-03-27 16:17:38
388
原创 OpenAI采用Anthropic协议,MCP一夜爆红!Karpathy:是时候冷静思考了
Altman 确认采用Anthropic 的 MCP 协议美国当地时间 3 月 26 日,OpenAI CEO Sam Altman 在 X(原 Twitter)帖子中确认,OpenAI 将在旗下产品(包括 ChatGPT 桌面应用)中集成 Anthropic 的模型上下文协议(MCP)。Altman 指出,“MCP 的市场反响很好,我们也很高兴能在自家产品中支持这项协议。
2025-03-27 16:13:48
835
原创 AI Agent 今年大爆发,打工人该何去何从?
Manus AI 作为通用 Agent的初步探索,虽然还有些不成熟,但它让更多人见识到 Agent 模式下的无限可能。相比过去只能输出一段文本或一张图片的 AI,Agent 已经踏上了独立行动、跨工具完成任务的新赛道。未来,能自动反思、自主学习的 Agent 产品将进一步涌现,让我们在执行复杂工作时更加得心应手。最后,为大家推荐一份网上疯传的DeepSeek系列教程,全部6个清华+2个北大+浙大+厦大版,都给你打包好,直接领取。
2025-03-27 16:11:16
543
原创 AGI大模型学习路线:清华大学196小时讲完的AI大模型教程(LLM)零基础入门到精通全套教程_大模型学习路线
自学AI大模型需要扎实的基础知识、系统的学习路线和持续的实践与探索。希望这条学习路线能为新手小白们提供一个清晰的方向,帮助大家更好地进入和发展在AI大模型领域。祝大家学习顺利,早日成为AI领域的专家!。
2025-03-26 15:41:17
977
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人