- 博客(1138)
- 收藏
- 关注
原创 深度解析:多模态数据与大模型的融合应用
想象一个机器,它的工作就是从一堆预先设定的选项中,选择一个最合适的类别。但这种方法只在选项有限的情况下才行得通。之前的很多模型都受到这样的限制。比如,ILSVRC-2012 的模型只能在 1,000 个类别中选择,而 JFT-300M 的选择则为 18,291 个类别。这种方法的缺陷是,模型可能会受到类别的限制而无法给出丰富的回答,还限制了其零样本学习的能力。比方说,如果训练它只认识 10 种类别,那么当出现 100 种类别时,它就不知所措了。
2025-04-02 15:36:22
627
原创 【从零基础到精通】AI产品经理学习路线(非常详细):从这篇开始,2025年最新最全AI产品经理学习资源!
市面上不同的公司对产品经理的定位有很大的差别,一名合格的产品经理是能对软件产品整个生命周期负责的人。AI产品经理和通用型软件产品经理的底层思考框架是一样的,都是要经历产品立项、需求分析、产品设计、产品执行管理(研发测试)、验收、分析迭代这几个阶段。:通用型产品经理,只需要把业务流程、痛点理清楚,在进行逻辑处理、界面流程化,软件化即可。而AI产品是AI技术为出发点,为各行各业提供全新的解决方案,甚至会变更原来的业务流程和使用方式。人工智能已经成为国家的重点发展方向之一,各行各业也加入到AI这个大家庭。
2025-04-02 15:34:05
483
原创 Kimi AI大模型部署教程:手把手教你使用极空间
近期,从几百个AI大模型中突围的Kimi,因免费试用、模型大、响应快、扩展功能多等特点受到欢迎,被称为GPT4.0超级平替,火爆出圈!相信很多人手机中已经拥有了Kimi了吧!Kimi是一款国产人工智能助手,主要有“长文总结和生成、联网搜索、数据处理、编写代码、用户交互、翻译”6项功能,是全球首个支持输入20万汉字的智能助手产品。
2025-04-02 15:33:16
737
原创 LLM大模型学习:AI时代,敏感词过滤,如何精准且高效,方法+代码实现
自从我开始搞大模型应用,就一直有一个头疼的问题困扰着我的团队,那就是避免敏感信息。传统的做法是通过一些匹配算法,过滤掉敏感词,这个后面我们再讲。但大模型的对话中,想要防止他做一些不合法的事情,就比较困难了。
2025-04-02 15:32:40
933
原创 清华大学出品《DeepSeek从入门到精通》超详细使用手册pdf免费分享
清华大学新闻与传播学院团队发布了长达104页的DeepSeek详细使用手册,该手册成为国产AI工具DeepSeek深度使用的标杆指南。手册内容涵盖基础入门、核心能力与模型对比、进阶提示语策略、场景化应用以及人机协作与能力进阶等方面。它不仅适合新手快速掌握DeepSeek的基础操作,还为进阶用户提供了系统性方法论。手册强调了DeepSeek在文本创作、自然语言理解、编程辅助图表绘制、文件处理等方面的优势,并对比了推理模型与通用模型的性能特点。
2025-04-02 14:52:52
754
原创 【Deepseek v3开源】本地部署仅需700G,轻松运行!
根据多个基准测试,DeepSeek v3 在代码方面甚至优于 Claude Sonnet 3.5那么671B的DeepSeek V3如何本地运行尼,由于DeepSeek的框架原生采用 FP8 训练,因此仅提供 FP8 权重,预估仅700GB+显存便可轻松运行。当然也可以转换到BF16,在半精度下,需1400GB+量化到int4时需要300GB+半精度 236B的DeepSeek V2,占用 490G 显存,需要 7张 80G A100。
2025-04-02 14:51:31
329
原创 如何微调(Fine-tuning)大语言模型?零基础入门到精通,看这篇就够了!赶紧收藏!
图片由DALL-E 生成阿里妹导读本文介绍了微调的基本概念,以及如何对语言模型进行微调。从 GPT3 到 ChatGPT、从GPT4 到 GitHub copilot的过程,微调在其中扮演了重要角色。什么是微调(fine-tuning)?微调能解决什么问题?什么是 LoRA?如何进行微调?本文将解答以上问题,并通过代码实例展示如何使用 LoRA 进行微调。
2025-04-01 13:52:52
784
原创 应该怎么训练大模型,大模型的训练流程是什么样的?
现在大模型发展得如火如荼,但是没有学过人工智能技术的开发者,只会调用其接口,但不清楚怎么训练一个大模型。今天就简单介绍一下自己的理解,有什么问题欢迎讨论。01怎么训练一个大模型?我们知道大模型是指以神经网络为基础构建,通过大量数据学习或者说训练得到的一个模型。这里大指的是学习的数据量大,而模型是指机器学习模型。通过大量数据训练出来的机器学习模型,就是大模型。所以,训练一个大模型最重要的两个部分就是和;再加上对,就构成了一个完善的训练流程。
2025-04-01 13:52:16
868
原创 一文全面说透,2025版最新AI大模型!零基础入门到精通,收藏这一篇就够了
近年来,随着深度学习技术的飞速发展,AI大模型作为人工智能领域的重要研究对象,正逐步成为学术界和产业界广泛关注的热点议题。AI大模型,作为一类具备庞大参数规模与卓越学习能力的神经网络模型,如BERT、GPT等,已在自然语言处理、计算机视觉等多个领域展现出卓越成效,极大地推动了相关领域的技术进步。**AI大模型的价值不仅体现于其庞大的参数规模与强大的学习能力,更在于其对于解决现实世界复杂问题的巨大潜力。
2025-04-01 13:51:33
903
原创 大模型时代,新手和程序员如何转型入局AI行业?
在当今大模型迅猛发展的环境下,人工智能的应用越来越广泛。然而,这些大模型的背后隐藏着更为深厚的基础技术——传统机器学习和神经网络。理解这些基础技术,不仅能够帮助我更好地使用大模型,还能为我提供创新和解决实际问题的能力。因此,在这个AI迅猛发展的时代,掌握传统机器学习和神经网络显得尤为重要。在近期的全国两会上,“人工智能”再次被提及,并成为国家战略的焦点。这一举措预示着在接下来的十年到十五年里,人工智能将获得巨大的发展红利。
2025-04-01 13:40:01
1014
原创 小白入门大模型:LangChain(附教程)
随着大模型技术的发展,越来越多的人开始进入大模型领域,但大模型作为一门技术,因此它的本质上是一个工具,因此这也让学习大模型有了不同的学习方向。从工具的角度来看,学习一个工具主要有两个方向,一个是使用工具,一个是制造工具;而今天我们主要讲的是后者,也就是怎么制造一个大模型工具,它需要哪些技术基础。大模型基础技术路线下面主要从以下几个技术基础讲解一下大模型的学习路线:理论基础编程基础深度学习框架特定领域知识实践经验算法基础。
2025-04-01 13:39:20
1020
原创 DeepSeek全攻略:从零基础到精通的终极指南
Deep Seek是一款创新的智能搜索与分析平台,致力于通过先进的人工智能技术,帮助用户高效地从海量信息中提取关键信息。无论是数据挖掘、知识管理,还是市场分析,Deep Seek都能为您提供精准的搜索结果和深入的洞察力。今天,我们将带你深入了解这款工具,从入门到精通,掌握它的核心功能与使用技巧,开启高效智能工作的全新篇章。
2025-03-31 14:52:37
319
原创 初学者怎么入门大语言模型(LLM)?
大语言模型(LLM)是一门博大精深的学科,涉及到高等数学、python编程、PyTorch/Tensorflow/Onnx等深度学习框架……然而奇妙的是,越是看上去难得要死、一辈子都学不完的技术,入门起来却越是容易。正如阿瑟·克拉克的名言:足够先进的科技看上去与魔法无异。大语言模型先进得如同魔法,我们这些麻瓜也许一辈子都没法完全理解它。但乐观地看,既然大语言模型是魔法,那我们就把它当魔法用好了,用这个魔法发掘自己的天赋,兑现自己的价值。
2025-03-31 14:51:51
220
原创 大模型微调(Fine-tuning)全解,需要了解的都在这里
所谓大模型微调,指的在已有的大规模预训练模型基础上,通过对标注数据进行训练,进一步优化 模型的表现,以适应特定任务或场景的需求。不同于RAG或者Agent技术,通过搭建工作流来优化模型表现,微调是通过修改模型参数来优化模型能力,是一种能够让模型“永久”掌握某种能力的方法。
2025-03-31 14:50:55
301
原创 小白入门大模型:LangChain(附教程)
模型在高层次上有两种不同类型的模型:语言模型(language models)和文本嵌入模型(text embedding models)。文本嵌入模型将文本转换为数字数组,然后我们可以将文本视为向量空间。在上面这个图像中,我们可以看到在一个二维空间中,“king”是“man”,“queen”是“woman”,它们代表不同的事物,但我们可以看到一种相关性模式。这使得语义搜索成为可能,我们可以在向量空间中寻找最相似的文本片段,以满足给定的论点。
2025-03-31 14:49:17
389
原创 大语言模型(LLM)技术深度洞察:进展、问题、趋势,零基础入门到精通,看这篇就够了!赶紧收藏!
大型语言模型是一种旨在通过分析大量数据生成和理解类似人类文本的人工智能模型。这些基础模型基于深度学习技术,通常涉及许多层和大量参数的神经网络,使它们能够捕捉到它们训练的数据中的复杂模式。大型语言模型的主要目标是理解自然语言的结构、语法、语义和上下文,以便它能够生成连贯且上下文适当的响应或用相关信息完成给定的文本输入。这些模型在包括书籍、文章、网站和其他文本内容在内的多样化文本数据源上进行训练,这使它们能够对广泛的主题生成响应。
2025-03-31 14:48:01
392
原创 大模型微调(Fine-tuning)全解,需要了解的都在这里
所谓大模型微调,指的在已有的大规模预训练模型基础上,通过对标注数据进行训练,进一步优化 模型的表现,以适应特定任务或场景的需求。不同于RAG或者Agent技术,通过搭建工作流来优化模型表现,微调是通过修改模型参数来优化模型能力,是一种能够让模型“永久”掌握某种能力的方法。
2025-03-29 13:58:48
1073
原创 小白入门大模型:LangChain(附教程)
模型在高层次上有两种不同类型的模型:语言模型(language models)和文本嵌入模型(text embedding models)。文本嵌入模型将文本转换为数字数组,然后我们可以将文本视为向量空间。在上面这个图像中,我们可以看到在一个二维空间中,“king”是“man”,“queen”是“woman”,它们代表不同的事物,但我们可以看到一种相关性模式。这使得语义搜索成为可能,我们可以在向量空间中寻找最相似的文本片段,以满足给定的论点。
2025-03-29 13:57:00
505
原创 大语言模型(LLM)技术深度洞察:进展、问题、趋势,零基础入门到精通,看这篇就够了!赶紧收藏!
大型语言模型是一种旨在通过分析大量数据生成和理解类似人类文本的人工智能模型。这些基础模型基于深度学习技术,通常涉及许多层和大量参数的神经网络,使它们能够捕捉到它们训练的数据中的复杂模式。大型语言模型的主要目标是理解自然语言的结构、语法、语义和上下文,以便它能够生成连贯且上下文适当的响应或用相关信息完成给定的文本输入。这些模型在包括书籍、文章、网站和其他文本内容在内的多样化文本数据源上进行训练,这使它们能够对广泛的主题生成响应。
2025-03-29 13:56:02
853
原创 从零开始优化 RAG 流程的终极指南,解决检索增强生成的核心挑战
本文讨论了优化 RAG 管道各个部分并增强整体 RAG 性能的各种技术。你可以在 RAG 管道中使用其中一种或多种技术,使其更加准确和高效。希望这些技术能够帮助你为你的应用程序构建一个更强大的 RAG 管道。参考资料:https://luv-bansal.medium.com/advance-rag-improve-rag-performance-208ffad5bb6a。
2025-03-29 13:55:18
727
原创 转行大模型之从大数据到AI:我为何选择投身大模型领域
作为一名大数据开发工程师,我看到大模型技术正在重塑我们的行业。这次转型不仅是顺应技术潮流的选择,更是基于个人技能、市场需求和职业发展的综合考量。我相信,凭借我们在数据处理和分布式系统方面的专长,再辅以新的学习,我们完全有能力在大模型应用开发这个新领域大展身手。这次转型的思考是一个契机,后续还须更多步骤才能转型成功。我也会持续更新这一系列自己的心路历程,希望能为同样考虑转型的同行们提供一些参考和启发。让我们一起在这个AI驱动的新时代中,开创属于我们的新天地!
2025-03-29 13:54:34
540
原创 DeepSeek全攻略:从零基础到精通的终极指南
vLLM (https://github.com/vllm-project/vllm) 是一个快速且易于使用的库,用于进行大型语言模型的推理和部署。
2025-03-28 14:24:16
675
原创 DeepSeek全攻略:从零基础到精通的终极指南
Deep Seek是一款创新的智能搜索与分析平台,致力于通过先进的人工智能技术,帮助用户高效地从海量信息中提取关键信息。无论是数据挖掘、知识管理,还是市场分析,Deep Seek都能为您提供精准的搜索结果和深入的洞察力。今天,我们将带你深入了解这款工具,从入门到精通,掌握它的核心功能与使用技巧,开启高效智能工作的全新篇章。
2025-03-28 14:13:05
867
原创 大模型微调(Fine-tuning)全解,需要了解的都在这里
所谓大模型微调,指的在已有的大规模预训练模型基础上,通过对标注数据进行训练,进一步优化 模型的表现,以适应特定任务或场景的需求。不同于RAG或者Agent技术,通过搭建工作流来优化模型表现,微调是通过修改模型参数来优化模型能力,是一种能够让模型“永久”掌握某种能力的方法。
2025-03-28 14:12:42
912
原创 小白入门大模型:LangChain(附教程)
模型在高层次上有两种不同类型的模型:语言模型(language models)和文本嵌入模型(text embedding models)。文本嵌入模型将文本转换为数字数组,然后我们可以将文本视为向量空间。在上面这个图像中,我们可以看到在一个二维空间中,“king”是“man”,“queen”是“woman”,它们代表不同的事物,但我们可以看到一种相关性模式。这使得语义搜索成为可能,我们可以在向量空间中寻找最相似的文本片段,以满足给定的论点。
2025-03-28 14:10:46
1198
原创 大语言模型(LLM)技术深度洞察:进展、问题、趋势,零基础入门到精通,看这篇就够了!赶紧收藏!
学习推理大模型(如GPT-4、PaLM、LLaMA等)需要结合深度学习、自然语言处理(NLP)和逻辑推理的知识。:掌握线性代数、概率统计、微积分(如梯度下降)、信息论(如交叉熵)。:熟练使用Python,学习PyTorch或TensorFlow框架。:理解经典算法(如动态规划、搜索算法)和机器学习基础(如监督学习、无监督学习)。学习传统模型(如线性回归、SVM、决策树)。掌握深度学习基础:神经网络、反向传播、CNN/RNN、注意力机制。
2025-03-28 14:09:56
561
原创 大语言模型(LLM)技术深度洞察:进展、问题、趋势,零基础入门到精通,看这篇就够了!赶紧收藏!
学习推理大模型(如GPT-4、PaLM、LLaMA等)需要结合深度学习、自然语言处理(NLP)和逻辑推理的知识。:掌握线性代数、概率统计、微积分(如梯度下降)、信息论(如交叉熵)。:熟练使用Python,学习PyTorch或TensorFlow框架。:理解经典算法(如动态规划、搜索算法)和机器学习基础(如监督学习、无监督学习)。学习传统模型(如线性回归、SVM、决策树)。掌握深度学习基础:神经网络、反向传播、CNN/RNN、注意力机制。
2025-03-28 11:40:14
852
原创 大模型(LLM)学习路线和知识体系,收藏这一篇就够了!
原谅我的后知后觉,才开始从头写,我是已经上了一阶段大模型的课,也搜集了些资料,并自己做了小部分实践,回过头来,才想开始整理些文章。起初,大家都在写,都在发,我那会在焦虑。前排提示,文末有大模型AGI-优快云独家资料包哦!自chatgpt爆火以来,AI技术又被广泛关注,国内外各大厂商也纷纷布局,作为我们每一个普通人,也无不时刻感受着AI一波又一波的冲击。尤其是作为程序员的我,相信绝大多数程序员也有和我一样的感受,从一开始的新奇,到焦虑,到试图去了解他,到去尝试,并致力于应用。
2025-03-27 11:37:42
412
原创 AI大模型应用入门实战与进阶:构建你的第一个大模型:实战指南
AI大模型是指具有大量参数和复杂结构的人工智能模型。这些模型通常需要大量的计算资源和数据来进行训练,以实现高性能的预测和生成能力。近年来,随着计算能力的提高和数据量的增加,AI大模型在各种任务中取得了显著的成果,如自然语言处理、计算机视觉和强化学习等。AI大模型在近年来取得了显著的进展,但仍面临许多挑战和发展趋势,例如:模型压缩与加速:随着模型规模的增加,计算资源和存储需求也在不断增加。未来的研究需要关注如何压缩和加速大模型,以适应更多的应用场景。
2025-03-27 11:37:03
407
原创 AI大模型真的是大龄程序员的新出路吗?
在IT行业的高速运转中,许多资深程序员到了一定年龄后,会发现自己陷入了职业发展的瓶颈。尤其是在北京这样的大厂,业务波动、部门调整以及裁员风险,都让“40+”的程序员们感受到了前所未有的压力。当昔日的技术热情逐渐消退,对未来的迷茫与不确定性笼罩心头时,是否还有破局的希望?答案是肯定的,那就是转向AI大模型领域。前排提示,文末有大模型AGI-优快云独家资料包哦!
2025-03-27 11:36:18
397
原创 AI产品经理知识库:深入解析AI与大模型的差异,非常详细收藏我这一篇就够了
在人工智能(AI)的领域,我们常常听到“大模型”和“传统AI”这两个术语。那么,这两者之间究竟有何区别?今天,我们就来深入探讨一下这个问题。1、大模型(LLM)是基于深度学习算法的,使用大规模的神经网络模型进行训练。这使得LLM具有更强大的语言处理能力和生成能力。而传统AI通常使用基于规则、模板和手工特征工程的浅层算法,难以处理复杂的语言任务。LLM可以根据任务需求进行灵活的调整和扩展,以适应不同的应用场景。而传统AI则通常需要重新设计和实现算法和模型,无法快速地适应新的应用需求。
2025-03-27 11:35:02
309
原创 大模型学习路线入门到精通,非常详细收藏我这一篇就够了!
理论其实就是一套描述和解决问题的方法论,只不过不同的技术有不同的方法,也就是理论。理论的发展有两种方式,一种是基于实践检验结果总结出来的经验;二种是以严谨的科学理论推导出逻辑自洽的解决某个问题的方法。比如说,火是人类生存和进化的重要条件之一,而在远古时期人类对于火的认知还比较浅显,因此那时关于火的理论也比较基础,比如它可以取暖,可以烤熟食物等;这就是基于经验的理论基础。。
2025-03-27 11:34:03
281
原创 大模型入门学习教程2025年最新版(非常详细)看这一篇就够了!
此外,它还允许您在任何数据上(如私有数据或未见过的数据)对模型进行微调,并在不需要支付如 OpenAI API 的费用的情况下使用它。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。在监督微调之后,强化学习从人类反馈(RLHF)是用于将大型语言模型(LLM)的回答与人类期望对齐的步骤。虽然对 Transformer 架构的深入理解不是必须的,但了解其输入(tokens)和输出(logits)是非常重要的。
2025-03-26 14:17:20
617
原创 纯小白必看!这份大模型应用入门指南你一定不能错过!
AI 大模型是指拥有超大规模参数(通常在十亿个以上)、超强计算资源的机器学习模型,能够处理海量数据,完成各种复杂任务,如自然语言处理、图像识别等。对于普通人而言,可以利用大模型提升学习、工作和生活的效率与质量。以下是一些具体的应用场景介绍:一、教育学习:大模型能够根据个人的学习进度和兴趣推荐学习材料,提供即时反馈和辅导,为用户打造定制化的学习体验,进而帮助他们增强学习效果。二、日常办公:大模型可以协助用户完成日常办公任务,比如自动生成报告、回复邮件和总结会议纪要等,为文案工作者减轻负担。
2025-03-26 14:16:27
1091
原创 什么是大模型?一文读懂大模型的基本概念,看完这篇就足够了~
大模型是指具有大规模参数和复杂计算结构的机器学习模型。这些模型通常由深度神经网络构建而成,拥有数十亿甚至数千亿个参数。大模型的设计目的是为了提高模型的表达能力和预测性能,能够处理更加复杂的任务和数据。大模型在各种领域都有广泛的应用,包括自然语言处理、计算机视觉、语音识别和推荐系统等。大模型通过训练海量数据来学习复杂的模式和特征,具有更强大的泛化能力,可以对未见过的数据做出准确的预测。
2025-03-26 14:15:43
1002
原创 2025最新科普什么是大模型?零基础入门到精通,收藏这篇就够了
大模型(Large Models)并没有一个官方的统一定义,因为它通常是一个相对的概念,其大小会根据时间、技术和领域的发展而变化。大模型通常指的是深度学习中具有大量参数和计算资源需求的神经网络模型。这些模型在不同的上下文中可能有不同的大小阈值。前排提示,文末有AI大模型优快云独家籽料包哦!例如,对于自然语言处理(NLP)领域,大模型可能指的是包含数十亿到千亿参数的模型,如GPT-3、GPT-4等。对于计算机视觉领域,大模型可能是拥有数亿参数的深度卷积神经网络,如ResNet-152。
2025-03-26 14:15:02
952
原创 36岁程序员转行大模型,北上广深的已经吃到大模型的第一波红利了!
作为一位30+北漂男程序员,2个月零基础转行大模型,成功拿下我,开启了我的大学生活。因为听学长学姐说我们专业毕业了也是比较累的,但是我当时励志在北京创出一番事业来,所以我觉得其实都还好。后来我留在北京工作生活,,天天在高级写字楼工作,我想很多人都会很高兴在北京获得一份在高级写字楼里的工作,我也不例外,但是我到这里按年算起来,这十年来我从一个基层码农到现在的中层,月薪也涨到了2w+,一直以来我都是一个对生活没有什么特殊要求的人。
2025-03-25 13:53:07
696
原创 2025年强烈推荐30+程序员转行大模型试试——一名35岁老程序员真实转行经验分享
大家好,我叫李华一名10年的资深程序员,在经历了10多年传统软件开发工作后,在35岁时毅然决定投身到大模型这一新兴领域。我的故事希望能为那些正在考虑职业转型的技术人员提供一些启示。
2025-03-25 13:51:29
1120
原创 Java程序员表示抬太卷了,我还是转行大模型算了
Java程序员转行大模型领域,可以依据以下详细路线进行学习和职业转换:第1阶段:基础知识巩固数学基础:线性代数:矩阵运算、向量空间等。概率论与统计:概率分布、统计推断等。微积分:导数、积分、多变量函数等。Python编程:Python基础:数据类型、控制结构、函数等。Python进阶:面向对象编程、装饰器、生成器等。数据处理:NumPy、Pandas、Matplotlib。第2阶段:机器学习与深度学习机器学习基础:监督学习算法:线性回归、逻辑回归、支持向量机等。
2025-03-25 13:50:08
865
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人