- 博客(1663)
- 收藏
- 关注
原创 2025Java转AI完全指南:从CRUD到Prompt工程大师
随着技术的不断进步,人工智能(AI)已经成为当今科技领域最热门的话题之一。许多开发者开始考虑从传统的软件开发领域,如Java,转向人工智能领域,今天我和大家一起来探讨Java开发者是否可以转型到人工智能,转型的优势,薪资对比,以及转型所需的知识和学习路线等。Java作为一种广泛使用的编程语言,拥有强大的生态系统和丰富的库支持。许多人工智能框架和库,如Apache Mahout和Deeplearning4j,都是基于Java开发的。因此,Java开发者具备转型到人工智能领域的基础。
2025-04-01 11:52:03
991
原创 Java老鸟的AI进化指南:用传统技术栈玩转大模型
在Java中运用AI大模型通常涉及多个步骤,包括环境配置、模型选择、模型加载、数据预处理、模型推理以及结果处理等。
2025-04-01 11:50:02
955
原创 Ollama完全攻略:本地部署大模型看这篇就够了!
前几篇,分享的都是如何白嫖国内外各大厂商的免费大模型服务~有小伙伴问,如果我想在本地搞个大模型玩玩,有什么解决方案?Ollama,它来了,专为在本地机器便捷部署和运行大模型而设计。也许是目前最便捷的大模型部署和运行工具,配合Open WebUI,人人都可以拥有大模型自由。今天,就带着大家实操一番,从 0 到 1 玩转 Ollama。前排提示,文末有大模型AGI-优快云独家资料包哦!如果要使用的模型不在 Ollama 模型库怎么办?
2025-04-01 11:22:06
781
原创 从零构建AI模型:训练强大模型的完整手册
ChatGPT面世以来,各种大模型相继出现。那么大模型到底是如何训练的呢,在这篇文章中,我们将尽可能详细地梳理一个完整的 LLM 训练流程,包括模型预训练(Pretrain)、Tokenizer 训练、指令微调(Instruction Tuning)等环节。
2025-04-01 11:03:56
749
原创 Ollama本地部署?本地大模型一站式解决方案,收藏这篇完全指南!
前几篇,分享的都是如何白嫖国内外各大厂商的免费大模型服务~有小伙伴问,如果我想在本地搞个大模型玩玩,有什么解决方案?Ollama,它来了,专为在本地机器便捷部署和运行大模型而设计。也许是目前最便捷的大模型部署和运行工具,配合Open WebUI,人人都可以拥有大模型自由。今天,就带着大家实操一番,从 0 到 1 玩转 Ollama。
2025-03-29 10:39:30
1259
原创 大模型本地部署极简指南:60秒快速上手,零基础也能轻松搞定!
首先打开ollama官网 https://ollama.com这里使用的是windows,直接选择下载即可文件下载好后之间打开点击安装即可默认会安装到c盘,请预先给c盘足够的空间来保证环境安装和模型下载所需空间充足安装完成后打开windows PowerShell可以输入ollama来验证是否安装成功或者变量配置是否有问题这里以wizardlm2模型为例,我们只需要在命令行中输入ollama run wizardlm2:7b即可等待模型下载完毕即可纯净系统启动可能存在vc运行库缺少问题。
2025-03-29 10:36:13
609
原创 手把手教学:2025年最详细最易懂的Ollama本地大模型部署全攻略
在本地启动并运行大型语言模型。运行Llama 2,Code Llama和其他模型。自定义并创建您自己的。前排提示,文末有大模型AGI-优快云独家资料包哦!
2025-03-29 10:33:48
1047
原创 私有化AI知识库实战:基于Ollama+MaxKB的本地部署全攻略
前排提示,文末有大模型AGI-优快云独家资料包哦!相对来说,容易安装且功能较完善,30 分钟内即可上线基于本地大模型的知识库问答系统,并嵌入到第三方业务系统中。缺点是如果你的电脑配置不高,问题回答响应时间较长。
2025-03-29 10:30:37
624
原创 Llama 3.1部署全图解:跟着做就能跑通的视觉教程
Llama 3.1 是 Meta(Facebook 的母公司)发布的一系列最先进的开源大语言模型。Llama 3.1 系列包括 8B(80 亿参数)、70B(700 亿参数)和 405B(4050 亿参数)模型。其中,405B 是 Meta 迄今为止最大的模型。前排提示,文末有大模型AGI-优快云独家资料包哦!本地部署的硬件要求,请确认您的硬件是否能够正常运行,以免浪费时间Windows:3060以上显卡+8G以上显存+16G内存,硬盘空间至少20G。
2025-03-25 14:11:55
725
原创 别再被术语吓跑!这才是大模型的正确打开方式
大模型,英文名叫Large Model,大型模型。早期的时候,也叫Foundation Model,基础模型。大模型是一个简称。完整的叫法,应该是“人工智能预训练大模型”。预训练,是一项技术,我们后面再解释。我们现在口头上常说的大模型,实际上特指大模型的其中一类,也是用得最多的一类——语言大模型(Large Language Model,也叫大语言模型,简称LLM)。除了语言大模型之外,还有视觉大模型、多模态大模型等。现在,包括所有类别在内的大模型合集,被称为广义的大模型。
2025-03-25 14:08:04
820
原创 大模型评估全指南:从基准测试到业务落地的完整框架
大语言模型(LLM)评测是LLM开发和应用中的关键环节。目前评测方法可以分为人工评测和自动评测,其中,自动评测技术相比人工评测来讲,具有效率高、一致性好、可复现、鲁棒性好等特点,逐渐成为业界研究的重点。前排提示,文末有大模型AGI-优快云独家资料包哦!模型的自动评测技术可以分为rule-based和model-based两大类:rule-based方法:benchmark以客观题为主,例如多选题,被测的LLM通过理解context/question,来指定最佳答案。
2025-03-25 14:02:44
1303
原创 LangChain+RAG终极教程:收藏这一篇就够了
前排提示,文末有大模型AGI-优快云独家资料包哦!将LLM接入LangChain:选择LLM,然后在LangChain中使用;构建检索问答链:使用语法构建RAG问答链部署知识库助手:使用streamlit部署项目;帮助读者快速构建RAG应用并部署在阿里云服务器上;Streamlit是一个开源的 Python 库,它使得数据科学家和开发者能够快速构建和共享美观的机器学习模型和数据应用程序。使用 [Streamlit],用户无需深入了解前端开发,即可创建交互式的 Web 应用。它的设计哲学是。
2025-03-25 13:46:20
740
原创 全栈AI知识库解决方案:Anything LLM可视化+Ollama本地模型+DeepSeek R1优化
本文主要介绍如何在Windows电脑上本地部署Ollama并接入DeepSeek R1大模型,然后使用强大的开源AI工具Anything LLM结合cpolar内网穿透工具轻松实现随时随地使用与上传内容来训练本地部署的大模型,无需公网IP,也不用准备云服务器那么麻烦!前排提示,文末有大模型AGI-优快云独家资料包哦!
2025-03-25 11:20:59
891
原创 程序员逆袭!Java转AI大模型,轻松实现年薪百万
随着技术的不断进步,人工智能(AI)大模型已经成为当今科技领域最热门的话题之一。许多开发者开始考虑从传统的软件开发领域,如Java,转向人工智能领域,今天小编和大家一起来探讨Java开发者是否可以转型到人工智能大模型,转型的优势,薪资对比,以及转型所需的知识和学习路线等。Java作为一种广泛使用的编程语言,拥有强大的生态系统和丰富的库支持。许多人工智能大模型框架和库,如Apache Mahout和Deeplearning4j,都是基于Java开发的。因此,Java开发者具备转型到人工智能大模型领域的基础。
2025-03-18 11:28:05
943
原创 普通程序员如何入手学习大模型(LLM)附学习路线和资源教程
在人工智能(AI)飞速发展的今天,掌握AI技术已经成为了许多高校研究者和职场人士的必备技能。从深度学习到强化学习,从大模型训练到实际应用,AI技术的广度和深度不断拓展。作为一名AI学习者,面对浩瀚的知识海洋,如何有条不紊地学习并应用这些技术呢?别担心,今天我为你。深入理解线性代数、概率论和统计学、微积分等基础数学知识。熟练掌握至少一种编程语言,推荐Python,因为它是数据科学和机器学习领域的主流语言。学习机器学习的基本概念、算法和模型,如线性回归、决策树、随机森林、支持向量机等。
2025-03-18 11:26:46
613
原创 程序员AI大模型转型指南:从入门到精通,一篇收藏,全面掌握!
在人工智能(AI)迅速发展的背景下,从传统的编程领域如Java程序员转向大模型开发是一个既充满挑战也充满机遇的过程。对于 Java 程序员来说,这也是一个实现职业转型、提升薪资待遇的绝佳机遇。前排提示,文末有大模型AGI-优快云独家资料包哦!一、明确大模型概念简单来说,大模型就是具有大量参数和强大计算能力的人工智能模型,可以处理各种复杂的任务,如自然语言处理、图像识别等。想象一下,大模型就像是一个超级聪明的大脑,能够理解和处理各种信息。二、转行步骤第一步:学习基础知识。
2025-03-18 11:25:25
562
原创 程序员转行难题:为何如此艰难?大模型领域的新机遇与挑战
尽管我在“[大龄程序员的未来在何方]”这篇文章里比较乐观地介绍了程序员保持竞争力的几个方向,但现实依然是残酷的:很多人将不得不离开软件开发工作,转型去从事其他职业。当你要这么做时,就会感慨:想不到一切竟如此艰难!你不禁会想起李白老先生的诗:噫吁嚱,危乎高哉!蜀道之难,难于上青天!那么,为什么会这么难呢?真有这么难吗?然后我们再来看看,在千难万难之中,怎样找到正确的突破姿势。
2025-03-18 11:23:54
508
原创 2025年程序员转行什么方向更有前景?强烈推荐这几个
对于程序员转行方向的推荐,可以基于当前的技术趋势、市场需求以及程序员的个人技能和兴趣来综合考虑。
2025-03-18 10:38:55
965
原创 一文了解什么是大模型?到底大模型有什么用呢?
这些模型通常由深度神经网络构建而成,拥有数十亿甚至数千亿个参数。大模型的设计目的是为了提高模型的表达能力和预测性能,能够处理更加复杂的任务和数据。大模型在各种领域都有广泛的应用,包括自然语言处理、计算机视觉、语音识别和推荐系统等。大模型通过训练海量数据来学习复杂的模式和特征,具有更强大的泛化能力,可以对未见过的数据做出准确的预测。
2025-03-17 21:16:38
657
原创 企业构建AI大模型应用的步骤流程与关键问题解析
构建企业级AI大模型驱动的应用系统是一项跨越技术与业务边界的综合性任务,它不仅考验着企业在业务领域知识的深度,也挑战着企业基于AI大模型构建应用的技术高度。这一过程要求业务专家与AI大模型专家紧密协作,共同确保通过AI大模型的赋能,实现业务价值的倍增效应。基于实践经验总结,可以系统化地将AI大模型应用的构建流程划分为五个核心步骤:1)需求场景的精确定义、2)大模型的科学选型、3)大模型性能效果的强化调优、4)大模型的部署与运行维护,以及5)AI应用的无缝集成。
2025-03-17 21:14:28
917
原创 企业该如何巧妙落地大模型?这里有10大指南
挑战与机会并存,挑战越大,机会越大,收益也就越大。作为数智时代的经营者,千万不要顽固不化,更不要畏首畏尾,因噎废食,而要积极拥抱变化,快速重塑认知,持续优化思路,带着你的团队,采用“
2025-03-17 21:13:03
851
原创 企业AI大模型私有化部署解决方案
在解决方案上,建议企业建立专门的AI服务器集群,配置高性能计算资源,实现大规模模型训练和推理任务。为了实施严格的数据安全,需要提供安全隔离和访问控制的措施,以防止数据泄露或非法获取。在部署流程上,包括环境搭建、数据准备、模型训练、模型优化和推理部署等多个步骤。每个步骤都需要严格的操作和测试,以确保最终部署的模型能够稳定运行并达到预期的性能指标。在报价方面,需要根据具体项目需求的特点进行定价。此外,还需要考虑培训和技术支持等增值服务,以满足企业的各种需求。
2025-03-17 21:11:35
845
原创 独家发布!全新大模型LLM学习路径指南,非常详细收藏我这一篇就够了
ChatGPT的出现在全球掀起了AI大模型的浪潮,2023年可以被称为AI元年,AI大模型以一种野蛮的方式,闯入你我的生活之中。从问答对话到辅助编程,从图画解析到自主创作,AI所展现出来的能力,超出了多数人的预料,让不少人惊呼:“未来是属于AI的”。AI大模型——成为互联网从业者必备技能。
2025-03-14 16:25:42
751
原创 Java开发者也能看懂的大模型应用开发实践!!!
做AI大模型应用的开发其实Java也能写,那么本文就一个Java开发者的立场,构建实现一个最基础的大模型应用系统。前排提示,文末有大模型AGI-优快云独家资料包哦!让大模型理解文本(知识库)内容,基于知识库范围内的内容进行回答对话而基于知识库的回答会帮助我们解决哪些问题呢?✅ 节省大模型训练成本:我们知道ChatGPT的知识内容停留在2021年,最新的知识它并不知道,而检索增强生成则可以解决大模型无法快速学习的问题,训练大模型代价是非常昂贵的,不仅仅只是金钱,还包括时间,随着模型的参数大小成本成正相关。
2025-03-14 16:16:24
928
原创 企业如何训练自己的专属大模型?
时至今日,已经成为未来发展的关键。国内外科技企业纷纷开始自主研发专属大模型。大语言模型是什么?它是一种自主学习的算法,具有总结、翻译、生成文本等各个功能,可以在摆脱人为控制的情况下,自主创作文案内容。相较于传统的算法模型,大语言模型更倾向于利用学习掌握一个系统化的知识,并将其应用在各个工作任务中,最大程度的发挥其效益。如何将大语言模型应用到各行各业中?答案便是构建领域大模型。领域大模型是指大语言模型在企业的应用中,可以辅助进行领域数据标注和模型微调。
2025-03-14 15:54:39
719
原创 自然语言处理Transformer模型最详细讲解(图解版)
近几年NLP较为流行的两大模型分别为Transformer和Bert,其中Transformer由论文《Attention is All You Need》提出。该模型由谷歌团队开发,Transformer是不同与传统RNN和CNN两大主流结构,它的内部是采用自注意力机制模块。前排提示,文末有大模型AGI-优快云独家资料包哦!该模型在WMT 2014英语到法语的翻译任务中达到了28.4BLEU,Transformer具有良好的并行性,能够很多地推广到其它任务中。
2025-03-14 15:50:17
1070
原创 一口气了解大模型相关通识,基础笔记!
,特指部分参数的微调方法,这种方法算力功耗比更高,也是目前最为常见的微调方法;除此之外,Fine-Tuning也可以代指全部微调方法,同时OpenAI中模型微调API的名称也是需要注意的是,OpenAI提供的在线微调方法也是一种高效微调方法,并不Fine-Tuning,是全量微调;微调, Fine-Tuning,一般指全参数的微调 (全量微调) ,指是一类较早诞生的微调方法,全参数微调需要消耗大量的算力,实际使用起来并不方便,因此不久之后又诞生了只围绕部分参数进行微调的高效微调方法;
2025-03-14 15:46:20
1195
原创 什么是大模型?大模型从入门到精通(超详细)看这一篇就够了!!!
大模型(Large Models),通常指的是拥有大量参数的深度学习模型。这些模型由于其规模庞大,能够捕捉到数据中的复杂模式,因此在自然语言处理(NLP)、计算机视觉(CV)等领域有着广泛的应用。例如,GPT-3 和 BERT 就是自然语言处理领域中著名的大型预训练模型。强大的表达能力:大量的参数使得模型可以更好地拟合复杂的数据分布。预训练+微调机制:通过在大规模数据上进行预训练,然后针对特定任务进行微调,大模型可以有效地利用迁移学习的力量。计算资源的进步。
2025-03-14 15:40:54
1137
原创 我们为什么要用本地大模型?本地大模型入门指南
大模型,在2023年主要称之为大型语言模型(Large Language Models),是一种基于人工智能和机器学习技术构建的先进模型,旨在理解和生成自然语言文本。这些模型通过分析和学习海量的文本数据,掌握语言的结构、语法、语义和上下文等复杂特性,从而能够执行各种语言相关的任务。LLM的能力包括但不限于文本生成、问答、文本摘要、翻译、情感分析等。我们最熟悉的大模型,莫过于CHATGPT。但我们最常用的大模型,未必是CHATGPT。
2025-03-14 15:38:43
886
原创 超详细!大模型面经指南(附答案)
LLM(Large Language Model,大型语言模型)是指基于大规模数据和参数量的语言模型。Transformer架构:大模型LLM常使用Transformer架构,它是一种基于自注意力机制的序列模型。Transformer架构由多个编码器层和解码器层组成,每个层都包含多头自注意力机制和前馈神经网络。这种架构可以捕捉长距离的依赖关系和语言结构,适用于处理大规模语言数据。自注意力机制(Self-Attention):自注意力机制是Transformer架构的核心组件之一。
2025-03-14 15:36:46
910
原创 本地离线部署大模型Ollama+AnythingLLM(保姆级)
包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。下载完后,双击OllamaSetup,自动安装成功,默认安装在C盘,不能选择安装路径的哦,安装完后,右下角会出现Ollama图标。Qwen7b.gguf是阿里巴巴的通义千问大模型,7B大模型,7亿参数,至少需要8G内存,越大回复越流畅。以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;
2025-03-07 16:36:10
645
原创 大模型本地部署:只需三步,手把手带你在Mac本地部署运行AI大模型
在当前的技术环境下,大型语言模型(LLMs)已经成为人工智能领域的一个重要里程碑。这些模型能够在各种任务上展现出人类水平的性能,包括但不限于文本生成、语言理解和问题解答。随着开源项目的发展,个人开发者现在有机会在本地部署这些强大的模型,以探索和利用它们的潜力。本文将详细介绍如何使用Ollama,一个开源项目,在Mac上本地运行大型模型(Win同理)。通过遵循以下步骤,即使是配备了几年前硬件的电脑,也能够顺利完成部署和运行。开源项目ollama:github链接。
2025-03-07 16:33:14
1050
原创 本地部署ai大模型(非常详细),零基础入门到精通,看这一篇就够了
现在的ai很多,让我看得有些眼花缭乱,随着ai的发展,现在已经有很多ai的大模型已经支持开源,所以现在支持部署一个大模型在自己电脑上,数据私人化。如果不知道自己是否需要或者是否合适配置可以跳到本文的结尾查看小编的使用感受。前排提示,文末有大模型AGI-优快云独家资料包哦!首先打开开源网站github,大家自行百度就好然后用到现在非常火的ollama这个开源项目,项目地址是各位可以直接打开,然后里面有他们的项目介绍,还有直达官网的链接,然后自行选择下载对应的版本。
2025-03-07 16:13:22
1016
原创 大模型终极指南:写给LLM新手的建议,助你少走两年弯路
1.不要只关心微调,SFT,RLHF,作为系统性学习是OK的,切忌花太多精力。2.想做应用的,建议集中到某个垂直领域比如对话机器人,问答系统,金融/医疗/教育方向,找一个具体的场景,把它做好,做深。3.多关心数据,数据管道,高质量训练/测试集的构建经验,对数据的感觉,是最直接,也是最适合用到未来工作当中的。4.大模型不只有算法,也可以有工程。大公司拼的都是基建,平台是对业务的支撑,牛逼的基础设施是大模型产品成功不可或缺的因素。读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用。
2025-03-04 17:40:09
1360
原创 2025大模型学习路线(超全面!超详细!)收藏这一篇就够了!
在深度学习领域,"大模型"通常指的是模型参数数量庞大、拥有深层结构的神经网络。这些模型的规模通常表现为网络中的参数数量,即模型中需要学习的权重和偏置的数量。具体来说,大模型可能包含数百万到数十亿的参数。
2025-03-04 17:38:57
359
原创 超越99% AI课程的大语言模型学习指南,AI大模型学习路线最新分享!
你是否因为大语言模型学习曲线陡峭,而迟迟不敢开始?又或者,你尝试过一些课程,却发现内容要么过于浅显,要么太过晦涩难懂,导致中途放弃?别担心,这篇文章将为你扫清障碍,无论你是零基础小白,还是希望更进一步的开发者,这份精心规划的学习指南都能帮你找到适合自己的学习路径。今天分享的这份学习指南不仅涵盖了从入门到专家的完整学习路线,还为你整理了丰富的资源链接,带你高效开启 AI 世界的大门!前排提示,文末有大模型AGI-优快云独家资料包哦!
2025-03-04 17:36:53
1050
原创 用LangChain的LLM Graph Transformer解锁构建知识图谱构的新姿势
构建知识图谱是一个令人兴奋但充满挑战的任务,核心在于将非结构化的文本转化为结构化数据。这种方法已经存在了一段时间,但随着 LLM 的出现,这项技术开始进入主流应用领域。下图展示了将多篇文档中的文本信息(例如描述某人及其与公司的关系)转化为知识图谱。在左侧,我们看到的是原始的非结构化句子;而在右侧,这些信息被提取、组织,形成了实体和关系的可视化图谱,清晰地展现了“谁创立了什么公司”或“谁在哪些公司工作”等信息。那么,为什么要将文本转化为结构化的知识图谱呢?一个重要的应用场景是 RAG。
2025-03-03 16:20:59
677
原创 动手部署671B R1模型,详尽教程来了!
DeepSeek-R1 系列发布了 8 个开源模型,其中原生 DeepSeek 的只有 R1-Zero 和 R1,其他模型则是基于 DeepSeek 基础模型进行知识蒸馏,并采用 Qwen 或 LLaMA 架构的二次开发版本。本文动手部署了原生的 R1 版,当然受限于硬件条件限制采用了 2.51-bit 量化方案,并实际测试得出需要使用 4 块 H20 来进行部署 2.51-bit 量化的版本,需要 2 块 H20 来部署 1.58-bit 量化的版本。
2025-03-03 16:19:28
1018
原创 被问爆了!两个实战案例告诉你:不完美的AnythingLLM如何调出专业级法律文书知识助手
在法律文献检索领域,更“完美而恰当”的策略之一是:按法条分段,而非机械的按chunk size 分。但在AnythingLLM中目前不支持按段落或其他策略进行分切。调参的依据就是 调整一个参数,使之逼近按法条分段分切的效果。尽管不完美,但是足够好用。真相:尽管不完美,但是AnythingLLM调参后足够好用。另外1,有一些公网平台的 “法律文献检索智能体”,是基于大模型已学习的所有法律条文和条款,一般问答够用。
2025-03-03 16:17:45
1613
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人