ghjhjjjbjibh-优快云博客

原创 AI大模型学习路线（2025最新）从零基础入门到精通，看完这一篇就够了

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。恭喜你，如果学到这里，你基本可以找到一份大模型 AI相关的工作，自己也能训练 GPT 了！对全球大模型从性能、吞吐量、成本等方面有一定的认知，可以在云端和本地等多种环境下部署大模型，找到适合自己的项目/创业方向，做一名被 AI 武装的产品经理。天道酬勤，你越努力，就会成为越优秀的自己。

2025-05-13 14:01:39 792

原创图解AI大模型三大核心技术：RAG、大模型、智能体，全程干货，零基础小白也能看懂！！

阅读AI大模型经典书籍可以帮助读者提高技术水平，开拓视野，掌握核心技术，提高解决问题的能力，同时也可以借鉴他人的经验。我们学习AI大模型必然是想找到高薪的工作，下面这些面试题都是总结当前最新、最热、最高频的面试题，并且每道题都有详细的答案，面试前刷完这套面试题资料，小小offer，不在话下。它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。

2025-05-04 16:27:42 212

原创这篇科普让你Get所有大模型的基础核心知识点

ChatGPT-4的发布在各个领域引起了巨大的轰动，因为它在人工智能技术中达到了一个新的高度。从ChatGPT发布以来，国内外都迎来了新一轮大模型浪潮。那么，有科技小白会问：GPT就是大模型吗？ChatGPT和大模型之间是什么关系？大模型现状发展如何？本篇文章将带来，关于大模型的所有知识点。

2025-05-04 16:23:49 859

原创 AI大模型应用架构 ai模型算法

1，将数据集中的所有的数据点都当做一个独立的集群 2，计算两两之间的距离，找到距离最小的两个集群，并合并这两个集群为一个集群，认为距离越小，两者之间的相似度越大，越有可能是一个集群。3，重复上面的步骤2，直到聚类的数目达到设定的条件，表示聚类过程完成。而相反的，在自上而下的算法中，刚开始所有的叶子被当做一个巨型集群，然后对这个集群进行不断的分解，直到所有的集群都变成一个个单独的数据点，即巨型集群被分解成单独的叶子节点，这种自上而下的的分解算法也叫做分裂层次聚类算法。

2025-05-04 16:20:38 755

原创为什么大厂都在用LangChain？一文拆解大模型应用主流开发框架！

本文主要从Why、What、How的角度，拆解目前主流的大模型应用开发框架LangChain，之后给到一个带RAG能力的聊天机器人（Chatbot）项目，来感受下LangChain在。

2025-04-26 13:23:29 460

原创什么是大模型（LLMs）？一文读懂什么是大模型

大模型。

2025-04-25 14:18:57 1014

原创 AI大模型——DeepSeek模型部署实战

首先指出可通过下载Ollama来部署DeepSeek-R1模型，并给出了模型不同参数版本及存储信息。接着说明了如何通过Chatbox官网下载并接入DeepSeek API，以及如何接入本地部署模型。你可以根据你的硬件情况选择，通常模型大小（参数量）越大，模型的理解和生成能力越强，但也会消耗更多的计算资源。我正在写一篇文章，我起的名字是“手把手教你部署 DeepSeek 本地模型”。目前deepseek-r1模型大小提供了7个选择：1.5b、7b、8b、14b、32b、70b、671b。

2025-04-24 13:41:36 802

原创大模型概述

近年来，随着计算能力的增强和数据量的爆炸式增长，大模型进入了快速发展的新阶段，展现出强大的语言理解和生成能力。同时，大模型的应用也带来了数据、计算和伦理等挑战，要求我们在享受技术进步带来的便利的同时，也要关注其可能带来的风险和影响。其次，大模型推动了数据预处理和模型训练技术的创新，使得模型在复杂任务上的表现显著增强。大模型在图像识别、目标检测、图像分割等方面展现出卓越的性能，如用于自动驾驶的车辆识别、医疗影像分析中的疾病诊断、以及安防监控中的异常行为检测等，极大地推动了计算机视觉技术的发展。

2025-04-23 14:03:42 916

原创 AI大模型 —— 国产大模型 —— 华为大模型

放眼望去，虽然欧美公司一直鼓励合作商搞技术落地的创新，但是却少有见效，但是华为却是早早就对此进行布局，不仅在很多有潜力的领域早早进行涉足并积累数据和经验，更是依赖着其起家时候所构建的全球网络去推进，而且一边在国内搞AI技术的追赶，还一边把to B的业务重点转到to C的业务上，快速积累充足的资金，积累足够的资金流。可以说，其它公司搞的AI大模型只是模型，而华为搞的AI大模型则是领域，是对AI技术落地的提前探索，是一种大的布局，如果这种布局成功那必然是空前的成功和真正的突破。另一种是华为大模型。

2025-04-21 13:51:13 551

原创 Java调用LLM大模型 - 基于 Spring AI 实现

graph TDA[Spring AI] --> B[统一API接口]A --> C[多模型支持]A --> D[企业级特性]B --> E(OpenAI/Azure/阿里云)D --> G(安全审计/监控指标)

2025-04-19 13:41:28 1144

原创 docker 大模型

docker run -d --name your_model_container your_model_image：以分离模式运行一个容器并指定容器的名称（your_model_container）。docker build -t your_model_image .：构建 Docker 镜像并为其指定一个标签名（your_model_image）。docker exec -it your_model_container bash：进入到正在运行的容器中，你可以直接在容器内运行调试命令或访问模型。

2025-04-19 13:34:11 437

原创大模型应用_AutoGPT

基于Docker的AutoGPT企业级部署指南。

2025-04-18 13:30:55 1240

原创大模型esrgan 大模型概念股

分布式训练（Distributed Training）和混合精度训练（Mixed Precision Training）：为了处理大模型的计算和存储需求，研究者采用了一些高效训练策略，如分布式训练（将模型和数据分布在多个设备或节点上进行并行计算）和混合精度训练（利用不同精度的数值表示以减少计算和内存资源需求）。在训练过程中，通过优化算法（如梯度下降）来调整这些参数，以最小化模型预测值与实际值之间的差距。参数的初始值通常是随机的，随着训练的进行，它们会逐渐收敛到合适的数值，以捕捉输入数据中的复杂模式与关系。

2025-04-17 15:38:48 711

原创 embind模型大模型

数值模式模拟是分析大气污染物时空分布和成分贡献的重要工具，利用模拟结果可以分析大气污染的来源、成因、污染程度、持续时间、主要成分、相对贡献等问题，有助于分析并合理控制污染源排放，为产业调整提供参考。更多应用包含:WRF模式、NCL、CMAQ空气质量模式、PMF源解析、Calpuff模型、FLEXPART模式、SMOKE模式、VOCs排放量核算、大气臭氧来源解析、CAMx、EKMA曲线、MCM箱模型、AERMOD模型、WRF-Hydro、WRF-Chem、WRF-UCM、WRF-SOL。

2025-04-17 15:37:12 523

原创自监督图像增强

在这里，规范的SSL通道(即自监督预训练模型并在下游任务上对其进行调优)被重新访问和扩展，以学习地面真相注释难以计算的任务(例如，密集深度)，从而为计算机视觉和机器人技术带来全新的SSL方法。在本教程中，我们将通过AD的基本感知任务的镜头，深入介绍自我监督学习的各种范式(旧的和新的)。具体来说，本教程将涵盖以下主题:(1)从自动驾驶数据中进行自我监督表示学习，(2)深度估计的自监督学习，(3)三维检测和跟踪的自监督学习，(4)里程数测量和定位的自监督学习。

2025-04-17 13:54:30 167

原创零基础入门AI：一键本地运行各种开源大语言模型 - Ollama

Ollama 是一个可以在本地部署和管理开源大语言模型的框架，由于它极大的简化了开源大语言模型的安装和配置细节，一经推出就广受好评，目前已在github上获得了46k star。不管是著名的羊驼系列，还是最新的AI新贵Mistral，等等各种开源大语言模型，都可以用Ollama实现一键安装并运行，支持的更多模型的列表可以查看Ollama官网。本文就让我们一起入门Ollama。

2025-04-16 20:48:07 478

原创 Ai 大语言模型技术原理

它是一种面向对象的编程语言，专注于提供AI项目上所需的所有高级功能，它是可移植的，并且提供了内置的垃圾回收。天瑞地安程序员明明认为：在这些编程语言中，Python因为适用于大多数AI sub-field，渐有成为AI编程语言之首的趋势，而Lisp和Prolog因其独特的功能，所以在部分AI项目中卓有成效，地位暂时难以撼动。Python之所以时候AI项目，其实也是基于Python的很多有用的库都可以在AI中使用，如Numpy提供科学的计算能力，Scypy的高级计算和Pybrain的机器学习。

2025-04-16 20:47:17 316

原创大模型与AIGC 大模型与AI的关系

ViT给做视觉的同学们带来的感受有点文艺复兴的意思，因为把图像切成很多块的方式是深度学习之前的视觉最基本的操作，不规则的就是传统的SIFT [3]，规则的切patch方式就是HoG [4]，在十年前的很多比赛中也都取得了不错的结果（CV和NLP领域经常互相借鉴，Bag-of-visual-words也是从NLP领域借鉴过来的）。个人感觉有价值的方向还是2.a和2.b中提到的，难的任务，相似的功能，相同的数据，大模型可以吃得下，就有其优势。所以，这一环节的结论，仍然是无法清晰地给定，什么是大模型。

2025-04-16 20:45:24 403

原创如何系统的入门大模型？

作者：悦木Ivy链接：https://www.zhihu.com/question/621550974/answer/3304195504来源：知乎著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。本篇回答默认面向对大模型领域感兴趣的程序员。基于提示词对大模型的使用，会问问题就行。在大模型生态之上做业务层产品。AI主播、AINPC、AI小助手。。。之前是会调API就行。现在有了，连调用API都可以不用了，动动嘴就可以实现应用生成。：给大模型配个“资料袋”大模型外挂。

2025-04-16 16:15:49 757

原创大模型esrgan 大模型概念股

分布式训练（Distributed Training）和混合精度训练（Mixed Precision Training）：为了处理大模型的计算和存储需求，研究者采用了一些高效训练策略，如分布式训练（将模型和数据分布在多个设备或节点上进行并行计算）和混合精度训练（利用不同精度的数值表示以减少计算和内存资源需求）。在训练过程中，通过优化算法（如梯度下降）来调整这些参数，以最小化模型预测值与实际值之间的差距。参数的初始值通常是随机的，随着训练的进行，它们会逐渐收敛到合适的数值，以捕捉输入数据中的复杂模式与关系。

2025-04-16 13:36:58 368

原创 NLP大模型CCV大模型科学技术大模型

我们首先初始化一个chunk数组，每次都往chunk中添加同一个document中的一个句子，当chunk的长度大于target的长度（此处target的长度一般是max_seq_length，但是为了匹配下游任务，target的长度可以设置一定比例short_seq_prob的长度少于max_seq_length）的时候，随机选择一个某个句子作为分割点，前面的作为句子A，后面的作为句子B。需要注意的是，中文的每个字都是一个word piece，所以WWM的方法在中文中，就是MASK一个词组。

2025-04-15 14:16:25 670

原创大模型入门 | 什么是大模型（一）大模型的由来、大模型的特性、大模型的技术、大模型的应用

此外，在医学和生物学领域，多模态的大模型可用于疾病诊断、药物发现、基因编辑等，大模型能够从复杂的生物医学数据中提取有用的信息，辅助医生做出更准确的诊断，或者帮助研究人员设计新的药物。2022年年底，ChatGPT以聊天机器人的身份横空出世，它不仅能够回答问题，还能创作文章、编程，甚至模仿人类的对话风格，其几乎无所不能的回答能力使得人们对大语言模型的通用能力有了全新的认识[4]。大模型通过其庞大的参数量、深层次的网络结构和广泛的预训练能力，能够捕捉复杂的数据模式，在多个领域中表现出卓越的性能。

2025-04-15 14:14:49 286

原创大模型安全 | 大模型窃取、大模型剽窃

需要注意的是，虽然攻击者无法完全复制LLM模型，但他们可以复制其中的部分模型。对于适用的情况，对API调用进行速率限制和/或过滤器，以降低从LLM应用程序泄露数据的风险，或实施技术来检测来自其他监控系统的（例如数据丢失防护）提取活动。被盗模型可用作影子模型，用于进行对抗性攻击，包括未经授权访问模型中的敏感信息，或在未被检测到的情况下使用对抗性输入进行实验，以进一步注入高级提示。为减轻与LLM模型盗窃相关的风险并保护依赖LLM的个人和组织的利益，采用全面的安全框架，包括访问控制、加密和持续监控，至关重要。

2025-04-15 14:12:56 444

原创 Mistral Al发布开源代码大模型Codestral Mamba、数学大模型Mathstral

法国人工智能初创公司 Mistral 以其强大的开源人工智能模型而闻名。今天，该公司在其不断壮大的大型语言模型 (LLM) 家族中推出了两个新产品：一个是基于数学的模型，另一个是面向程序员和开发人员的代码生成模型，其基础是去年底由其他研究人员开发的名为 Mamba 的新架构。Mamba 试图通过简化注意力机制来提高大多数领先 LLM 所使用的 Transformer 架构的效率。与更常见的基于 Transformer 的模型不同，基于 Mamba 的模型推理时间更快，上下文时间更长。包括 AI21 在内的

2025-04-14 16:45:30 578

原创时下改变AI的六大NLP语言模型

本文将深入研究大语言模型领域的最新进展，改变AI的6大NLP语言模型，每个模型能够引入的增强功能、以及潜在功能应用与限制。在快速发展的人工智能（AI）领域，自然语言处理（Natural Language Processing，NLP）已成为了研究人员和开发人员的关注焦点。作为该领域显著进步的标志，近年来业界出现了多种突破性的语言模型。它们推动了机器理解和生成能力的进行。在本文中，我们将深入研究大语言模型领域的最新进展，探索每个模型能够引入的增强功能、以及潜在功能应用。

2025-04-14 16:43:55 884

原创 AI基础软件：如何自主构建大+小模型？

九章云极DataCanvas以创造智能探索平台为使命，怀揣着助力全球企业智能升级的愿景，是中国人工智能基础软件领域的佼佼者。公司专注于自主研发的人工智能基础软件产品系列和解决方案，为用户提供全面的人工智能基础服务，旨在帮助用户在数智化转型过程中轻松实现模型和数据的双向赋能，以低成本高效率的方式提升企业决策能力，从而实现企业级 AI 的规模化应用。

2025-04-14 16:42:57 803

原创针对 AI大模型的几种攻击方法

随着人工智能、大数据等新技术的应用与推广，大模型也成为一个流行技术。当然就会有组织和个人开始利用各种技术来攻击它们。

2025-04-14 16:42:14 480

原创 AI 大底座，大模型时代的答卷

早在 2021 年 6 月，为了满足未来的大模型训练任务，百度智能云开始规划全新的高性能 GPU 集群的建设，联合 NVIDIA 共同完成了可以容纳万卡以上规模的 IB 网络架构设计，集群中节点间的每张 GPU 卡都通过 IB 网络连接，并在 2022 年 4 月将集群建设完成，提供单集群 EFLOPS 级别的算力。同时，百度百舸完成相应的任务和资源的调度。在提交待训练的大模型后，AI 框架会综合考虑大模型的结构等信息、以及训练集群的能力，为本次训练任务制定出一个并行训练策略，并完成 AI 任务放置。

2025-04-14 16:41:07 1250

原创一分钟搭建私有Al大模型deepseek-r1

Ollama：可以理解为是 docker，快速安装各种大模型，下载后一键安装。这里你可以搜索自己想安装的模型，获取不同的命令。好了，就这么简单，搭建私服 AI 完成。安装完成后，提示输入信息。

2025-04-12 14:23:28 332

原创 AI-大模型

参数量级：现代大模型参数规模通常超过100亿（如GPT-3达1750亿）架构基础：基于Transformer的自注意力机制训练成本：需要数千张GPU/TPU的分布式训练数据需求：训练语料通常达TB级别（如The Pile数据集800GB）

2025-04-12 13:47:27 947

原创 AI大模型学习笔记

Diffusion Transformer原理(Sora/Stable Diffusion 3)抗干扰能力建设(Dialogue Transformers)Evol-Instruct技术应用(增强数据多样性)AutoDL云部署实践(百川2、GLM2案例)GPT系列模型演进路线(GPT1-GPT4)vLLM高并发推理优化(24倍吞吐提升)AI芯片选型指南(商业项目GPU比较)上下文学习/思维链/RLHF关键技术。llama_index信息检索革新。算力/内存/带宽需求计算方法。零一万物Yi数据处理方法论。

2025-04-11 13:36:49 350

原创 AI大模型应用入门实战与进阶：AI大模型在内容审核中的应用

内容审核是指对互联网上的各类内容（如文本、图像、音频和视频）进行评估和判断，以确保其符合相关政策和规定。随着互联网的普及以及用户生成内容的激增，内容审核的重要性日益凸显。人工审核难以满足大规模需求，因此借助人工智能技术实现自动化审核成为必然趋势。AI大模型由于其强大的处理能力，在内容审核领域展现了广阔的应用前景。

2025-04-10 13:47:15 1009

ghjhjjjbjibh的博客

原创 AI大模型学习路线（2025最新）从零基础入门到精通，看完这一篇就够了

原创图解AI大模型三大核心技术：RAG、大模型、智能体，全程干货，零基础小白也能看懂！！

原创这篇科普让你Get所有大模型的基础核心知识点

原创 AI大模型应用架构 ai模型算法

原创为什么大厂都在用LangChain？一文拆解大模型应用主流开发框架！

原创什么是大模型（LLMs）？一文读懂什么是大模型

原创 AI大模型——DeepSeek模型部署实战

原创大模型概述

原创 AI大模型 —— 国产大模型 —— 华为大模型

原创 Java调用LLM大模型 - 基于 Spring AI 实现

原创 docker 大模型

原创大模型应用_AutoGPT

原创大模型esrgan 大模型概念股

原创 embind模型大模型

原创自监督图像增强

原创零基础入门AI：一键本地运行各种开源大语言模型 - Ollama

原创 Ai 大语言模型技术原理

原创大模型与AIGC 大模型与AI的关系

原创如何系统的入门大模型？

原创大模型esrgan 大模型概念股

原创 NLP大模型CCV大模型科学技术大模型

原创大模型入门 | 什么是大模型（一）大模型的由来、大模型的特性、大模型的技术、大模型的应用

原创大模型安全 | 大模型窃取、大模型剽窃

原创 Mistral Al发布开源代码大模型Codestral Mamba、数学大模型Mathstral

原创时下改变AI的六大NLP语言模型

原创 AI基础软件：如何自主构建大+小模型？

原创针对 AI大模型的几种攻击方法

原创 AI 大底座，大模型时代的答卷

原创一分钟搭建私有Al大模型deepseek-r1

原创 AI-大模型

原创 AI大模型学习笔记

原创 AI大模型应用入门实战与进阶：AI大模型在内容审核中的应用

空空如也

空空如也