
AI大模型
文章平均质量分 73
总结AI大模型学习的知识,以及AI大模型在行业场景的应用
技术宝哥
15年互联网大厂技术人,现京东联盟技术负责人,深耕技术管理、技术架构、广告技术、AI大模型,致力于技术传播、分享
微信公众号:技术宝哥
展开
-
LangChain4j (3):集成 DeepSeek 大模型的Java程序
本文详细介绍如何使用 LangChain4j 调用 DeepSeek 大模型。这个 token 就像是一把钥匙,用于开启与 DeepSeek 大模型的交互通道。原创 2025-04-15 17:53:36 · 358 阅读 · 0 评论 -
LangChain4j(2):Chat、流式与文生图模型功能
本文将探讨 LangChain4j 的聊天对话、流式对话以及文生图这三种常见且实用的功能,以及实际代码示例原创 2025-04-10 23:31:24 · 522 阅读 · 0 评论 -
LangChain4j(1):初步认识Java 集成 LLM 的技术架构
LangChain 作为构建具备 LLM 能力应用的框架,虽在 Python 领域大放异彩,但 Java 开发者却只能望洋兴叹。LangChain4j 正是为解决这一困境而诞生,它旨在借助 LLM 的强大效能,增强 Java 应用,简化 LLM 功能在Java应用中的集成流程。原创 2025-04-10 23:16:01 · 1123 阅读 · 0 评论 -
一文读懂知识蒸馏技术的原理、方法与应用
通过蒸馏教师模型的中间层特征,学生模型能够学习到教师模型在处理数据过程中所提取的关键特征,进一步丰富自己的知识储备。而小模型则是渴望学习的学生,通过知识蒸馏技术,学生模型能够从教师模型身上快速有效地学习到那些经过漫长训练才获得的宝贵知识。这样一来,这些小型设备能够在保持较高准确率的同时,以更低的能耗和更快的速度运行模型,为用户提供实时的智能服务,如手机端的图像识别应用、智能手表的健康监测功能等。知识蒸馏技术可以在模型压缩方面发挥重要作用,通过将大型模型的知识蒸馏到小型模型中,实现模型的轻量化。原创 2025-03-25 22:41:00 · 1150 阅读 · 0 评论 -
深入LangChain:LLM交互机制与RAG集成的技术
本文将聚焦于 LangChain 如何集成检索增强生成(RAG),了解其架构、主要组件,以及与 LLM 的交互原创 2025-03-23 21:29:37 · 555 阅读 · 0 评论 -
一文读懂 GPT 与 BERT:预训练逻辑及差异剖析
在自然语言处理(NLP)领域,预训练语言模型GPT(Generative Pretrained Transformer)和 BERT(Bidirectional Encoder Representations from Transformers)作为杰出代表,备受关注。本文将深入探讨它们的预训练逻辑,并详细对比二者的区别原创 2025-03-23 20:31:12 · 516 阅读 · 0 评论 -
什么是HuggingFace?Huggingface 已是无法绕过的存在
Huggingface汇聚了众多最前沿的模型和数据集等有趣的成果,与强大的 transformers 库深度结合,也因transformers模型而闻名,为开发者提供了一个极为便捷的平台,使得大家能够快速上手学习和使用这些模型。这为广大研究者和开发者提供了宝贵的资源,无论是初学者想要尝试不同的模型架构,还是资深专家进行创新性的研究,都能在这里找到合适的模型起点。Huggingface 的 Docs 包含了各种模型算法等说明使用文档,无论是对模型原理的深入解释,还是实际使用中的参数设置和代码示例。原创 2025-03-20 22:11:39 · 3459 阅读 · 0 评论 -
初步了解RAG:检索增强生成技术
在大语言模型(LLM)盛行的时代,RAG(Retrieval Augmented Generation,检索增强生成)的技术频繁崭露头角,让我们一同了解下什么是RAG 技术?原创 2025-03-20 13:31:32 · 361 阅读 · 0 评论 -
初步探讨大模型微调:策略、方法与 LoRA 框架
为何要对大模型进行微调?如何对大模型进行微调?什么是 LoRA:大型语言模型的低秩适应?原创 2025-03-17 14:08:48 · 363 阅读 · 0 评论 -
初步解读DeepSeek:有哪些优势和技术创新?
DeepSeek作为AI 领域的一匹黑马,凭借独特技术优势与创新设计火爆出圈,成为众多技术爱好者和大众热议的焦点,本文将作为对DeepSeek的初步学习简单总结,了解一下DeepSeek到底有哪些优势和技术创新?原创 2025-03-14 12:59:48 · 737 阅读 · 0 评论 -
3分钟了解什么是多模态大模型?
在机器学习的世界中,每一种信息的呈现形式,都被称作一种 “模态”。像是我们日常接触到的文本、图像、视频和音频,就分别代表了不同的模态。当多种模态的信息汇聚在一起,就构成了 “多模态”,包括但不限于文本、图像、视频、音频等各类数据。而多模态研究,也是人工智能领域的关键挑战与前沿方向。原创 2025-03-13 12:37:35 · 261 阅读 · 0 评论 -
深入剖析 Transformer:解锁 AI 架构的核心奥秘
在当今人工智能的蓬勃发展中,Transformer 无疑是一座具有里程碑意义的灯塔,指引着无数技术探索者前行。本文与你一起你深入解读 Transformer 及其相关的关键技术概念,了解一下Transformer究竟是什么,为后续深入学习AI大模型及更好的探索行业应用做铺垫原创 2025-03-12 12:31:09 · 1662 阅读 · 0 评论 -
大模型训练 GPU 怎么选?一文读懂
在大模型训练领域,英伟达(NVIDIA)系列 GPU 长期占据着主导地位。但由于中美关系的影响,获取高性能 GPU 的难度日益增大,介绍几款适合大模型训练的常用 GPU 及其价格情况。原创 2025-03-11 01:55:07 · 303 阅读 · 0 评论 -
探秘大模型:为何 GPU 是大模型训练的 “标配”?
AI大模型、人工智能时代,你是否思考过,为何大模型训练对 GPU 如此 “情有独钟” 呢?原创 2025-03-11 08:00:00 · 499 阅读 · 0 评论 -
AI大模型概念知多少
什么是大模型、模型参数是什么、B代表什么意思、什么是张量,学好AI的基础概念理解原创 2025-03-07 21:52:22 · 346 阅读 · 0 评论 -
DeepSeeK本地部署安装
deepseek 本地部署原创 2025-03-07 00:35:52 · 430 阅读 · 0 评论