大语言模型
文章平均质量分 93
大模型是指具有大规模参数和复杂计算结构的机器学习模型。这些模型通常由深度神经网络构建而成,拥有数十亿甚至数千亿个参数。大模型的设计目的是为了提高模型的表达能力和预测性能,能够处理更加复杂的任务和数据。大模型在各种领域都有广泛的应用,包括自然语言处理、计算机视觉、语音识别和推荐系统等。
大数据与AI实验室
计算机科学与技术本科,计算机技术硕士,现任职于某互联网公司,担任大数据研发工程师。优快云云原生领域优质创作者、博客专家。专注于大数据、云计算、人工智能等融合方向研究,致力于帮助企业解决实际痛点问题、赋能生产,接受相关解决方案咨询。书籍《高质量上云》正在积极撰写中,敬请期待。微信公众号同名:大数据与AI实验室。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【人工智能】OpenAI 重磅推出 Sora2
OpenAI 推出新一代视频生成模型 Sora2,在视频质量、音画同步、可控性等方面显著提升,新增个性化 Cameo 功能及社交平台 Sora App。Sora2 标志着AI视频从"可用"到"好用"的跨越,同时完善了安全审核、肖像保护等内容治理机制。原创 2025-10-08 23:42:20 · 1270 阅读 · 0 评论 -
【人工智能】AI Agent 实战:使用 Dify 搭建个人在线旅游助手
本文介绍了使用 Dify 平台搭建个人在线旅游助手 AI Agent 的实战教程。文章分为准备工具、构建 Agent 和优化输入三个部分:首先需要配置 Google 搜索、webscraper 爬虫和 Wikipedia 工具;然后通过创建空白 Agent 应用并添加这些工具;最后通过设置变量(目的地、旅行天数、预算)来规范化用户输入。教程包含详细操作步骤和示例输出,展示了如何打造一个能提供酒店推荐、行程规划等服务的 AI 旅游助手,帮助用户掌握 Agent 构建、提示词撰写和变量使用等核心技能。原创 2025-07-19 09:54:11 · 1840 阅读 · 0 评论 -
【人工智能】使用 Dify 搭建 AI 图片生成应用
本文介绍了使用 Dify 平台快速搭建 AI 图片生成应用的方法。主要内容包括:1)获取并配置 Stability API 密钥;2)设置模型供应商(如 OpenAI 或 Groq 平台);3)通过 Dify 构建 Agent 智能体,配置 LLM 模型和绘画工具;4)提示词工程基础,包括系统提示词撰写和约束设置;5)应用发布与分享。文章还探讨了画风指定、请求拒绝等实用技巧,并解释了模型幻觉的概念。该教程为开发者提供了完整的 AI 绘图应用构建方案,适合快速入门图像生成技术。原创 2025-07-18 23:56:57 · 1911 阅读 · 0 评论 -
【人工智能】通过 Dify 构建智能助手
本文介绍了如何利用 Dify 平台快速创建具备自主任务处理能力的 AI 助手。文章从定义智能助手的核心能力(目标规划、任务拆解等)入手,详细说明了操作流程:选择模板或自定义创建,配置推理模型,编写任务指令,添加知识库和工具,设置 Function calling 或 ReAct 推理模式,并配置对话开场白和文件上传功能。最后强调调试预览后即可发布为 Web 应用,适用于财务报表分析、Logo 设计等多样化场景。原创 2025-07-14 23:06:52 · 1625 阅读 · 0 评论 -
【人工智能】通过 Dify 构建聊天助手
本文介绍了如何使用 Dify 平台构建对话型聊天助手应用。文章首先说明了对话型应用的适用场景,包括客户服务、在线教育、医疗保健和金融服务等领域。然后详细讲解了应用编排步骤:从创建应用、编写提示词、添加上下文和文件上传功能,到调试和最终发布。特别展示了如何创建面试官应用的示例,包括设置对话开场白和问题建议。原创 2025-07-14 22:27:33 · 2270 阅读 · 0 评论 -
【人工智能】Dify 中的 5 种应用类型
Dify 提供了 5 种基于大语言模型的应用类型:聊天助手(多轮对话)、文本生成应用(单次任务)、Agent(智能推理)、对话流(复杂流程)和工作流(批处理任务)。用户可通过三种方式创建应用:基于模板(新手友好)、空白创建(自定义开发)或导入 DSL 工程文件(快速部署)。不同应用类型在交互方式、API 接口和上下文管理上存在差异,开发者可根据需求选择适合的构建方式。Dify 同时提供 API 封装、WebApp 托管和开发工具界面,支持各类 AI 应用的快速实现与部署。原创 2025-07-13 15:28:06 · 1068 阅读 · 0 评论 -
【人工智能】AI Agent 工作流及产品介绍
AI Agent 的工作流程是一个 “感知 → 思考 → 行动 → 学习” 的智能闭环。目前该领域处于爆发期,既有像 LangChain / AutoGen 这样的强大开发框架,也有 AutoGPT / BabyAGI 这样的概念先驱,更有 GPTs 这样的易用平台和 Devin 这样的专业领域标杆。优秀的 Agent 产品正在从实验走向实用,在客服、编程、数据分析、个人助理等多个领域展现出巨大潜力。衡量 Agent 好坏的核心在于其自主完成任务、有效使用工具、动态规划调整和持续学习进化的能力。随着 LLM原创 2025-07-12 16:27:33 · 1282 阅读 · 0 评论 -
【人工智能】Dify 接入大模型简介
Dify 是一款基于大语言模型的 AI 应用开发平台,支持接入多种主流模型供应商(如 OpenAI、Anthropic、讯飞星火等)。平台将模型分为系统推理、Embedding、Rerank和语音转文字四类,用户可根据需求选择。原创 2025-07-13 09:55:24 · 1726 阅读 · 0 评论 -
【人工智能】AI Agent 开发平台:Dify
Dify 是一款开源的大语言模型应用开发平台。它融合了 后端即服务和 LLMOps 的理念,使开发者可以快速搭建生产级的生成式 AI 应用。即使你是非技术人员,也能参与到 AI 应用的定义和数据运营过程中。由于 Dify 内置了构建 LLM 应用所需的关键技术栈,包括对数百个模型的支持、直观的 Prompt 编排界面、高质量的 RAG 引擎、稳健的 Agent 框架、灵活的工作流,并同时提供了一套易用的界面和 API。这为开发者节省了许多重复造轮子的时间,使其可以专注在创新和业务需求上。原创 2025-07-13 09:34:15 · 3075 阅读 · 0 评论 -
【人工智能】ChatGPT、DeepSeek-R1、DeepSeek-V3 辨析
ChatGPT(由 OpenAI 开发)和 DeepSeek(由深度求索公司开发)都是基于大语言模型(LLM,Large Language Model)的技术,但它们在模型架构、训练数据、优化目标和具体应用上存在差异。原创 2025-07-07 23:24:56 · 3802 阅读 · 0 评论 -
【人工智能】AI Agent 技术与应用场景解析
2025 年被广泛视为 AI Agent 元年,随着技术的成熟,AI Agent 将从辅助工具(Copilot)进化为自主执行者(Agent),甚至成为 “数字员工”,重塑企业工作流和人机协作模式。未来,AI Agent 可能会进一步结合具身智能(机器人控制)和多 Agent 系统,实现更复杂的自动化任务。原创 2025-07-06 22:28:14 · 1677 阅读 · 0 评论 -
【人工智能】大语言模型(LLM)& NLP
大语言模型是基于海量数据和参数训练的 "超级文字预测器",通过统计概率模仿人类语言,能完成聊天、写作、编程等多任务。与传统 NLP 技术相比,LLM 具有通用性、无需标注数据、参数规模超大等特点,实现了从专用工具到全能助手的进化。虽然 LLM 属于 NLP 范畴,但其 "涌现能力" 和模糊需求理解能力标志着技术的质变。作为 NLP 的 "究极形态",LLM 未来或将融合多模态,但语言核心仍植根于 NLP 基础技术。原创 2025-07-03 23:56:20 · 1173 阅读 · 0 评论 -
【自然语言处理】ChatGPT 相关核心算法
ChatGPT 的卓越表现得益于其背后多项核心算法的支持和配合。本文将分别介绍作为其实现基础的 Transformer 模型、激发出其所蕴含知识的 Prompt / Instruction Tuning 算法、其涌现出的思维链能力、以及确保其与人类意图对齐的基于人类反馈的强化学习算法。原创 2023-03-14 12:41:16 · 3275 阅读 · 1 评论 -
【自然语言处理】图解 Transformer
在本篇博客中,我们将介绍一种新的模型 Transformer,一种使用注意力机制来提高模型训练速度的模型。Transformer 是在论文 Attention is All You Need 中首次提出的。Tensor2Tensor 包提供了其基于 TensorFlow 的实现版本。哈佛大学的 NLP 小组也创建了一个指南,使用 PyTorch 实现了对论文的注释。原创 2023-02-19 20:48:56 · 1306 阅读 · 0 评论 -
【自然语言处理】Transformer 模型:概述及分类(综述)
在过去的数年里,基于 Transformer 的相关模型层出不穷。本文将对当下最流行的 Transformer 模型做一个简单全面的介绍。原创 2023-02-20 19:38:41 · 9666 阅读 · 2 评论 -
【自然语言处理】BERT & GPT
近年来,随着大规模预训练语言模型的发展,自然语言处理领域发生了巨大变革。BERT 和 GPT 是其中最流行且最有影响力的两种模型。在本篇博客中,我们将讨论 BERT 和 GPT 之间的区别以及它们的演变过程。原创 2023-02-27 14:57:45 · 2507 阅读 · 2 评论 -
【自然语言处理】从词袋模型到Transformer家族的变迁之路
本文简要介绍了 BOW、TF-IDF、Word2Vec、Transformer、BERT、GPT、RoBERTa、 XLM、Reformer、ELECTRA、T5 等模型。原创 2023-03-07 22:14:32 · 1251 阅读 · 2 评论
分享