自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 DeepSeek由V1到R1进化史:从算法革命到推理涌现

本文根据已发布的deepseek相关论文,对论文内容进行解析,分析出Deepseek-LLM (V1-V3)系列算法演变及知识推理是如何产出的,并对相关的模型特点进行了概括总结。V1模型重点在于保障效果的前提下,探索低成本算法,在低成本情况下做Scaling Laws实验,打牢基础。延用LLAMA 2 稠密(Dense)模型的架构,使用2万亿Token的中英数据来做超参数和模型大小/数据配比的Scaling Laws实验,后训练阶段使用SFT和DPO算法,在多个维度超越LLaMa2 70B。

2025-02-28 17:27:09 1214

原创 基于多智能体协议框架CrewAI+DeepSeek的实战

CrewAI是一个基于LangChain构建的多智能体协作框架,旨在通过角色分工和任务协作解决复杂问题。其核心特性包括:多智能体角色分配(如研究员、文案写手等)、灵活的任务管理(支持顺序/并行执行)、自主任务委托机制,以及兼容多种LLM模型(如GPT、DeepSeek等)。架构采用模块化设计,包含协调控制层、智能体执行层和任务调度层,支持工具集成和上下文共享。典型应用场景包括自动化报告生成、复杂问题调试等。项目提供纯代码和CLI两种开发模式,支持YAML配置和自定义工具扩展。通过分层任务处理(规划-生成-审

2025-10-28 10:02:29 956

原创 三大AI Agent技术栈深度对比

《三大AI Agent技术栈深度对比:Coze、Dify与FastGPT》摘要:本文对比分析三类主流AI技术框架的产品定位与技术特性。Coze适合无代码快速构建聊天机器人,Dify支持开发者进行复杂AI应用的多模型管理,FastGPT则专注企业级知识库的私有化部署。技术架构方面,FastGPT采用微服务设计,Dify提供BaaS服务,Coze基于低代码平台。工作流编排上,Dify和Coze功能更丰富,分别侧重数据处理和交互优化。选择建议:企业敏感数据推荐FastGPT,复杂AI中台选Dify,轻量级场景适用

2025-06-13 16:01:53 2095

原创 Qwen3第一时间详解:性能、突破、训练方法、版本迭代

今天凌晨,Qwen3发布了,这可能是2025年五一节假日前,在科技圈算是头条了;在《是讯飞晓医?嗯,是基于RAGFlow本地化搭建AI医疗助手》文章中,小编借助于RAGFlow+Qwen2.5,构建了一个本地化的AI医疗助手;让我们来详解一下Qwen3。

2025-04-29 14:10:13 1700

原创 基于RAGFlow本地化搭建AI医疗助手

本文讨论了开源的RAG引擎RAGflow,介绍其可用于快捷创建医疗问诊助手等AI助手,探讨了其创新功能、技术特点、实现逻辑、安装配置及应用等方面。

2025-03-26 14:26:17 2132

原创 用LLM构建基于本地知识库的智能问答应用

微调是基于一个预训练模型(通常是在大规模数据集上进行训练得到的模型,如ChatGLM2-6B、BaiChuan2-13B等),然后在一个特定任务或领域上进一步调整模型的权重,以使其适应新任务或领域的需求。

2025-03-19 10:12:50 2097

原创 从0到1手搓一个AI Agent

这个节点就是大模型的配置,在这里我们需要大模型帮我总结文章内容,提炼文章关键词。红框 1:此处可以选择不同的模型来处理,不同的提示词在不同的模型下表现有时候是不一致的,所以这里需要注意的是在当前这个场景下根据大模型的特点,选定模型后,再去写系统提示词和用户提示词。红框 2:输入,可以将上个节点输出的参数标题和内容传到这里。

2025-03-13 15:37:19 2128

原创 浅谈ChatGPT与GPT

本文简述ChatGPT与GPT的关系,以及GPT1到GPT4的算法的核心思想及区别(文章字数偏多,阅读时间较长,文笔有限,继续努力)GPT(Generative Pretrained Transformer)是由OpenAI公司开发的一种大型语言模型。GPT模型的核心是基于“变换器”(Transformer)架构,这种架构最初是在2017年由Vaswani等人提出的,主要用于处理自然语言处理(NLP)任务。GPT的工作原理主要包括两个阶段:预训练和微调。

2025-03-13 11:07:29 1375

原创 从0到1构建商用AI Agent 需要哪些步骤

如果你是非技术人员,这对你来说非常有帮助;如果你是技术人员,这个视频将帮助你少走一些弯路,快速上手!这篇内容将从整体上介绍打造 AI Agent 的七个步骤,分别是需求梳理、软件选型、提示工程、数据库、构建 UI 界面、测试评估和部署发布。

2025-03-11 09:25:19 2415

原创 和风控中台有关的哪些事

风险管理方法论与时俱进,平台需求的复杂度与日俱增, 很多功能的复杂度已经超过了产品们的想象范围。

2025-03-07 11:13:54 164

原创 关于LLM的TOP-p、top_K、temperature

在使用开源的大语言模型或者调用大语言模型API的时候会遇到temperature、top_p、top_k等参数,对于不了解的LLM的原理的人,可能一头雾水,不知道如何设置。

2025-02-27 14:13:52 2376

原创 基于用户行为数据的标签画像系统及其应用概要设计说明

在互联网逐步步入大数据时代后,不可避免的给企业和用户行为带来一系列改变与重塑;其中最大的变化莫过于,用户的一切行为在企业面前是“可视化”的.随着大数据技术的深入研究与应用,企业的专注点日益聚焦于怎样利用大数据来为精细化运营及精准营销服务,进而深入挖掘潜在的商业价值,于是,用户画像的概念也就应运而生.用户画像可以使产品的服务对象更加聚焦,更加的专注.本项目分别从用户居民属性、医疗消费、行为属性、用户偏好、疾病问诊信息、客户满意度六个角度构建用户画像模型;

2025-02-27 14:08:07 918

原创 标签画像系统设计方案

1全文新建毛雪东202411-10V.0.02画像应用新增毛雪东202411-113规则引擎新增毛雪东202411-14456在互联网逐步步入大数据时代后,不可避免的给企业和用户行为带来一系列改变与重塑;其中最大的变化莫过于,用户的一切行为在企业面前是“可视化”的,随着大数据技术的深入研究与应用,企业的专注点日益聚焦于怎样利用大数据来为精细化运营及精准营销服务,进而深入挖掘潜在的商业价值,于是,用户画像的概念也就应运而生.

2025-02-27 11:15:28 1193 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除