自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 收藏
  • 关注

原创 领域LLM九讲——第5讲 为什么选择OpenManus而不是QwenAgent(附LLM免费api邀请码)

本文对比了OpenManus和Qwen-Agent两大LLM框架的核心模块差异。OpenManus采用面向对象设计,强调明确的规划-执行流程,适合结构化任务;Qwen-Agent则基于函数调用机制,支持动态工具注册和并行执行,灵活性更强。两者在LLM接口、工具系统、记忆管理等方面各有特色:OpenManus绑定OpenAI,Qwen-Agent兼容多模型;OpenManus工具管理手动,Qwen-Agent自动注册;OpenManus仅短期记忆,Qwen-Agent支持长期检索记忆。文末还提供了硅基流动平台

2025-07-05 18:00:32 771

原创 一文透彻理解web3、web3.0和区块链

稳定币法案颁布引发对区块链本质的思考。文章辨析区块链、Web3与Web3.0的核心差异:区块链是去中心化数据存储技术(如比特币),Web3构建用户主权的价值网络(含DeFi/NFT),Web3.0则聚焦机器可读的语义网(基于AI/RDF)。三者技术路径不同(共识机制/智能合约/语义标准),当前融合有限。稳定币发展或催生新型国际金融体系,但仍受传统法币霸权影响。本文为入门者厘清概念框架,揭示去中心化愿景与现实约束的矛盾。

2025-06-21 14:28:21 730

原创 使用duckduckgo_search python api 进行免费且不限次数的搜索

使用duckduckgo_search python api 进行免费且不限次数的搜索。

2025-06-18 21:16:22 294

原创 MotleyCrew ——抛弃dify、coze,手动搭建多agent工作流

- 协调器: CrewMotleyCrew 的核心是一个 “Crew” 对象,即多代理系统的指挥者。Crew 持有一个全局的知识图谱(使用 Kuzu 图数据库),用于记录所有任务、任务单元和其执行状态。Crew 不断循环查询“可执行任务”(所有上游依赖完成的任务),调用get_next_unit() 获取下一步的任务单元,并将其分派给对应的执行者(Agent)。任务单元被分派后即加入知识图,当执行完成时触发任务的 on_unit_completion 逻辑。Crew 支持同步与异步两种模式:在异步模式下

2025-06-15 21:26:50 869

原创 领域LLM九讲——第4讲 构建可测评、可优化的端到端商业AI Agent 系统

以 OpenAI Cookbook 的《》示例为基础,探讨如何设计一个可测试、可优化的端到端 AI Agent 系统。整体流程分为三个阶段:(1) 端到端 Agent 构建(基线测试),(2) 拆分中间任务与评分系统(可解释性与对齐),(3) 构建收益/成本框架(系统优化)。

2025-06-07 13:24:18 810

原创 独立AI开发者——技术路线与盈利模式规划

选用Vue 3 (配合Vite/Pinia) 构建SPA,利用现成的对话组件库加速开发。比如Ant Design X Vue提供聊天气泡、会话管理、输入框、智能建议等AI 组件;腾讯云Chat UIKit Vue 版、CometChat 等也提供成熟的UI。聊天界面可支持流式渲染(逐步显示AI 回复),并可切换主题、适配移动端。语音UI 可利用浏览器Web Speech API 或VueUse等库捕获音频并调用ASR;响应可用Web Speech Synthesis 合成语音。

2025-06-02 17:36:43 586

原创 领域LLM九讲——第3讲 从多模态数据分析chunk方法——语义统一目标

当一张图像(例如产品规格表、科研论文中的图表)包含多个信息区域时,先用 OCR 提取所有文字框并检测其坐标,再根据文字框的行列关系将图像划分为不同“语义区域”(Region)——例如图表标题、图例、轴标签、脚注等,使每个区域都能对应一个独立的文本分块。将同一断点 ID 下的各模态内容——例如文本分块(带时间戳或页码)、对应的图像剪辑(带坐标)、音频片段(带时段)、视频镜头段(带时段及关键帧)——统一合并为一个多模态 Chunk,并赋予独立的 Chunk ID。,更是实现跨模态“语义统一”的关键环节。

2025-06-02 17:04:34 599

原创 领域LLM九讲——第3讲 从多模态数据分析chunk方法——多模态数据分类

概览如下:多模态分块可以分为文本导向分块(对 ASR/文档文本进行常规分块)、图像区域分块(对大幅图像或图表进行区域化处理)、视频语义分块(基于场景或镜头检测进行切片)、音频时段分块(基于 ASR+VAD 分段或固定时间窗口)、以及混合模态分块(保证图像/文本/表格等信息在同一 Chunk 中)。安防监控整体事件检索:安全系统将监控原始视频送入 LLM,先抽取音轨转写与关键帧图像,配合图像目标检测,实现视频内容检索。播客/音频日志分析:内容运营团队将播客音频文件提供给 LLM,做自动要点生成与情感分析。

2025-06-02 14:44:26 655

原创 Btc量化——freqtrade 回测数据分析

freqtrade 回测数据分析

2025-05-25 14:27:32 847

原创 科研漫谈——17种rag方案全览

下表系统性梳理了 17 种 RAG(Retrieval-Augmented Generation)改进方法,按照「文档分块」「检索与重排序」「后处理与反馈」分类。每种方法附带方法说明、效果亮点、典型场景、代表工具及效果评分(0–100 分)。

2025-05-24 21:00:30 744

原创 科研漫谈——RAG在LLM中如何调用

主要解决如下问题: 1. rag作为数据‘外挂’,和提示词工程的先后顺序是怎样的? 2. rag的每个阶段在做什么? 3. 长文本条件下,如何有效解决?

2025-05-17 19:29:56 945

原创 科研漫谈——Dify 项目模块解读

dify模块解读

2025-05-17 15:55:16 925

原创 领域LLM九讲——第2讲 LLama-factory 微调大模型

llama-factory小模型微调

2025-05-17 12:35:06 348

原创 科研漫谈——为什么说RAG在LLM中不可替代?

RAG(Retrieval-Augmented Generation)作为一种将信息检索与生成模型相结合的技术方案,通过在生成阶段引入外部知识库,大幅提升了模型的准确性、时效性和可解释性。

2025-05-10 16:26:39 555

原创 科研漫谈——SurveyX:通过LLM实现自动化学术调查(附邀请码)

从SurveyX工作出发,通过观察其对任务的解析和中间过程prompt结构,探讨对领域工作流构建的思路

2025-05-05 18:41:36 1087

原创 领域LLM九讲——第1讲 通过LLM构建问答语料数据集

通过Easy Dataset 构建问答语料数据集

2025-05-01 23:06:36 663

原创 VLLM本机部署

在3070GPU上部署llm,用于后端agent调用

2025-04-26 17:07:10 327

原创 MCP Server & Client

如何构建MCP Server和Client

2025-04-19 19:30:44 405

原创 [ChatGPT] 快速建立算法流程图

大预言模型具有快速反馈的特性,但在核心内容上大部分都是冗余的,下面介绍如何从ChatGPT返回的大篇幅字段中提取关键信息并利用快速建立流程图。

2024-08-17 21:09:38 519

原创 论文导读:DetectoRS: Detecting Objects with Recursive Feature Pyramid and Switchable Atrous Convolution

论文导读:DetectoRS: Detecting Objects with Recursive Feature Pyramid and Switchable Atrous ConvolutionAbstract许多现在的目标检测方法通过两次寻找搜索展示卓越的性能,这篇文章的主要原理是在 目标检测的backbone设计上。在宏观层面,我们提出Recursive Feature Pyramid(递归特征金字塔):包括从FPN提出额外的反馈连接进入up-bottom backbone layers。从微观层

2020-12-12 10:37:50 1270 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除