- 博客(20)
- 收藏
- 关注
原创 领域LLM九讲——第5讲 为什么选择OpenManus而不是QwenAgent(附LLM免费api邀请码)
本文对比了OpenManus和Qwen-Agent两大LLM框架的核心模块差异。OpenManus采用面向对象设计,强调明确的规划-执行流程,适合结构化任务;Qwen-Agent则基于函数调用机制,支持动态工具注册和并行执行,灵活性更强。两者在LLM接口、工具系统、记忆管理等方面各有特色:OpenManus绑定OpenAI,Qwen-Agent兼容多模型;OpenManus工具管理手动,Qwen-Agent自动注册;OpenManus仅短期记忆,Qwen-Agent支持长期检索记忆。文末还提供了硅基流动平台
2025-07-05 18:00:32
771
原创 一文透彻理解web3、web3.0和区块链
稳定币法案颁布引发对区块链本质的思考。文章辨析区块链、Web3与Web3.0的核心差异:区块链是去中心化数据存储技术(如比特币),Web3构建用户主权的价值网络(含DeFi/NFT),Web3.0则聚焦机器可读的语义网(基于AI/RDF)。三者技术路径不同(共识机制/智能合约/语义标准),当前融合有限。稳定币发展或催生新型国际金融体系,但仍受传统法币霸权影响。本文为入门者厘清概念框架,揭示去中心化愿景与现实约束的矛盾。
2025-06-21 14:28:21
730
原创 使用duckduckgo_search python api 进行免费且不限次数的搜索
使用duckduckgo_search python api 进行免费且不限次数的搜索。
2025-06-18 21:16:22
294
原创 MotleyCrew ——抛弃dify、coze,手动搭建多agent工作流
- 协调器: CrewMotleyCrew 的核心是一个 “Crew” 对象,即多代理系统的指挥者。Crew 持有一个全局的知识图谱(使用 Kuzu 图数据库),用于记录所有任务、任务单元和其执行状态。Crew 不断循环查询“可执行任务”(所有上游依赖完成的任务),调用get_next_unit() 获取下一步的任务单元,并将其分派给对应的执行者(Agent)。任务单元被分派后即加入知识图,当执行完成时触发任务的 on_unit_completion 逻辑。Crew 支持同步与异步两种模式:在异步模式下
2025-06-15 21:26:50
869
原创 领域LLM九讲——第4讲 构建可测评、可优化的端到端商业AI Agent 系统
以 OpenAI Cookbook 的《》示例为基础,探讨如何设计一个可测试、可优化的端到端 AI Agent 系统。整体流程分为三个阶段:(1) 端到端 Agent 构建(基线测试),(2) 拆分中间任务与评分系统(可解释性与对齐),(3) 构建收益/成本框架(系统优化)。
2025-06-07 13:24:18
810
原创 独立AI开发者——技术路线与盈利模式规划
选用Vue 3 (配合Vite/Pinia) 构建SPA,利用现成的对话组件库加速开发。比如Ant Design X Vue提供聊天气泡、会话管理、输入框、智能建议等AI 组件;腾讯云Chat UIKit Vue 版、CometChat 等也提供成熟的UI。聊天界面可支持流式渲染(逐步显示AI 回复),并可切换主题、适配移动端。语音UI 可利用浏览器Web Speech API 或VueUse等库捕获音频并调用ASR;响应可用Web Speech Synthesis 合成语音。
2025-06-02 17:36:43
586
原创 领域LLM九讲——第3讲 从多模态数据分析chunk方法——语义统一目标
当一张图像(例如产品规格表、科研论文中的图表)包含多个信息区域时,先用 OCR 提取所有文字框并检测其坐标,再根据文字框的行列关系将图像划分为不同“语义区域”(Region)——例如图表标题、图例、轴标签、脚注等,使每个区域都能对应一个独立的文本分块。将同一断点 ID 下的各模态内容——例如文本分块(带时间戳或页码)、对应的图像剪辑(带坐标)、音频片段(带时段)、视频镜头段(带时段及关键帧)——统一合并为一个多模态 Chunk,并赋予独立的 Chunk ID。,更是实现跨模态“语义统一”的关键环节。
2025-06-02 17:04:34
599
原创 领域LLM九讲——第3讲 从多模态数据分析chunk方法——多模态数据分类
概览如下:多模态分块可以分为文本导向分块(对 ASR/文档文本进行常规分块)、图像区域分块(对大幅图像或图表进行区域化处理)、视频语义分块(基于场景或镜头检测进行切片)、音频时段分块(基于 ASR+VAD 分段或固定时间窗口)、以及混合模态分块(保证图像/文本/表格等信息在同一 Chunk 中)。安防监控整体事件检索:安全系统将监控原始视频送入 LLM,先抽取音轨转写与关键帧图像,配合图像目标检测,实现视频内容检索。播客/音频日志分析:内容运营团队将播客音频文件提供给 LLM,做自动要点生成与情感分析。
2025-06-02 14:44:26
655
原创 科研漫谈——17种rag方案全览
下表系统性梳理了 17 种 RAG(Retrieval-Augmented Generation)改进方法,按照「文档分块」「检索与重排序」「后处理与反馈」分类。每种方法附带方法说明、效果亮点、典型场景、代表工具及效果评分(0–100 分)。
2025-05-24 21:00:30
744
原创 科研漫谈——RAG在LLM中如何调用
主要解决如下问题: 1. rag作为数据‘外挂’,和提示词工程的先后顺序是怎样的? 2. rag的每个阶段在做什么? 3. 长文本条件下,如何有效解决?
2025-05-17 19:29:56
945
原创 科研漫谈——为什么说RAG在LLM中不可替代?
RAG(Retrieval-Augmented Generation)作为一种将信息检索与生成模型相结合的技术方案,通过在生成阶段引入外部知识库,大幅提升了模型的准确性、时效性和可解释性。
2025-05-10 16:26:39
555
原创 科研漫谈——SurveyX:通过LLM实现自动化学术调查(附邀请码)
从SurveyX工作出发,通过观察其对任务的解析和中间过程prompt结构,探讨对领域工作流构建的思路
2025-05-05 18:41:36
1087
原创 [ChatGPT] 快速建立算法流程图
大预言模型具有快速反馈的特性,但在核心内容上大部分都是冗余的,下面介绍如何从ChatGPT返回的大篇幅字段中提取关键信息并利用快速建立流程图。
2024-08-17 21:09:38
519
原创 论文导读:DetectoRS: Detecting Objects with Recursive Feature Pyramid and Switchable Atrous Convolution
论文导读:DetectoRS: Detecting Objects with Recursive Feature Pyramid and Switchable Atrous ConvolutionAbstract许多现在的目标检测方法通过两次寻找搜索展示卓越的性能,这篇文章的主要原理是在 目标检测的backbone设计上。在宏观层面,我们提出Recursive Feature Pyramid(递归特征金字塔):包括从FPN提出额外的反馈连接进入up-bottom backbone layers。从微观层
2020-12-12 10:37:50
1270
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人