- 博客(1061)
- 收藏
- 关注
原创 funasr stt语音转录;输出符号与停顿
FunASR语音识别工具使用指南 摘要:本文介绍了FunASR语音识别工具的基本使用方法。通过pip安装funasr库(1.3.0版本)后,可以使用AutoModel加载SenseVoiceSmall模型进行语音识别。示例代码展示了两种功能:1)带标点符号的文本输出(use_itn参数),2)停顿识别功能(通过vad_model参数实现)。识别结果包含情感标签(如HAPPY/NEUTRAL)和语言标识(zh),并能处理数字、标点等文本规范化(ITN)。该工具支持多语言识别,可应用于虚拟数字人等领域的语音交互
2026-01-04 17:39:33
328
原创 funasr_onnx asr语音转录使用案例;vad和标点恢复
FunASR的SenseVoiceSmall模型提供了便捷的语音识别功能。通过安装funasr_onnx库,用户可以快速部署预训练模型。使用方法简单:导入模型后指定音频文件路径,即可获取自动语言检测和智能文本规范化处理的转录结果。该模型支持批处理(默认batch_size=10)和量化选项,并能通过rich_transcription_postprocess进行后处理优化输出。示例展示了从加载模型到获取最终转录文本的完整流程,适用于工业级语音识别应用场景。
2026-01-04 16:27:41
116
原创 opencode:vide coding工具安装介绍;使用案例
OpenCode AI开发工具安装与配置指南 OpenCode是一个AI辅助开发工具,支持多种安装方式: 跨平台安装:通过npm、scoop、choco、brew等包管理器安装 配置智谱GLM模型:修改opencode.json配置文件 登录认证:使用opencode auth login命令 常见问题解决:清理缓存或设置环境变量绕过SSL验证 使用:直接运行opencode命令即可启动AI辅助功能 工具提供智能代码补全、问题解答等功能,支持Windows/macOS/Linux系统。
2026-01-04 13:40:20
315
原创 大模型JSON格式输出:instructor
摘要:instructor是一个Python库,通过包装OpenAI客户端实现LLM输出的结构化约束。安装简单(pip install instructor),使用时只需定义Pydantic模型并调用patch方法,即可让ChatCompletion自动返回符合模型结构的数据。示例展示了如何从自然语言文本中提取结构化用户信息(姓名、年龄、技能),无需手动处理JSON。该工具简化了大模型输出处理流程,支持直接获取Python对象。
2026-01-04 11:10:35
155
原创 windows choco包管理器
Chocolatey是Windows系统的包管理器,提供类似Linux中apt或macOS中Homebrew的软件管理功能。安装步骤包括:以管理员身份运行PowerShell,清理残留文件后执行安装命令,重启验证版本号。安装软件只需执行"choco install 软件名 -y"命令即可。该工具极大简化了Windows平台的软件管理流程,实现一键安装、更新和卸载操作。
2026-01-04 10:58:59
230
原创 elastic kibana可视化数据统计案例
本文介绍了Elasticsearch和Kibana的Docker部署方法,以及如何存储和分析LLM代理日志数据。主要内容包括:1) 使用Docker快速部署Elasticsearch和Kibana服务;2) 创建索引并定义mapping结构,包含用户信息、消息内容、工具调用和LLM指标等字段;3) 通过Python代码实现日志数据存储;4) 在Kibana中创建可视化仪表盘进行数据分析。该方案可用于监控和分析LLM代理的运行情况,包括用户查询、模型响应、工具调用等关键指标,为优化AI代理性能提供数据支持。
2025-12-26 09:08:50
198
原创 OpenAI api接口token消耗统计案例、tokens输出速度
本文展示了如何通过OpenAI API调用阿里云百炼qwen和火山引擎deepseek两个AI模型的流式响应。代码示例演示了初始化客户端、发起流式请求和处理响应的方法,包括设置stream_options以获取token用量统计。两种模型的调用方式基本一致,主要区别在于API endpoint和模型名称。响应处理采用列表暂存片段再合并的方式提高效率,并实时打印流式输出内容。文中还提供了两个模型的调用效果截图作为参考。
2025-12-23 08:56:58
204
原创 FastMCP 认证鉴权功能实现:自定义密钥key bearer
本文介绍了一个基于FastAPI的数学计算服务(MCP),提供加减乘除运算功能,并通过API密钥进行认证管理。主要功能包括:基础数学运算、Bearer Token验证、API密钥管理(增删改查)、密钥过期时间设置、JSON文件持久化存储、主密钥保护机制以及密钥状态追踪。系统使用Python实现,通过APIKeyManager类管理密钥,支持密钥的加载、保存、验证和过期检查。启动时需要提供主密钥参数,所有管理端点都受主密钥保护。日志记录功能可追踪密钥操作和过期状态。
2025-12-16 10:38:41
59
原创 智能体长记忆实现案例:mcp-memory-service
MCP Memory Service是一个面向AI工程师的本地化记忆存储服务系统。项目提供GitHub克隆安装方式,需修改配置文件关闭OAuth验证并调整向量模型路径。运行后可通过8000端口访问后台管理界面,支持知识库的保存与检索功能。系统能与Cherry Studio客户端集成,测试案例展示了知识保存和召回的实际效果。该工具为开发者提供了便捷的本地知识管理解决方案,适合AI工程场景下的信息存储与调用需求。
2025-11-27 15:04:49
72
原创 腾讯元器自建联网搜索、百度官方搜索api
摘要:本文介绍了两种实现联网搜索的方法。一是通过腾讯元器搭建搜索工作流并发布API,二是使用百度官方搜索API(需获取授权)。两种方式均提供了技术实现方案,其中百度API示例包含Python请求代码模板,展示了基本的API调用流程。两种方案均可为开发者提供便捷的搜索服务接入能力。
2025-11-24 09:51:44
546
原创 Gemini3快速生成网站:多语言单词学习网站
摘要:本文介绍了一个基于Google AI Studio开发的多语言单词学习网站项目。该平台支持中英日三语学习,提供单词、例句的语音朗读功能,并配有场景化图片辅助记忆。网站按生活场景分类(如餐厅、购物等),用户可通过直观的界面学习相关词汇。开发者仅用一句提示词即生成完整应用原型,展示了AI快速实现创意的能力。最终成品包含词汇卡片、语音播放和场景分类等功能模块,为语言学习者提供沉浸式体验。
2025-11-23 16:56:52
113
原创 notebooklm AI资料工具:从数据压缩整理生成语音、导图、ppt等
Google推出的NotebookLM是一款AI辅助工具,支持用户上传各类文件(链接/视频等)创建专属知识库。其核心功能包括:1)通过聊天框与资料内容智能互动问答;2)右侧工具栏快速生成报告、博客等内容。该工具将用户资料与AI能力结合,实现高效的知识管理与内容创作。
2025-11-22 18:53:23
192
原创 logging日志北京时间设置
本文介绍了两种在Python日志系统中实现北京时间显示的方法。第一种通过自定义BeijingFormatter类,将日志时间转换为UTC+8时区;第二种使用pytz库设置时区转换器。文章还提供了一个完整的生产级日志配置方案,包含按天滚动日志文件、自动清理旧日志、多处理器支持等功能。该方案采用自定义时间格式化类确保日志时间显示为北京时间,同时支持文件和控制台双重输出,并包含完善的诊断信息。两种方法都能有效解决日志时间显示问题,后者方案更适合实际生产环境使用。
2025-11-21 09:33:20
44
原创 MCP实现Agentic RAG server案例
本文展示了一个基于FastAPI构建的MCP服务器,通过Dify知识库API实现客服问答检索功能。核心代码是一个名为rag_retrieve的异步工具函数,该函数接收用户查询(query),向指定URL发送POST请求,使用语义搜索方式从知识库中获取相关回答。配置包括认证Token、请求头、搜索参数(如top_k=2返回最相关两条结果)和错误处理。文中包含代码实现截图和使用效果图,演示了如何将知识库检索服务集成到客服系统中。
2025-11-17 14:15:14
193
原创 fastmcp 实现MCP Server认证鉴权自定义和并发部署
本文介绍了使用FastAPI实现API认证和部署的代码实现。主要内容包括:1)通过HTTP Bearer Token进行认证,使用中间件验证请求头中的token;2)采用Uvicorn服务器部署FastAPI应用,配置并发参数如连接限制和超时设置。代码展示了完整的认证中间件实现和Uvicorn配置,适用于构建安全的REST API服务。
2025-11-17 13:56:16
224
原创 量化股票指标数据获取:利润率、roe、pe、股息率等
本文介绍了一个使用yfinance库获取美股财务数据的Python脚本。该脚本可以获取12家知名公司(包括谷歌、英伟达、特斯拉等)的季度财务数据,包含利润率、ROE、PE、股息率等关键指标。数据通过yfinance API获取后,会按固定季度格式整理并输出为纯文本和Markdown两种表格格式。脚本需要在能访问外网的环境运行,推荐使用Google Colab执行。输出结果包括各公司最近11个季度的财务数据,缺失数据会显示为"N/A",便于进行跨公司财务指标对比分析。
2025-11-15 17:21:21
281
原创 AC自动机算法-字符串搜索算法:敏感词检测
摘要:本文介绍了一个基于Aho-Corasick算法的高性能异步敏感词检测器实现。该工具支持异步调用和流式文本检测,通过预先构建敏感词自动机实现高效匹配。核心功能包括:1)从文件加载敏感词库并构建自动机;2)提供异步文本检测接口;3)支持流式文本实时检测。检测结果返回敏感词命中情况,包含状态标识、命中数量和具体敏感词列表。实现采用Python异步编程,通过线程池避免阻塞主线程,适用于需要高效内容安全检测的应用场景。
2025-10-31 21:49:24
322
原创 httpx异步api访问库;http2支持;
本文介绍了Python的httpx库在HTTP/1.1和HTTP/2下的基本用法。通过简单代码示例展示如何显式指定协议版本并获取响应信息,包括状态码、协议版本和内容片段。文章指出使用HTTP/2需要HTTPS支持,且会自动回退到HTTP/1.1。最后提供了一个性能对比测试,显示在相同条件下HTTP/2请求速度可能比HTTP/1.1快约一倍。该库提供简单易用的API来支持现代HTTP协议功能。
2025-10-19 21:20:51
458
原创 fastmcp client实现Plan-and-Execute 规划执行智能体agent案例
文章摘要 Agent范式在人工智能领域主要有三种典型方法:ReAct、Plan-and-Execute和multi-agent。Plan-and-Execute模式通过将复杂任务分解为有序步骤来提升执行效率,其核心包含规划(plan)和执行(execute)两个阶段。示例代码展示了一个基于OpenAI的智能助手实现,通过LLM生成JSON格式的执行计划,并支持工具调用和上下文管理。该范式特别适用于需要多步骤协作的任务场景,相比直接响应的传统方式,能更系统地处理复杂问题。系统设计还包含消息限制、错误处理等实用
2025-10-10 16:10:57
126
原创 天气API/MCP:和风天气、百度、高德
本文介绍了三种天气查询API的调用方法: 百度地图API:提供天气查询和位置服务接口,支持城市级天气数据获取。 高德地图API:通过REST接口查询城市天气信息,包含Python示例代码。该服务需要API Key,支持返回温度、湿度、风力等详细天气数据。 和风天气API:采用JWT认证方式,通过ED25519算法生成密钥对,提供更安全的访问机制。文中包含密钥生成、JWT验证的详细步骤和Python调用示例。 三种API均支持城市编码或名称查询,适用于不同场景的天气数据获取需求。
2025-09-29 10:00:24
405
原创 fastmcp 客服端远程MCP服务调用;多工具 MCP服务情景案例;集成fastapi服务
这篇文章介绍了一个基于FastAPI的MCP客户端实现,用于构建智能对话系统。主要功能包括: 使用FastAPI框架构建RESTful API服务,处理聊天请求 集成OpenAI API(兼容阿里云DashScope)实现对话功能 支持流式响应和工具调用功能 实现消息历史记录管理,限制对话轮数 提供MCP工具的动态加载和调用能力 关键代码结构包括: 定义请求/响应数据模型 实现消息处理工具函数 构建MCP客户端类,处理与AI服务的交互 支持流式响应和工具调用的处理逻辑 这个实现可以用于构建需要动态工具调用的
2025-08-24 15:46:15
486
原创 qwen 千问大模型联网及json格式化输出
阿里云百炼平台提供了两种实用的API调用方式:联网搜索和JSON格式化输出。联网搜索功能通过enable_search参数启用,可查询实时信息(如奥运金牌数)。JSON格式化功能则通过response_format参数实现,配合示例模板可规范输出结构化数据。两种方式均基于OpenAI兼容接口,需配置API Key和指定模型(如qwen-plus)。这些功能适用于需要实时数据或标准化输出的AI应用场景,开发者可根据需求选择调用。
2025-08-20 09:01:49
749
原创 agno多智能体框架调用MCP、fastapi服务api案例
本文展示了一个基于FastAPI的异步流式AI代理服务实现。代码通过集成OpenAILike模型和MultiMCPTools工具,创建了一个支持流式响应的API端点。服务启动后,客户端可以通过POST请求发送文本查询(如"明天广州去重庆的高铁票"),服务端会实时流式返回处理结果。该实现采用了异步生成器模式,使用StreamingResponse实现数据分块传输,并通过MCP工具支持多路并发处理。请求示例展示了如何通过Python requests库以流式方式获取响应数据。
2025-08-08 10:16:40
612
原创 agno fastapi对外接口案例;流式输出
本文介绍了如何使用Agno框架快速构建基于FastAPI的AI代理服务。首先通过OpenAILike类配置大模型服务(示例使用阿里云Qwen),然后创建Agent实例并设置相关参数(如历史消息处理、Markdown支持等)。接着初始化FastAPIApp,将Agent集成到FastAPI应用中,支持同步/异步路由。最后通过curl命令演示了如何调用该服务,发送消息获取AI响应。整个过程展示了Agno框架简化AI服务开发的便捷性,仅需少量代码即可部署功能完备的智能对话接口。
2025-08-07 17:35:13
300
原创 agno 智能体框架MCP工具使用案例;json结构化输出
本文介绍了如何通过摩搭社区(MCP)获取免费服务资源,并演示了两个实际应用案例。首先提供了MCP服务获取地址和网络搜索工具的调用方法,展示了通过Python代码接入MCP服务的完整流程。其次以12306火车票查询为例,详细说明了MCP工具在票务查询中的实现方式。两个案例均包含完整的代码示例和运行结果截图,展示了从服务连接到实际查询的全过程。文章为开发者提供了利用MCP服务快速构建智能应用的实用指南。
2025-08-07 16:50:07
381
原创 agno 多智能体框架使用案例
Agno是一个多智能体协作框架,支持通过Python快速构建专业AI团队。该库提供两种使用模式:英文和中文案例,均基于通义千问(Qwen)模型。通过安装pip install -U agno即可使用。框架支持创建不同角色的Agent(如网络搜索、金融分析),并集成DuckDuckGo搜索、YFinance金融数据等工具。团队协作模式可生成包含来源和表格数据的结构化报告,适用于市场分析、投资研究等场景。中文案例展示了分析阿里巴巴投资情况的功能,输出包含详细数据表格和来源引用。
2025-08-07 14:13:55
235
原创 gpt-oss openai开源大模型
OpenAI推出开源AI模型GPT-OSS,提供20B和120B两种参数规模版本。用户可通过Ollama平台快速安装(ollama run gpt-oss:20b/120b),或直接访问在线Demo体验(gpt-oss.com)。该模型支持中文交互,界面简洁直观,展示了强大的多轮对话能力。相关技术文档和下载资源已公开发布,开发者可自由使用这一开源项目进行AI应用开发和研究。
2025-08-06 09:21:35
432
原创 MCP、Function_Calling和A2A关系;思维链CoT和ReAct
CoT vs ReAct:小朋友也能懂的思维方法 **CoT(思维链)**像做数学题:小明先在心里算“5+3=8,8-2=6”,再说出答案(一口气想完)。 **ReAct(行动-思考交替)**像拼乐高:小红先装轮子,发现不对就拆掉,再拼底座(边做边改)。 区别: CoT = 先想清楚再行动(考试写完整步骤) ReAct = 做一步想一步(玩密室边找边试) (98字)
2025-07-25 16:36:52
529
原创 Claude code + Kimi K2、deepseek V3.1配置结合案例;qwen-code
本文介绍了在Windows系统下安装和使用Claude代码助手的方法。首先通过npm全局安装Claude包,然后配置API密钥和基础URL(支持CMD和PowerShell两种方式)。配置完成后,直接在命令行输入"claude"即可启动使用。文章还提供了获取API密钥的链接和配置截图,帮助用户快速完成设置。整个过程简单明了,适合开发者快速部署和使用Claude代码助手。
2025-07-16 09:18:13
480
1
原创 dify 原生mcp服务端、客服端应用案例
Dify 1.6版本发布,支持创建MCP工具和服务器。用户可通过摩搭平台Host Server应用创建MCP工具(含图表功能),并开发智能体应用集成MCP服务。操作步骤包括:1)在工具MCP中配置图表功能;2)创建智能体应用时选择MCP工具;3)设置API参数完成集成。该版本增强了工具集成能力,为开发者提供更灵活的AI应用构建方案。
2025-07-14 17:38:25
159
原创 qwen3、gemma3 GPRO强化训练案例
《使用GRPO训练自主推理模型教程》介绍了基于Unsloth平台训练Qwen3(4B)模型的完整流程。教程使用open-r1/DAPO-Math-17k-Processed数据集(14,116条),在Colab环境中通过GRPO方法进行3小时训练。文章包含详细的操作截图,展示了模型训练界面、参数设置和进度监控等内容。配套的Colab笔记本提供了可直接运行的代码,方便用户复现整个过程。该教程为开发者提供了使用强化学习技术训练自有推理模型的实践指南,特别适合希望在有限算力条件下进行模型优化的研究人员。
2025-07-10 17:01:42
176
原创 n8n workfolw简单使用;mcp案例
n8n是一款开源工作流自动化工具,可通过Docker快速部署(创建数据卷并运行容器)。部署完成后可通过指定端口访问Web界面。文章还介绍了如何与MCP(My Computer Partner)服务集成,包括MCP服务器和客户端的配置图示,并提供了相关文档和视频教程参考链接。n8n支持通过LangChain等核心节点实现自动化流程搭建,适合各种业务场景的集成需求。
2025-07-08 15:06:04
373
原创 ether0 大语言推理模型生成SMILES 的分子
ether0是一个24B参数的语言模型,专为化学领域设计,可将英语问题转化为SMILES分子结构。该模型基于Mistral-Small-24B-Instruct-2501微调优化,支持包含SMILES输入的非规范化分子描述(含立体化学信息),但对IUPAC命名支持有限。用户可通过在线demo进行交互,输入化学问题即可获得对应的分子结构输出。
2025-07-06 19:59:36
232
原创 gemma-3n-E2B多模态模型使用案例:支持文本、图像、语音输入
本文介绍了Gemma-3n-E2B-it多模态模型的使用方法,包括模型下载、运行代码和微调指南。针对PyTorch动态编译报错问题,提供了解决方案:禁用TorchDynamo并通过环境变量关闭编译优化。文章展示了完整的推理代码,支持纯文本、图像+文本、语音+文本三种输入模式,包含处理器加载、模型生成等核心功能实现。示例代码演示了如何构建不同类型的内容请求(文本问答、图像描述、语音转录),并调用统一接口完成多模态推理任务。
2025-07-03 14:29:51
616
原创 Qwen VLo :一个多模态统一理解与生成模型
通义千问VLO多模态模型创新性地将图像生成、编辑与理解功能集成于单一模型,支持文本到图像生成、局部/全局图像编辑(包括风格转换、背景替换等)以及复杂场景理解。该模型能根据文本指令自动完成图像创作与修改,同时具备精准的视觉问答能力。用户可通过在线Demo体验其强大的多任务处理能力,实现了从图像创作到智能分析的端到端解决方案。
2025-06-27 22:50:13
225
原创 MCP浏览器工具:playwright、chrome-mcp
本文介绍了chrome-mcp的安装配置与测试过程。chrome-mcp需要作为浏览器插件额外安装,配置文件中需设置streamableHttp和playwright参数,其中server端运行在127.0.0.1:12306/mcp。测试使用cherrystudio v1.4.5版本,通过截图展示了配置界面和运行效果。完整配置包含服务端地址、激活状态、注册表URL以及npx命令行参数等信息,确保插件能够正常调用Playwright功能。测试结果证实该配置方案可行。
2025-06-26 14:17:34
777
原创 Refly:Vibe Workflow 简单对话制作智能体工作流
Refly AI 是一个通过对话交互自动生成UI组件的AI工具。用户只需在画布上以自然语言描述需求,系统就会自动创建对应的小组件,无需手动设计。其最新v0.7.0版本新增了多项功能优化(具体亮点可查看变更日志)。该工具提供在线Demo(refly.ai),展示直观的交互式创建过程,大幅简化UI设计流程,开发者可直接通过对话实现可视化界面构建。
2025-06-25 17:21:24
281
原创 fastapi_mcp库:让fastapi代码直接转换成mcp服务
FastAPI-MCP工具集成与测试指南 本文展示了如何在FastAPI应用中集成MCP(Meta Control Protocol)服务器,并测试工具功能。通过示例代码演示了初始安装、MCP服务器挂载和端点注册流程。关键步骤包括:初始化FastApiMCP实例、mount()方法挂载服务器、setup_server()注册新端点。运行服务后可通过CherryStudio进行远程SSE访问和工具测试。特别提示,新增端点需调用setup_server()才能暴露为工具,示例中展示了如何验证新注册的端点功能。
2025-06-23 10:41:01
139
原创 AI图像推理模型:BAGEL、Kimi-VL、GLM-4.1V-9B-Thinking、Step3
字节跳动Seed团队推出BAGEL-7B-MoT多模态模型,具备7B参数规模,支持图像理解与文本生成。月之暗面同时发布Kimi-VL-A3B-Thinking视觉语言模型,专注于多模态推理能力。两款模型均在HuggingFace平台开放体验,展示了当前多模态AI在图像文本交互领域的最新进展。
2025-06-22 14:08:07
184
unidic-mecab 字符文件unidic-3.1.0下载
2024-03-01
中文语音唤醒模型sherpa-onnx-kws-zipformer-wenetspeech-3.3M-2024-01-01 (C
2024-03-01
yolov9 自有数据训练代码参考
2024-03-01
diffusers-flask-streamlit AIGC文生图代码案例,前端后端代码
2024-03-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅