自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

gdhu

头发还在

  • 博客(34)
  • 资源 (2)
  • 收藏
  • 关注

原创 语音助手接入MaxKB

本文记录了在树莓派上部署MaxKB知识库系统的过程。作者尝试使用本地Gemma3模型效果不佳后,改用阿里云Qwen-Flash模型。通过Docker部署MaxKB开源版本,并准备了包含9项功能的语音助手问答知识库(如关键词唤醒、多轮聊天等)。最后成功导入问答对,实现知识库问答功能,并预告下篇将介绍API对接。

2025-09-04 18:45:00 300

原创 树莓派 5 上运行 Gemma3:270m 本地大模型体验

树莓派5成功运行轻量级大语言模型Gemma3:270m。通过Ollama框架在8GB内存的树莓派5上部署,模型运行速度约18 tokens/s,适合简单对话和语音助手场景。虽然处理复杂任务能力有限,但270M的小模型体积使其成为边缘计算的理想选择。文章详细介绍了从环境配置到systemd服务设置的完整流程,展示了在资源受限设备上运行AI模型的可能性,为DIY智能设备开发提供了新思路。

2025-09-01 19:30:00 518

原创 为什么我的语音助手一开口,网页音乐就没声了?

摘要:树莓派开发语音助手时遇到网页音频与语音反馈冲突问题,原因是Linux ALSA声卡独占机制。通过安装PipeWire音频服务(替代PulseAudio)并配置ALSA默认路由,实现多应用混音。关键步骤包括:1)安装PipeWire套件;2)设置用户级systemd服务;3)使用pavucontrol验证混音效果。最终解决浏览器与语音助手音频抢占问题,实现多音频流并行播放。该方案适用于需要多应用共享声卡的Linux嵌入式开发场景。

2025-08-24 18:05:29 830

原创 小白也能懂!avahi-daemon 带你玩转局域网免配置访问

avahi-daemon是Linux系统提供的mDNS/DNS-SD服务,可实现局域网设备免配置自动发现。它通过Zeroconf协议自动广播设备信息,让用户通过设备名.local(如raspberrypi.local)直接访问,无需记忆IP地址。该工具特别适合树莓派、NAS等设备在家庭/办公网络中使用,大幅简化了SSH连接、文件共享等操作。作者展示了如何通过该服务实现跨网络环境访问树莓派,并在Mac和PyCharm中使用域名直接连接开发,解决了IP变动带来的配置问题。

2025-08-22 21:45:00 773

原创 我的语音助手外壳终于上线啦!

《自制透明语音助手外壳上线》 成功打造了一款透明亚克力外壳,为树莓派语音助手系统提供了专业"住所"。这款DIY作品集成了触控屏、麦克风阵列、摄像头和喇叭等组件,通过激光切割亚克力板和铜柱螺丝固定,既保证了结构稳固又展现了内部电路美感。 语音助手支持"嘿Franky"唤醒,提供天气查询、事项提醒、音乐播放等功能。透明设计配合绿色指示灯,兼具实用性与科技感。

2025-08-20 09:43:17 185

原创 我给语音助手加了一个新技能!

顾名思义,就是你可以用一句话控制助手是否“监听唤醒词”。🔇“关闭唤醒” → 助手不会再误识别。🟢“打开唤醒” → 重新回到待命状态,唤一句就来!这个“打开唤醒 / 关闭唤醒”功能,乍一看很小,但极大提升了用户体验和可控性。尤其在办公场景里,防止误唤醒简直太重要了!而在家时,我可以完全放开它,让它随时准备响应我说的“Franky”。🛠️ 感兴趣的朋友欢迎留言交流,也可以 fork 我的项目一起改造你的语音助手!

2025-08-15 16:32:46 426

原创 语音助手如何接入MCP

本文提供了一个快速接入MCP(Multi-Channel Processing)的Python实现方案,包含精简的Server和Client示例代码。通过5个简单步骤:1)安装环境;2)编写Server端代码;3)测试Server;4)编写Client端代码;5)运行Client测试。文中展示了两个基础功能(add和greet)的实现,并演示了如何调用工具和获取结果。最后提到可以将Server集成到Claude Desktop或Cursor中,以及扩展更多功能的方法。该方案提供了本地可运行的最小MCP链路,

2025-08-07 08:45:00 227

原创 MCP和语音助手有什么关系

MCP协议为AI系统提供了标准化接口,实现大模型与外部工具/数据源的即插即用交互。

2025-08-05 14:18:36 350

原创 语音助手如何理解图片

摘要:文章介绍了语音助手Franky如何通过图像识别技术实现"看图说话"功能。其核心技术包括三步:选取最新图片、转换为Base64格式、调用阿里云多模态大模型Qwen-VL进行分析。该技术可应用于儿童绘画讲解、饮食健康分析等场景,让语音助手不仅能听还能"看",实现更自然的人机交互。文章还展望了未来可能的拓展应用方向,强调AI理解视觉信息对提升用户体验的重要性。

2025-08-01 14:15:00 1284

原创 语音助手是怎么知道天气的

语音助手是如何实现天气播报的?本文揭秘了背后的技术流程。当用户询问天气时,系统会启动WeatherTask任务流:首先通过API获取实时天气数据,然后使用TTS技术将数据转化为语音,最后智能控制音频播放(如暂停背景音乐播报天气)。整个过程由异步任务调度系统协调,确保流畅体验。文章还透露了未来可能增加的个性化功能,如不同语气播报和多城市支持,展现了AI技术如何将冰冷的代码转化为温暖的交互体验。

2025-07-30 09:13:37 994

原创 Franky — 边缘计算智能语音助手 / Edge‑Computing Smart Voice Assistant

摘要: 本文介绍了一款粉色萌系WebUI的设计与实现,用于提升家庭语音助手的交互体验。该界面采用HTML5+CSS3构建圆角卡片和动态效果,通过Socket.IO实现前后端实时通信,支持文字、图片等多模态交互。技术亮点包括WebSocket长连接、事件驱动架构和Base64图片传输,同时融入粉色糖果色系提升儿童友好度。未来计划扩展多模态交互和自定义皮肤功能,让AI助手更直观有趣。整套方案以家庭场景为核心,兼顾技术实用性与界面亲和力。

2025-07-25 17:01:55 1055

原创 11 粉色萌系 WebUI,让你的语音助手变身家中小精灵

摘要: 本文介绍了一款粉色萌系WebUI的设计与实现,用于提升家庭语音助手的交互体验。该界面采用HTML5+CSS3构建圆角卡片和动态效果,通过Socket.IO实现前后端实时通信,支持文字、图片等多模态交互。技术亮点包括WebSocket长连接、事件驱动架构和Base64图片传输,同时融入粉色糖果色系提升儿童友好度。未来计划扩展多模态交互和自定义皮肤功能,让AI助手更直观有趣。整套方案以家庭场景为核心,兼顾技术实用性与界面亲和力。

2025-07-24 08:47:21 364

原创 10 阶段总结:我把语音助手养成了!第一阶段成果回顾

摘要:作者分享了自己将树莓派改造成智能语音助手的阶段性成果。通过唤醒词检测、语音识别、语义理解、多任务调度、语音合成和音乐播放等功能模块的开发,现已实现基础语音交互能力。系统可准确响应天气查询、音乐播放等指令,并能智能切换不同任务。下一阶段将优化连续对话、本地知识库等功能,并完善硬件外观设计。该项目为个人开发探索,旨在分享语音交互技术的实践经验。

2025-07-19 08:30:00 444

原创 09 音乐播放:让助手唱起来

《让语音助手开口唱歌:从语音交互到音乐陪伴》摘要:本文分享了如何将语音助手升级为能唱歌的智能伙伴。通过四步技术方案实现:1)NLU识别音乐意图;2)任务调度系统管理播放优先级;3)自研MP3播放器(pydub+simpleaudio)精准控制;4)语音指令交互。实现场景包括语音点歌、暂停切换等,使助手更具人性化陪伴感。未来计划加入声纹识别和情绪化歌单功能。文章展现了如何通过技术让AI助手从基础交互升级为富有情感的生活伙伴。

2025-07-17 08:30:00 1154

原创 08 语音合成 TTS:让 AI 开口说话!

语音合成TTS:让AI开口说话 TTS(Text-to-Speech)技术将文字转化为自然流畅的语音,为语音助手赋予"说话"能力。通过阿里云TTS接口,开发者可以调用多种音色、调节语速语调,实现富有情感的语音合成。本文介绍了TTS的工作原理、技术流程(文本输入→API调用→MP3输出→播放)及优化技巧(音色、语速、音调等参数设置),并展示了天气播报、闹钟提醒等实际应用场景。TTS技术使人机交互更加自然,未来还将向多语种支持、虚拟人表情同步等方向进化。

2025-07-15 14:26:16 660

原创 07 多任务调度系统:让助手能“分身有术

语音助手的多任务调度系统是其核心功能之一,它能让助手同时处理多个任务而不混乱。该系统通过任务优先级管理、暂停/恢复机制和状态同步等技术,实现诸如播放音乐时插播天气、紧急提醒打断笑话等场景。这种"分身有术"的能力使语音助手更智能实用,贴近用户真实需求。开发者还可自定义调度规则,让助手行为更个性化。多任务调度是提升语音交互体验的关键技术,让助手能从容应对复杂指令。

2025-07-14 12:43:23 765

原创 06 NLU 语义解析:语音助手的大脑如何理解你在说什么?

本文介绍了语音助手中的自然语言理解(NLU)技术,解释了NLU如何将语音识别后的文字转化为可执行的意图和参数。与单纯语音识别(ASR)不同,NLU需要理解用户指令背后的意图(如播放音乐、查询天气)并提取关键参数(如时间、地点)。文章通过示例展示了简单NLU模块的实现方法,并描述了从语音输入到任务执行的完整流程。最后指出下一阶段将探讨任务调度系统的开发。全文清晰地阐述了NLU在语音交互系统中的核心作用。

2025-07-13 12:45:00 931

原创 05 唤醒词检测:让语音助手随时待命

摘要: 本文介绍了语音助手中的唤醒词检测技术,通过本地化方案Porcupine实现低功耗精准唤醒。作者在树莓派上部署该系统,测试显示在嘈杂环境中能准确识别自定义唤醒词(如"Franky"),误触发率低。关键技术点包括实时监听、降噪处理和防自唤醒设计。唤醒词检测作为语音交互的"点火按钮",后续可衔接语音识别、NLU解析等功能模块。文章还提供了Python实现代码片段,并预告将深入意图解析技术。该项目为个人开发探索,可供爱好者参考复现。

2025-07-11 18:15:00 1100

原创 04 能力篇:一步步学会听懂并开口说话

摘要:打造智能语音助手的关键能力清单 本文探讨了构建一个真正实用的语音助手所需的核心能力,分为五大模块: 1️⃣ 感知能力:包括唤醒词检测、语音转文字、声纹识别 2️⃣ 理解与响应:命令解析、场景配置、任务链设计、日志记录 3️⃣ 表达输出:语音合成、音频播放、表情UI反馈、可视化界面 4️⃣ 联网服务:天气查询、新闻播报、网站监控告警 5️⃣ 系统支持:音频流管理、定时任务、开机自启 作者将以树莓派为硬件平台,逐步实现这些功能,并分享技术实现细节与调试经验。下篇将重点讲解唤醒词检测的实现方法。

2025-07-09 08:20:41 293

原创 03 环境:树莓派环境配置

摘要: 本文介绍了在树莓派5上配置Python开发环境的完整流程。作者通过PyCharm的SSH远程连接功能实现了本地开发与树莓派的无缝对接,包括:1)配置Python 3.10稳定环境;2)设置自动文件同步功能;3)完成首个Hello World测试。关键建议包括保持开发与部署环境一致,以及优先在真实硬件而非模拟器上测试(特别是语音模块)。该配置方案解决了"本地能跑部署失败"的常见问题,为后续AI语音项目奠定了可靠基础。

2025-07-07 20:30:00 339

原创 02 材料:造一个“人”出来

分享了DIY语音助手的硬件搭建过程。

2025-07-05 09:08:46 271

原创 01 缘起:我想要一个属于自己的 Jarvis

摘要: 受童年幻想和动画《机器人弗兰奇》启发,决定为自己开发一款专属AI助手“Jarvis”。

2025-07-02 17:55:02 192

原创 从零搭建你的语音助手系列 | 系列总览

《从零打造个性化AI语音助手实践记录》作者分享了自己用树莓派5+Python+本地AI模型构建数字助手的全过程。该项目不同于普通功能堆砌,旨在创造真正理解用户、有温度的AI伙伴。内容涵盖硬件搭建、UI设计、语音交互(声纹识别/TTS)、任务调度、家庭自动化等核心模块,并持续更新。作者从机器人动画获取灵感,将陆续开源项目代码,欢迎开发者关注交流。项目地址:https://github.com/gdhucoder/personalvoicehelper (配图为开发过程实拍)

2025-07-01 14:34:08 186

原创 解决Markdown图片问题

文章目录里程碑遇到的问题主要有:图床问题:图片链接插入问题:平台不通用问题:我的github图片本地预览、链接Picture Helper使用方法:另附代码里程碑断断续续一年多,自己搭建的博客遇到的各种问题基本得到解决。现在整理一下解决问题的思路:博客用到的东西:Github(托管静态网页)、Hugo、Sublime、Markdown、MathJax、免费图床(gitee)、留言(需要翻墙...

2019-01-27 16:27:02 3620

原创 把时间当做朋友

title: “把时间当做朋友”date: 2019-01-27T07:00:00+08:00draft: falsetags:Bookscategories:读书归档生命中,我们经常会有这样的时刻,在某个时候脑中"叮"的一声,那时你发现自己之前浪费了很多时光。时间的流逝是单向的。这周末看了李笑来的《把时间当做朋友》,里面讲了做事情不要着急,要相信时间的力量。其实我...

2019-01-27 16:09:54 235

原创 算法4 Java解答 2.4.18

2.4.18问题:2.4.18 In MaxPQ, suppose that a client calls insert() with an item that is larger than all items in the queue, and then immediately calls delMax(). Assume that there are no duplicate keys. ...

2018-10-27 06:21:08 251

原创 java问题

String interning关于java程序种的内存学习过程中遇到的一些技术问题。String interningString interning keeps every String only once in memory.https://en.wikipedia.org/wiki/String_interning关于java程序种的内存...

2018-05-14 08:56:16 240

原创 AlphaGo与蒙特卡罗树搜索

2016年 AlphaGo 横空出世,在AI界和围棋界掀起了一阵腥风血雨。宝刀一出,无数围棋高手如樊麾,李世石,柯洁等人先后被斩于马下。正所谓:十步杀一人,千里不留行。事了拂衣去,深藏功与名。AlphaGo 使用的技术有深度神经网络和树搜索,这篇文章主要介绍一下树搜索。简单的说 Monte-Carlo Tree Search(MCTS)的意思就是讲蒙特卡罗抽样的思想用到树搜索上。

2017-12-01 10:36:09 2203

原创 什么是蒙特卡罗

乍一听“蒙特卡罗”这个词,完全不知所云,我感到很奇怪,一个搜索算法Monte Carlo Tree Search为什么叫蒙特卡罗。 于是,就有了下面的文字。本篇文章主要介绍MonteCarlo方法的由来,及简单的一个应用-求π的值。

2017-11-27 17:24:50 2459

原创 Heuristic Search之Greedy Best First Search

Greedy Best-First Search本篇文章介绍Greedy Best Fisrt Search算法。实现GBFS算法时使用了上篇文章介绍的优先队列。下篇文章将尝试介绍著名的A star算法。

2017-10-26 22:00:41 3601 1

原创 Priority Queues

Priority QueueNested Class Java嵌套类本篇文章主要介绍优先队列(Priority Queue)和嵌套类(nested class)的基本用法。 接下来的文章会介绍在实现例如Greedy Best First Search和AStar搜索算法中使用priori

2017-10-26 21:58:17 716

原创 如何使用gitee作为免费图床

Use Gitee as public pictures storage本篇文章是一个启发,介绍如何使用gitee作为免费图床。 没有使用github的原因是因为github国内访问有些慢。 另外,还有其他优秀的云存储,例如7niu,朋友们也可以试一下。

2017-10-23 23:10:27 6339

原创 贝叶斯引论(一)

介绍了贝叶斯网的相关基础知识和应用

2017-10-21 08:03:08 4173

转载 欢迎使用优快云-markdown编辑器

欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl

2015-06-29 14:29:32 274

Practical Probabilistic Programming.pdf

Practical Probabilistic Programming.pdf 由manning出版社出版,对应中文版翻译书为:《概率编程实战》。是概率编程入门绝佳的好资料。 该书介绍了什么是概率编程,和一个概率编程系统Figaro,该框架基于scala,易于扩展,支持多数常用概率推理算法。

2017-10-16

贝叶斯统计 [韦来生编][高等教育出版社][2016.03][216页]

重要的事情说三遍:有书签,有书签,有书签! 贝叶斯统计教材。

2017-10-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除