天飓-优快云博客

原创用一张照片，生成一个短视频故事

没关系，选择重新生成视频，AI视频工具会根据之前的提示词自动再做一个新的视频。这时候，AI神奇的地方就来了，每一次生成的新视频与之前的都不一样，有的视频会让你感到惊喜。然后，把这张图倒入AI视频工具，选择图生视频功能，输入提示词“青铜树上的青铜铃铛都在晃动，旁边的枣红马抬起两条前蹄，抬头嘶鸣”。最近在玩AI视频，主要是先用AI生图生成一个个分镜头，然后用AI图生视频将这些分镜头做出来，之后用视频剪辑工具把它们合成。但今天，我突发奇想，如果只用一张现成的照片，是否也能够借助AI视频工具，做出一个短视频？

2024-12-23 13:05:40 435

原创推荐学习图像处理的入门书：《Python图像处理实战》

当然，现在的技术真的是日新月异，作为一本2020年出版的技术书，到2024年的时候，里面的一些代码和库早就升级了，但它并不妨碍我们对其中基础知识的理解，并且，更因为新的库的出现，在掌握了基础概念后，能更好地利用新的库和新的代码，做出更符合我们需要的程序。就我个人的经验来看，在学习完对应章节的代码练习后，我会去网上进一步学习更新的代码编写技巧，并尝试着将这些代码整合起来，最终做出一个自己的Python图片编辑程序（如下图）。于是，就这么边学边玩，我对图像处理的技巧的认知也一天天加深。

2024-12-18 10:04:59 638

原创动手做一个古文明的新闻播报员

那么，让我们用浏览器打开一个AI绘画的平台，输入对应的提示词，生成你想要的古文明播报员的图片。再回到数字人播报页面，选择数字人-我的照片，从我的资源中把新生成的透明背景数字人选中。数字人播报编辑页面左侧工具栏有个背景选项，选择一个现成的背景，或者你自己制作的背景图，数字人就会站在这个背景前了。数字人播报右边区域就是文字编辑区，你可以自己写播报的新闻稿，也可以用系统提供的AI文字生成工具来编一段播报词。在播报词底部有当前默认播报员声音，点击它，会跳出可供选择的声优，听一听，然后选一个你喜欢的。

2024-12-09 11:13:13 450

原创用QFD筛选产品功能

这部分内容就是评估左墙和天花板之间的相关性，通常可以分为强（5），中（3），弱（1），比如客户需求是简单易用，你的产品功能是自动聚焦，这两者就可以认为是强相关，对应的格子就可以填写个5分。在产品开发中，一直以来都倡导MVP法，就是要用最小的代价来快速验证市场，检验产品，之后再根据市场的反馈及时调整产品功能，并快速迭代。所以，这个时候，看着手头的众多选项，你作为产品经理，要带着团队做减法。一款产品，在一开始就把所有能想到的功能都囊括进来，先不说市场是否会接受，就开发成本来看，这样做也是不合适的。

2024-12-09 10:40:11 1118

原创《轻松Scrum之旅》，一本值得一读的老书

就个人曾经看到的，很多单位说是用敏捷，其实还是夹杂了更多的瀑布式。不过，对于想了解敏捷理念、或者正在开展敏捷管理的朋友，有时间读一读这本《轻松Scrum之旅——敏捷开发的故事》，应该依旧还是很有帮助的。这也是我推荐这本书的原因。故事中细细描述了这些工程师是如何用敏捷的方法解决了一个又一个软件开发中遇到的困难，又如何从敏捷管理中得到了启悟，提升了他们的工作效率。《轻松Scrum之旅——敏捷开发的故事》出版于2009年12月，它讲述了一群IBM的工程师是如何通过使用敏捷方法，来帮助自己的团队完成项目的故事。

2024-12-02 17:14:38 305

原创用KJ法做产品分析

于是，你发动团队的力量，开始收集各类信息，做市场调研，询问相熟的专家……和你的团队成员一起站在这面玻璃墙前，看着辛苦一整天的工作所获得的成果，你们都开心的笑了。便签纸上所记录的其实只有一句话，比如，调研问卷中有个客户反馈“我希望产品是轻便的，牢固的。除了撰写基础卡片外，你还安排了另外两个助手，他们和你一起负责收集成员们撰写的便签纸，然后把这些便签纸根据内容的相似性，把它们分别贴在会议室不同的玻璃墙上。

2024-12-02 15:45:02 818

原创 5分钟，用AI搞定视频分镜头

虽然AI让我们省去了取景拍摄的过程，但是从开始的策划、到每个分镜头的提示词设计、到图片选择，再到最后合成，其实事情依旧还是那么多。想清楚了，然后把拍摄的内容写下来，比如：整个视频会分成几个场景，那就把每一个场景的描述写清楚。目前，我用过的能够直接图片转视频的工具有抖音的即梦AI，也有快手的可灵AI，它们都可以满足一张图片配合提示词，制作成分镜头视频（5秒时长）。那么，我的分镜头描述就是：一名古埃及书记员坐在演播室正面播报新闻，背景是演播大厅，右上方有一块屏幕，底部是滚动新闻，全景。

2024-11-28 13:38:54 1967

原创怎么用AI读书？

通常，拿到一本书，我会先看看书本简介，然后初步判断是不是我所需要看的类型。当然，在用AI读书的过程中，我们还是需要清晰认识到，目前AI读书的分析只能是表面化的解读，它无法真的带有思考性的理解。而且，在阅读过程中，如果遇到什么问题或有什么想法，在AI读书工具中也通常会有AI互动的功能，这时候，你就能通过AI进一步获悉对应的知识点，看看别人的理解，这对于自己的阅读也有非常大的帮助。最后，AI读书生成的思维导图也是一个很好的书本知识梳理工具，它能帮助我更清晰地理解这本书的脉络和架构，帮助我理清思路。

2024-11-25 17:45:04 674

原创让语音助手露个脸

UI程序启动后，会在一条新开的线程中执行连接ws服务的指令，然后实时获取从ws服务端传过来的数据包并对其进行解析，当得到的stat指令与当前表情指令不同时，UI程序就执行了“变脸”操作。终于，还是给我想到了一个解决办法，那就是，通过websocket连接，给语音助手配个表情包。既然UI程序会收来自ws服务端的数据，那么必然也要有一个发送端，这个发送端当仁不让只能是语音助手主体程序demo.py本身了。的合集，上面记载了我做过的各类语音助手应用记录，有兴趣的朋友欢迎关注和订阅。好了，现在开始说具体实现。

2024-11-25 16:00:38 537

原创让语音助手做道数学题

不过，大家不要忘了，我是语音助手，输入的是中文！所以，我要先判断输入的算式中是否包含四个运算符的对应中文单词（加、减、乘、除），如果包含了，那么就用+，-，*，/替换中文字。可是，我忘了，我用的是MitieNLP，而且我已经在nlu中定义了三个标签了，果然，当增加这个equation标签后，我的rasa train又双叒叕陷入了无止尽……Kill了rasa train的进程，重新定义nlu、domain和story，这次学乖了，我去掉了nlu中的新标签，在domain里增加了一个form，具体如下图。

2024-11-20 11:37:35 1115

原创用Python编写一个websocket客户端应用

如上代码，我分成了上下两部分，上半部分是定义了一个class，下半部分又可以分成两段，第一段是生成一个子线程，让websocket client在子线程里跑。》代码中的一个bug，就是当服务器和某个客户端断开连接后，我没有删除Client队列中对应的数据项，这会导致其他客户端再发消息时就报错了。注：在实验中，我就开了两个客户端，一个是网页版，一个是python版，在后面代码中你可以看到，我的客户端name是写死的。2.接收服务器消息，若是收到指明发给自己的消息，则会在主线程打印，否则就忽略该消息；

2024-11-20 11:28:40 1229

原创用Python做一个websocket服务端

其中，stat包括link和send两种状态，to是消息接者者（receiver），from是消息发送者（sender）。若to为空，则表示该消息是广播消息；若to不为空，但对象不存在，则该消息不会被执行发送。1.能将client端的软硬件信息关联（如client_name和对应ip:port），且不支持重复关联;2.可以判断接收自client端的消息属于哪种任务，并对应执行（如关联、发消息）;3.根据接收自client端的消息判断是点对点发送，还是广播发送，并执行。

2024-11-18 19:30:29 2145

原创用jquery做一个websocket客户端

功能很简单，就是作为客户端连接websocket，并实现接受和发送消息。

2024-11-18 15:58:44 590 2

原创用Python编写10个动态表情

这10个表情都是用python的turtle来画的。需要注意的是，代码中用了from PIL import ImageGrab来获取屏幕尺寸screen_width和screen_height，这个代码不适合Linux，linux中需要把这行注释掉才能运行，且screen的size就要手动设置了。一共有10个动态表情，分别是微笑、难过、害羞、尴尬、生气、困、瞌睡、大笑、转眼睛、哭。我在个人公众号“天飓”上建了一个。的合集，有兴趣的朋友欢迎添加。

2024-11-18 13:17:21 545

原创推荐一本适合新人学习的神经网络入门书《Python神经网络编程》

虽然这本书的优点很明显，但是它的不足也很明确，即真的只适合初学者，稍微深入一些的概念，书里就基本不涉及了。而且，就当前的技术发展来说，书中所介绍的传统神经网络的方法也有些落伍了。不过，瑕不掩瑜，《Python神经网络编程》可以让初学者快速产生学习的热情和兴趣，并在完成自己的第一个神经网络程序的时候，产生想继续再深入下去的学习欲望，为后续的深度学习研究打下坚实的基础。《Python神经网络编程》是塔里克·拉希德（Tariq Rashid）所著的一本入门级的介绍深度学习和神经网络的书。

2024-11-14 18:20:04 245

原创基于OpenCV的自制Python访客识别程序

这个程序的功能其实说白了就是用OpenCV打开摄像头，然后进行人脸识别，识别的人脸数据会存储在一个image_list的数组中，若在image_list中没有发现相同图像，就会在右侧Qlabel添加一个新的label并把新增人脸贴上去。由于直接用的是OpenCV自带的模型，所以戴口罩的人脸是无法区分的。先说打开摄像头播放或暂停的功能，这个功能我在以前的博文中已经具体介绍过，参看。4、若是新访客的，右边今日访客栏中就会将该访客人脸图像展示出来。2、选择播放菜单，可以播放/暂停当前正在播放中的视频信息。

2024-11-14 09:13:44 1285

原创 Python 让树莓派弹曲子

想要在树莓派上调用蜂鸣器发声，首先要先安装了sox，之后要用os.system来调用sox执行蜂鸣器报警：os.system('play --no-show-progress --null --channels 1 synth %s sine %f' % (duration, freq))请注意，上面同样的duration（持续时长），比如500ms，在windows中是写500，在树莓派中是写0.5。知道了怎么调用，那么，接下来就只要知道对应的音符的频率就可以演奏乐曲了。

2024-11-11 15:17:23 331

原创 Pyqt5蓝牙链接心跳检测

若上位机接收到数据包，在其检测显示区域就会显示一颗金色的心（图2）；整个程序的核心代码就是openserial()函数，函数先获取端口号和波特率数据，然后执行串口链接操作，链接成功则启动数据接收线程，并在检测显示区域画心。程序的操作就是选择串口端口->设置波特率->点击“打开串口”按钮，若串口链接成功，显示区域就会出现一颗心。前不久组装了一台带有蓝牙的STM32小车，然后用pyqt5编写了一个简单的上位机程序，实现PC端通过蓝牙遥控STM32小车。今天先来聊聊其中的蓝牙链接和链接检测的功能（图1）。

2024-11-04 11:09:18 392

原创利用tracker.latest_message实现和rasa bot聊天气

同样的方法，但这次不用get_slot，而是直接获取最新的用户话本（user text）来做配对。同样的，domain里也不需要设置多个utter话术了，直接变成一个action_about_weather，story也合并成一个。对于三种天气，分别定义了要下雨了，正在下雨和好天气三个聊天意图，然后在domain中针对这三个intent又分别定义了对应的utter_***话术。但是问题来了，天气的种类远远不止上述三种，那么我是不是要每一种天气开头的聊天都要单独定义一遍？答案不是不可以，可会让人觉得有点傻。

2024-10-28 15:24:30 442

原创一次RASA TRAIN的时间记录

Rasa train的训练究竟要用多长时间？昨天在做新一轮训练时，我记录了这个时间。开始前还是要先说明下，我用的是rasa1.4版，NLP是MitieNLP，系统是32位的Linux raspberrypi 4.19.57-v7+，armv7l GNU/Linux。Rasa train开始时间：2024-10-27 20:10 * 从正式执行rasa train命令开始到完成core model training，总耗时5分钟。 * 开始执行nlu model training，Part

2024-10-28 15:19:09 269

原创古埃及象形文字在线字典

点击文本框，输入中文或英文关键字，点击“Search”按钮，页面就会跳转到象形文字字典页。点击英译列表中的某个词语，就可以看到该词语对应的象形文字内容及其中英文翻译。”上推出了在线的象形文字字典，总共收罗了将近700条的象形文字（词）。在线字典的使用方法很简单，在网站各大版块首页的右上方会有如下图所示的查询入口。有些象形文字所对应的信息会涉及网站中已收录的某个古埃及故事，那么，在其具体解释细则后面就会出现“目前，这个在线字典还没有包含具体的象形文字发音，以后有时间，我会再逐步添加。

2024-10-24 12:04:18 828

原创听一听语音助手的声音

本来是想借上周重装系统的机会把TTS也换一下，依旧还是树莓派系统原因，相应的高版本的tensorflow、torch等我都装不了，也就只能继续用espeak将就了。》所列，目前我用的sherpa-ncnn的中文模型的size是small，但在我的这块18年买的树莓派上，其识别的耗时依旧还要4-5秒（官网演示材料显示的耗时是0.8秒）。如果有知道怎么提升这个识别速度的朋友，还请不吝告知。上图是本次对话的log记录，从图上可以看到，主要的对话耗时是用于录音（默认5秒）和语音识别（平均5秒）这两个组件上。

2024-10-23 13:53:04 454

原创 label+actions实现rasa bot的问答交互

对于上述应答情景，我在程序里先定义了两个数组，第一个是实际功能清单，第二个是功能关键字。rasa bot在判断了用户问题并转到action后，程序会执行tracker.get_slot("behavior")，获得user问题中对应的label信息，如果这个label为空，则按照情景3回复；如果label不为空，则让label的内容与功能关键字进行匹配，匹配成功按照情景1回复，否则就是按照情景2回复。比如我在nlu中定义的问题是询问语音助手能做什么，得到的回复应该是两种可能：1.是的，我具备***功能；

2024-10-23 10:14:12 358

原创让pipdeptree帮你做一个安装备份

这时候，昨天保存的rasapip.log就派上用场了，打开这个log，查到之前安装成功的rasa的依赖树，找到tensor2tensor这条信息，看看它底下究竟装了什么？不去管pip3 install tensor2tensor==1.14.0会装些什么了，我直接参考这份log里面的信息，从上往下把tensor2tensor的依赖项一个个都按正确版本装好，回过头再去pip3 install tensor2tensor==1.14.0，没有任何“废话”，一次成功！我为什么说要用它做一个安装备份呢？

2024-10-17 15:57:09 200

原创遇到/usr/bin/ld: cannot find -lf77blas的报错

立马在优快云上查找，可是绝大多数的解决方案都是某个.so的软连接，但自从前几天遇到GLIBCXX_3.2.9的问题后，我对软连接的解决方案已经不再轻信。继续找解决方案，有说这类报错，基本上是l*后面的*库缺失，只要把对应的库安装上去就可以了。可一下子是好几个l*，我该装哪一个才是正确的？之前安装snowboy也没有遇到这些报错呀！结果不用猜了，再次启动snowboy，顺利执行！

2024-10-17 15:37:40 387

原创在Boot盘放入ssh和wpa_supplicant.conf，让新烧的Raspbian也能马上实现SSH远程登录

把它们放入新烧录好的sd卡的boot盘中，将sd卡插入树莓派启动，等绿灯不再频繁闪烁的时候，打开putty，选择以前登录过的那个树莓派地址，不一会儿，就会弹出登录成功的提示。注意，由于是新系统，这次SSH算是第一次，登录请用树莓派默认账号和密码：pi 和 raspberry，登录系统后再通过sudo raspi-config予以修改。这里还要提一句，如果你以前没有在家登录过这台树莓派，那么你的putty上是不会有原来的ip地址的，需要你自行查找设备ip后再来登录。其中的priority表示连接的优先级。

2024-10-17 15:24:32 333

原创第一次重装树莓派系统小结

比如我的树莓派3B+，是32位armv71架构，买的时候就配了一个3.5英寸触摸屏。安装好后，要给3.5英寸屏加驱动，按照《第三次选择了3.5英寸屏开发商提供的2019buster版的raspbian，一切都是熟悉的配方，软硬件全部一步到位。结果，惨痛的教训告诉我，最实用的才是最好的。但是，这个工具提供的镜像版本最低也是bullseye版本，当前默认的都是bookworm版，这对老型号的树莓派来说，还是要注意下的。所以，raspbian系统不是越新越好，适合你的树莓派硬件需求以及你本身的习惯才是最重要的！

2024-10-17 15:20:11 451

原创解决`GLIBCXX_3.4.29‘ not found的正确思路

遇到`GLIBCXX_3.4.29' not found问题不是急着升级gcc，找已经编译好的libmstdc++.so.6.29，而是要去找引发这个报错的库是哪一个！

2024-10-16 09:13:49 1420

原创关于Fail to build dm-tree的问题

有看官可能会说，dm-tree最新版cmake不识别-j4，那我将dm-tree版本下降不就可以了？的确，将其版本降级为0.1.5（甚至是0.1.0），pip install的时候的确不报cmake不识别-j4的错误了，但这时候就会出现找不到bazel的报错，查了查网上资料，感觉解决bazel比升级cmake更麻烦。重装rasa和tensor2tensor的时候都在提示fail to build dm-tree（最新版0.1.8），然后单独pip3 install dm-tree，也是报错。

2024-10-13 10:12:53 403

原创 sherpa-ncnn 语言模型简单对比

在昨天把系统搞崩溃前，对sherpa-ncnn的中文模型做了一个简单的对比。这次使用的分别是sherpa-ncnn-streaming-zipformer-bilingual-zh-en-2023-02-13（以下简称bilingual-zh-en-2023-02-13）和sherpa-ncnn-streaming-zipformer-small-bilingual-zh-en-2023-02-16（以下简称small-bilingual-zh-en-2023-02-16）。

2024-10-12 18:06:27 977 2

原创解决报错：Invalid number of channels [PaErrorCode -9998]

于是，我pip3 install –upgrade pyaudio，的确升级了版本，但运行record.py时还是同样的报错。》一文中，我提到过用sounddevice录音的时候需要定义具体是哪个设备。于是打开record.py文件，一看，当前使用的device = 3。如上图，重装树莓派系统后，我的usb麦克风的编号变成了2（从0算起），所以，代码要改为device=2。在终端输入python3 -m sounddevice，可用音频设备一目了然。继昨天重装了树莓派系统后，今天开始重新安装语音助手。

2024-10-12 17:49:00 672

原创用Raspberry Pi Imager重装树莓派系统

这次在官网无意中看到他们出了一个Raspberry Pi Imager的工具，可以直接完成镜像烧录操作，于是就尝了个鲜。选择“编辑设置”按钮，会弹出具体的设置信息，有三个tab，第一个是General信息，包括用户名、密码、wifi和语言设置；后续的操作就和我当初第一次装树莓派系统的操作差不多，在此就不再赘述，有兴趣的朋友可以看我以前的博文。完成定制化设置后，点击“保存”按钮，软件回到前面的提示框，连续点击两个“是”，开始写入SD。第二个下拉框选择你要安装的OS，点击黄框所在的选项，可以挑选更多OS。

2024-10-11 19:57:34 502

原创 Python实现天气信息查询

接下来，我要在rasa的actions.py中调用我写的这两个函数，并最终实现语音助手查询天气信息的功能。2.language：显示的语言，默认是zh-Hans（简体中文），其他还支持12中语言或字体，具体可以参看官网产品文档。4.start：天气预报起始时间，默认值是0，<0是今天以前，>0是今天以后，也可以输入具体的日期如2015/10/1。5.days：输入数字，比如3，根据权限的允许最多天数，显示对应的几天预报。1.location：查询具体的城市名字，显示的就是对应城市的天气。

2024-10-10 10:08:00 885

原创 Python通过imap收取163邮箱

接下来，我就可以在rasa的actions.py中调用这个class，并最终实现语音助手收取最新邮件的功能了。相关代码我会在我的公众号“天飓”发布，感兴趣的朋友欢迎关注“天飓”。要给自己的树莓派语音助手增加一个收邮件的功能，在优快云上对比了pop3收邮件和imap收邮件的两种不同方案，最终选择用imap来收取163邮箱的邮件。请注意：因为我是要让语音助手播报邮件内容，所以上面代码在邮件正文内容部分做了html转纯文本的格式转换。

2024-10-10 09:08:51 14092

原创使用MitieEntityExtractor训练中文NLU速度慢的问题

Rasa train的时候，如果pipeline中包含了MitieEntityExtractor，那么在训练中文NLU的时候，NLU中不能放置过多的entity标签——如“[今天](date)”，其中date就算一个。否则，训练进行到part II train segment classify的时候，训练时间会无限延长（可能几个小时都没结束）。就我的树莓派3B系统来看，在NLU里放三个entity标签可以用正常时间训练，多一个，训练时间就不可控。

2024-09-29 08:43:46 125

原创 python获取百度地图路径规划

自制语音助手想做一个查询交通路线的功能，于是就想到了百度地图。在百度地图的服务器端应用中，提供了“轻量级路线规划”API接口，正好可以满足需求。要用这个接口，需要注册百度地图账号并创建一个服务器端的应用。好了，现在知道了路线规划的接口，也知道了地理编码的接口，把它们组合起来，就能做一个自定义的路线规划程序了。如果把transit改成其他三种方式，得到的response数据格式会有些不同，如下图，设计代码的时候需要注意。好了，这就是完整的python获取百度地图路径规划的代码了。喜欢的话请给我一个赞吧！

2024-09-29 08:38:20 870

原创首次在rasa中使用form的个人小结

和普通action的定义一样，先要定义一个class，如Class ActionQueryTaskForm(FormAction)，注意括弧内要填写“FormAction”，代表这是一个form action。首先需要在domain中定义form，同时也要定义这个form会引用那个entity，这些在slot中也要一起定义。当然，rasa中的form使用必定还有其他内容，等我用到的时候再来小结。》的时候，我尝试使用了form，这是我第一次在rasa中使用form，今天空下来了，自己小结下。

2024-09-15 14:30:49 440

原创树莓派智能语音助手实现音乐播放

用sounddevice编写的音乐播放功能，结合rasa的语义解析，让树莓派语音助手也可以像小爱音箱一样，通过语音指令实现音乐播放。

2024-09-14 20:47:07 1768

原创用sounddevice播放音乐遇到output underflow提示

这个提示是打印了音乐播放的callback函数中print(status)的信息。查sounddevice的API接口说明，原来这是代表stream callback独占了cpu，导致其他程序都不用跑了。比如我加的是blocksize=5*fs，5代表5秒，fs是samplerate。可是，将它挪到树莓派与语音助手的代码融合后，却发现了一些问题，最主要的是运行时出现了“output underflow”提示。之前写了一篇用sounddevice播放音乐的博文，里面是我写的一个简单的音乐播放器（《

2024-09-14 20:34:55 497

原创用python写一个简单的定时提醒

简单的定时提醒功能，主要用了sched中的scheduler模块实现。

2024-09-09 15:36:21 346

Python编写的emoji表情包

一共有10个动态表情包，分别是微笑、难过、害羞、尴尬、生气、困、瞌睡、大笑、转眼睛、哭。

2024-11-18

基于《Python神经网络编程》一书写的代码

复刻了《Python神经网络编程》一书中的所有代码，并且基于这个代码写了一个数字识别的验证程序。

2024-11-14

基于OpenCV的Python访客识别程序

本程序使用pyqt5编写，具体功能如下： 1、选择媒体菜单，可以打开本地摄像头；如果知道rtsp地址，则可以直接访问局域网内的网络串流。 2、选择播放菜单，可以播放/暂停当前正在播放中的视频信息。 3、视频播放过程，应用会每隔1秒扫描一次屏幕中出现的访客并通过识别判断是否是新访客。 4、若是新访客的，右边今日访客栏中就会将该访客人脸图像展示出来。 5、今日访客数会根据新增访客图像的增加而同步更新。

2024-11-14

PYQT5蓝牙链接心跳检测程序

这是用Pyqt5编写的STM32小车蓝牙链接心跳检测程序。若蓝牙链接正常，程序显示有颜色的星形；若蓝牙链接断开，程序会显示灰色星形。判断蓝牙链接是否保持是以程序能否接受到STM32小车发送的数据为依据。

2024-11-04

seasalt-ai版的snowboy语音唤醒安装包

从github直接克隆的seasalt-ai版本的snowboy安装包，这个版本带有唤醒词训练。不过需要注意的是，唤醒词训练只能在ubuntu16.04环境下操作。

2024-07-24

Python简易视频播放器

用Python+pyqt5+Opencv做的简易视频播放器，可以播放本地视频文件，也可以打开本地相机，还可以读取网络串流（局域网）。核心代码是利用了opencv的cv2.VideoCapture(url)函数，根据函数中url参数的变化，实现不同设备视频的播放。

2023-05-16

INRIA Person 数据集BT资源

INRIA Dataset 是一个行人检测数据集，其图片库被分为只有车、只有人、有车有人和无车无人四个类别，其中正样本为 PNG 格式，负样本为 JPG 格式，该数据集包含具有相应注释文件的原始图像和标准化格式图像两类。

2023-05-11

numpy-1.21.4-cp37-cp37m-linux-armv7l.whl

树莓派 armv71架构，对应python3.7的numpy的whl文件

2023-04-29

numpy-1.24.2-cp39-cp39-linux-armv7l.whl

numpy-1.24.2-cp39-cp39-linux_armv7l.whl是对应python3.9，适用于树莓派的numpy升级包

2023-04-29

Python Image Viewer V1.0

这是一款用python编写的小型图片浏览应用，可以在Windows下执行。具体功能如下所述： 1、选择文件夹或者直接输入目录名，会在图像列表展示带缩略图的文件名，目前支持jpg，bmp和png三种图片格式。 2、图像的放大缩小操作可以通过菜单按钮执行，也可以直接滑动鼠标滚轮实现。若双击鼠标左键，非原始尺寸图像会恢复原始尺寸；原始尺寸图片会放大适应图像浏览框。 3、图像的翻转操作可以通过点击菜单按钮执行。 4、各类图像渲染操作都是通过点击对应菜单按钮实现，点击原图按钮，所有的渲染操作复原。 5、点击保存按钮，可以保存当前显示的图像样式（如已渲染过的图像），图片保存格式为jpg。

2023-04-27

Python简易图片浏览器源码

用python，pyqt5编写的一个简易图片浏览器源码

2023-04-24

倒计时V1.00(VB桌面程序)

1、这是一款动画显示倒数计时过程的桌面程序； 2、用户可以根据精确时间设定和模糊时间设定两种模式来选择倒计时； 3、在精确时间设定中，系统可以根据设定的时间与当前时间的比对来提供“立刻倒计时”和“等待到开始时间再倒计时”两种选择； 4、在倒计时开始启动后，通过右键点击动画图像可出现弹出菜单进行相应操作。

2011-07-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人