- 博客(16)
- 收藏
- 关注

原创 XiaoHu是什么?(介绍帖)
这是一篇关于我在做的事情的介绍帖。我是shan-mx,15岁,北大附中高一学生。XiaoHu.ai是我在2018年2月6日开始开发的基于Python/物联网的人工智能管家系统,结合了语义理解,人脸识别等多种人工智能技术。使用Python, Node.js来编写客户与服务端。它自被创造以来共有三个版本:Standard ”STD”,Evolve ”EVO”,Educational ”EDU”...
2019-09-02 22:54:59
697
原创 XiaoHu日志 11/22~12/3
11/22 购置了华为云服务器,将学校服务器上的所有内容转到了新服务器上,并复制了原数据库。经调试后所有功能启动,原服务器暂停运行,作为应急备份。11/24 在谈话中明确了算法的方向。XiaoHu曾经走过概率化和规则化两种意图识别的方式,在尝试过两种方案后,我得到了概率化惨不忍睹的结果。于是我投入规则的怀抱,利用表达式的思想搞了句式拟合算法。当时我只知道这种方法在XiaoHu的环境里表现良好,...
2019-12-03 22:48:57
199
原创 XiaoHu日志 9/27~10/18
这段时间太忙了,XiaoHu要准备投入实用,还得准备比赛的东西。无心更新日志。目前考虑和团委及教务合作,推出【教务直通车】和【校园万事通】功能。宣传工作我用四天时间写了公众号推文,两天时间做了海报。目前还要为10月6号的发布为程序做调试。整个EDU版本还差物联网和前端。明天一天搞HA,前端也要这两天搞好。对于参赛,论文,展板,视频还都没做。这些都是十一假期要准备的。还有两个礼拜...
2019-09-27 22:20:57
138
原创 XiaoHu日志 9/7~9/17
9/7~9/17 这几天我把过评查询的功能调试得可以投入使用了。我计划在这几天把XiaoHu搞出一个版本,并在学校范围作宣传。在做宣传之前我需要先解决身份认证的问题,如果不搞验证,那么任何人都可以查别人的成绩了。同时我还要把宣传的文案写出来,把摄像头在教室里搞好。这是事务繁重的一周。我12号把摄像头接到了教室里,我把摄像头的ip设置成211开头的学校局域网格式,连上宽带后摄像头可以在电脑上被发现,...
2019-09-17 19:07:22
165
原创 XiaoHu日志 9/5~9/6
9/5 导入线上实体后,原先包含多种学科信息的filter变得只包含一个学科信息,因为讯飞只会识别出第一个匹配上的实体,这样还不如之前拿到一个不准确的结果,然后用自己的方法从词库中识别出学科信息。我一个半小时都在解决这个问题,拿出一个方法,然后用新的方法来解决方法带来的问题,然后又拿新新的方法来解决新方法带来的新问题。9/6 取消了线上实体,把filter重置为不定长字符串。我发现我可以从语料...
2019-09-07 12:17:06
126
原创 XiaoHu日志 9/2
9/2 8月份被军训和入学教育占领。今天是开学第一天。我之前测试XiaoHu功能时发现它的学科查询功能没有了,我后来检查发现那个函数的代码少了一半,应该是我同步双端数据的时候不小心拿电脑上的半成代码替换掉了原先的好代码,于是我只好再写一遍。写的时候我又打了个补丁:每个课会有一个“体育”“技术”的tag,我之前因为是拿标题分词,所以不能问“我的体育课”而是“我的足球课”,因为标题里没有体育。我把每个...
2019-09-02 21:49:54
134
原创 XiaoHu日志 7/29~8/9
7/29~8/9 最近在搞过评查询,过评查询跟之前的课程查询有些许异同,他们的实体定位都很不稳定,除了难以定位的“学科”实体外,过评查询还多了一个“过评项”实体,好在这两种实体都有着共同的特点——他们都可以被描述为一个已知词集的子集。对于学科实体,我维护了一个通过学生课程表分词而成的可能的学科词汇库,对于过评项,我也可以维护一个过评项成绩库。这两个库的区别在于,一个是对于全体学生永久存在的,一个是...
2019-08-09 20:11:03
244
原创 XiaoHu日志 6/29~7/30
6/29 今天我准备给XiaoHu添加语音识别功能,这个语音识别我在之前版本的XiaoHu上实现过,当时用的是itchat库获取微信语音消息数据,把数据下载下来后用讯飞的语音识别来转成文字,然后再当做正常的文字处理。下载微信数据需要token,为了获取这种token,我需要调用微信的api。但是微信的api有一个白名单机制。我的服务器在内网,所以ip不是固定的,它必须需要一个固定的ip才能把服务器...
2019-07-30 15:23:36
177
原创 XiaoHu日志 6/17~6/19
6/17 今天开始完成上周的想法。我并没有api能获取北大附的全部课程信息,于是我采用了一种新的办法,每绑定一个学号,就获取他的全部课程,分词并动态更新词库,这样既可以达到效果又可以不影响用户体验。分词我使用jieba库,将一个句子不断细分得到所有可能的词组,维护一个txt文件作为识别词库,我不用SQL的原因是sql那该死的缓存机制,一次修改后必须要重启程序才能重新读入,加上我这个是单键搜索,就直...
2019-06-20 22:07:19
139
原创 XiaoHu日志 6/10~6/12
6/10 今天又调了一些Bug,增加了查询上下午课位的功能。以后还会添加查询指定学科的课,和查询整周或时间段课表。6/12 今天准备加一个查询某天指定学科的功能,如“我明天足球课第几节”“明天我有数学吗”,这个功能看着很简单,上手开发后才发现有一些难受的问题需要解决。这个功能的逻辑是,先获取询问的日期,然后查询指定日期的课程result,在result中查询带“足球”的课程。原本我计划使用希悦...
2019-06-13 22:27:03
219
原创 XiaoHu日志 6/3~6/5
6/3 今天发现讯飞的云端平台已经同步了,就开始调试希悦功能,从中午调了一下午再到晚上,总算调试好了查询功能,很多时候我们在设计代码框架时想不到一些情况,就导致了bug的发生。功能调好后,XiaoHu可以告诉我某天某节课的信息,和某天所有课的信息。但是还有个问题,就是绑定学号到数据库后不会马上生效,必须要重启客户端程序后XiaoHu才能发现数据库里面的学号。这个Bug很离奇,即使我在每次操作后都让...
2019-06-10 17:27:59
112
原创 XiaoHu日志 5/29~5/30
5/29 今天开始把希悦查询功能完善上线,虽然很早就搞好了api的对接,但是要真正的实现客户的查询意图还是很麻烦。向云端上传了一些语料,完善了意图识别功能。识别了意图,再写queryClass和reportClass方法,把数据变成人话返回给用户,然后还需要一个数据表来对应source_id和希悦uid之间的关系,source_id可以理解为微信号的一个加密。建表的同时我还建了一个用户反馈的表,用...
2019-05-30 22:21:28
150
原创 XiaoHu日志 4/24~5/22
4/24 开始调试摄像头,这个摄像头需要网线和充电线,所以如果要挂在教室里还需要把两根线引上去。第一次调试成功,激活了摄像头,设置了它的ip,可以从网络上看到摄像头的景象,下一步就是搞rtsp协议。但是网上海康威视的几种rtsp地址好像都访问不到。5/15 尝试在学校调试摄像头,失败,网络搜索搜索不到摄像头。5/17 见了一个高一的学长陆,他在搞一种智能家庭场景的3D手势识别,我们比较聊得...
2019-05-29 17:11:11
171
原创 XiaoHu日志 4/17
4/17 今天打算把小虎的聊天记录数据库改成MySQL,因为XML格式虽然技术层面上已经解决,但是xml本身并不是一种好的存储数据的方式,而且在高频率的读写下会出现问题,比如多存一些字符。这导致在一次写错误后,之后的每一次读都会产生问题。XML本身的不稳定性使我放弃了它,转而使用更加专业化的SQL数据库。我之前对SQL完全没有了解,不过网上的资源很多,我直接通过教程自学。自学的路程很坎坷,一个小时...
2019-04-17 21:07:50
172
1
原创 随想
XiaoHu实现希悦单点登录教室摄像头开关部署感觉语义理解查询课表这个功能放在小虎上感觉有点突兀,但是我不可能近期把这个功能交给希悦,然而大家也不会因为我有这个功能就去用我的小虎。。。如果交给希悦,我就没有产权了,谁都不知道这个功能是我想到的,我开发的。XiaoHu以后要走的路还不清楚,周一问问陈清伟吧...
2019-04-13 20:16:51
345
原创 XiaoHu.ai开发日志(自2018年2月6日至2019年4月11日)
一年多来,一直在项目目录下的update_log.txt里记录开发日志,今天放到网上来,共6189个字。————XiaoHu.ai Standard 代号STD————2/6 v0.1 项目启动,使用老版百度api,无法识别,开发停滞2/8 v0.2 在贵哥帮助下用了新的百度api,语音助手可以识别正则表达式指令,整合图灵api获得聊天功能2/9 v0.36 更换数据库架构为xm...
2019-04-12 21:50:06
822
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人