距离上次写技术总结已经一个月了,我们来看看这个月都用到了什么技术吧。
第一周:
8/15
今天开始开发语音App。预计是与微软的声纹识别,语音合成,语音识别三个API进行交互。
首先做的是一个录音的功能,我直接使用了ExtAudioRecorder工具类用来录制wav格式的PCM。代码的具体实现我还得找个时间写技术报告。
8/16
今天手动设断点与微软的声纹识别进行交互,查看发送消息后接收到的消息。主要用到的技术有httpClient,json的解析。其实技术方面不是很复杂,主要是交互流程比较长,一共有三步。
8/17
调研了一下微软的TextToSpeech功能。因为这几天是和毛一起工作的,所以我特意放慢了工作速度,让她能够尽量赶上。这三天做的具体的东西并不多。
8/18
今天也没干啥~整合了按钮的功能~就是把onClick改成了onTouch,然后利用
switch (event.getAction()) {
case MotionEvent.ACTION_DOWN:
和case MotionEvent.ACTION_UP:来根据按钮的按下和弹起做相应的动作。
第二周:
8/22
由于图像认知APP的计划结束时间更早,所以今天开始开发图像认知APP。其实这个APP还是比较简单的,主要就是六个和服务器交互的模块,基本流程都是一样的,就是拍摄或者从相册中选择一张图片,然后将图像上传到服务器,最后根据服务器的返回结果显示相应的内容。
8/23
今天修改了声纹识别的接口,与语音小组的服务器进行联调。联调成功。
主要的工作是界面方面。把popupMenu改成了popupWindow,弹出菜单较为美观了。
这个弹出菜单还是比较复杂的。详情请看链接。
8/24
今天完成了图像认知App与服务器交互的测试。已经可以正常使用。剩下的就是界面方面的微调了。
8/25
今天对图像认知App的子界面添加了返回按钮。
首先显示出返回按钮,并且设置为可点击。
getActionBar().setHomeButtonEnabled(true);
getActionBar().setDisplayHomeAsUpEnabled(true);
然后对返回按钮的功能进行设置
@Override
public boolean onOptionsItemSelected(MenuItem item) {
if (item.getItemId() == android.R.id.home) {
finish();
return true;
}
return super.onOptionsItemSelected(item);
}
8/26
今天找到了微软的SpeechToText的开源项目,不过是用Android Studio编译的,我的电脑已经跑不起来了。这进一步激发了我升级电脑的欲望。稍微改了改,用eclipse跑起来了。微软的识别速度和正确率都挺高的。我还得再写一篇文章分析一下这个源码,看他是怎么写的。
写了两周的小结,挖了两个坑,有点累,休息会。