- 博客(13)
- 收藏
- 关注
原创 [開發紀錄]語音辨識注意事項
這兩天為了語音辨識的資料解析度作了一些討論,1、目前使用32ms作為一個音框,每個音框有512筆資料,覆蓋率為50%,取樣率16000,取到的聲音(一個字)大約在20~30個音框,總覺得太短,若更改使用16ms,可增加音框數,但每個音框變為256筆資料,降低了轉換後的頻譜解析度,仍不利於辨識,2、嘗試更改取樣慮到32000,轉換的頻率資料雖然增加,但人聲的頻率範圍再高頻處成分不多,原範
2012-10-30 13:36:08
565
原创 [開發紀錄] 語音辨識 - QT使用
由於TI官方的C6accel太不給力,目前尚無DSP開發能力之前,只能先放棄DSP的部份,完全使用ARM進行開發,那麼不再綁定DVSDK開發環境,使用QT進行編輯,可在Linux內進行編譯測試,確認功能後再進行交叉編譯的工作, 首先,先找到 QtSdk-offline-linux-x86-v1.2.1.run 以及 qt-everywhere-opensource-src-4.8.
2012-10-29 15:09:15
757
原创 [開發紀錄] 語音辨識 - 基本結構
接下來要使用DM3730進行語音辨識的開發,目前已由 MATLAB 測試完成基礎的語音辨識,進行程式轉換。10/11錄音部分已可正確錄音,並直接進行播放,在語音的能量偵測部分,出現問題,使用電腦進行錄音,儲存成WAV檔案,可正確進行判定字數,並進行FFT後作MFCC轉換出特徵值。猜測是ALSA MIXER 音量增益問題,預計調整混音音量再進行測試。10/15
2012-10-01 11:58:03
503
原创 [開發記錄] 函式庫調用 - 使用C6accel 資料庫進行FIR函式調用 之其一
先前測試了FFT的使用,接下來進行FIR的測試,目前已將C6accel程式清空,主程式只保留DSP調用需要的部分,將測試碼獨立為一個副程式,才不會不小心把主程式搞壞,測試代碼如下所示:int c6accel_test_FIR(C6accel_Handle hC6accel,unsigned int nr,unsigned int nh){ float fc=(float
2012-09-27 10:43:47
2112
原创 [開發記錄] 函式庫調用 - 使用C6accel 資料庫進行FFT函式調用 之其二
int c6accel_test_code(C6accel_Handle hC6accel,unsigned int n){ int i,j; float k,l; double T; short *WN16; short *inBufs; short *outBufs; int Npoint = 16; short *FFT_Value; float *testBufs;
2012-09-27 08:50:19
2090
原创 [開發記錄] 函式庫調用 - 使用C6accel 資料庫進行FFT函式調用 之其一
目前需要針對聲音資料進行處理,而BeagleBoard-xM,為了聲音及影像的高速運算,使用兩個核心元件,ARM核心: Cortex-A8,目前我們的 Embedded linux 系統以及應用程式都在這顆運行;DSP核心:C64+ DSP,TI提供了C6accel的模組,將相關的影像/聲音加解碼,以及大部分需要使用的演算法,製作成函式庫形式,只須包含相關header文件,在程式中調用
2012-09-04 08:46:09
2226
原创 [開發記錄] 函式庫調用 - 使用ALSA進行音訊資料擷取 之其三
在使用ALSA的API進行聲音擷取,capture部分似乎是沒問題的,但在進行playback時,產生了under run的狀況,OVERRUN :一般是在進行Capture時,硬體buffer已滿,卻未即時取出資料,使得該筆資料丟失,而產生錯誤;UNDERRUN :是只在進行playback時,硬體buffer已全數輸出,而來不及補充後續資料,使得資料斷掉;以上兩種情況,都稱為 XR
2012-08-29 13:44:13
2999
原创 [開發記錄] 函式庫調用 - 使用ALSA進行音訊資料擷取 之其二
針對前一篇的 main (int argc, char *argv[]) 裡面的argc以及argv[]參數做個簡單解釋,argc 代表命令列的參數數量argv[] 將資料參數 記錄的位置,範例: target# > ./MiniCapture default 那麼argc = 2 , argv[0] = MiniCapture ,argv[1] = default ,
2012-08-24 16:21:54
4447
原创 [開發記錄] 函式庫調用 - 使用ALSA進行音訊資料擷取 之其一
目前打算使用ALSA進行資料擷取,關於ALSA API所搜尋到的網路資料( http://equalarea.com/paul/alsa-audio.html ),其中有一段 Mini Capture程式,並作了些許修改,如底下所示://---------------ALSA 測試程式---------------#include #include #include
2012-08-17 11:05:26
2562
原创 [開發記錄] 函式庫調用 - GPIO控制 之二
參考網路資料,找到另外的IO控制文件,其中,devmem2是另外的工具程式,很容易在網路上找到相關的source code,編輯為執行檔後,讓IO控制程式可連結執行devmem2即可,System命令,可用來執行shell層命令,先將須使用的Pin腳進行設定,將BeagleBoard-xM的GPIO130設定為GPIO功能,並設定是否pull-high等相關參數,
2012-08-16 15:01:16
1233
原创 [開發記錄] 函式庫調用 - GPIO控制 之一
# 學習 Embedded linux 函式庫調用先嘗試控制 GPIO 部分:每一腳都有六種功能,須由MUX設定,並且經由記憶體對應的位置控制IO。#include // C語言標準函式庫-檔案處理#include // C語言標準函式庫-通用工具#include // linux 系統函式庫#include // linux 系統函式庫#include //
2012-08-13 17:36:14
682
原创 [開發記錄] 編譯 BBxM 用的應用程式
記錄:#2 撰寫 Source Code 並使用make進行編輯 -TI的文件內的基本編輯方式,使用 Code Sourcery lite 進行編譯,在安裝DVSDK之前也會提示需安裝此工具。先建立 helloworld.c 檔案,(代碼就不在此列出,可參考DVSDK內說明文件),以及建立Makefile檔案,另外需要Rule.make,此處直接用DVSDK內建好的檔案,在
2012-08-10 13:00:42
900
原创 [開發記錄] BBxM 系統建立
記錄:#1 建立系統檔案 -使用TI的DVSDK建構基本的linux系統,一開始安裝DVSDK4.03版,安裝好後要先執行 ./setup.sh,設定一些相關環境,依照setup.sh的script所留下的訊息,直接進行make clean 以及make all,缺少相當多工具包,將會在中途報錯。在網路上查詢,找到angstrom的版本,須搭配TI的DVSDK4.01版本,
2012-08-10 11:57:23
541
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人