發(fā)布成功
開發(fā)一款實(shí)時將音頻轉(zhuǎn)換為文字的程序,并進(jìn)行文本無關(guān)模式的說話人辨認(rèn)。該設(shè)備為基礎(chǔ)設(shè)備,可外接音頻輸入或麥克風(fēng)設(shè)備。
1、離線聲紋識別模塊,采用文本無關(guān)模式進(jìn)行特定人的聲紋學(xué)習(xí),并將聲
紋進(jìn)行編號,在之后音頻轉(zhuǎn)文字采集時,如果聲紋庫中存在此聲音的所有人,則將特定人的音頻內(nèi)容標(biāo)記為特定人。
a、聲紋學(xué)習(xí)要多少秒?
b、聲紋識別要多少秒?
實(shí)施細(xì)節(jié):
將聲紋存儲于SD卡內(nèi),并采用SQLite數(shù)據(jù)庫建立聲紋與特定人的關(guān)聯(lián)關(guān)系。
2、將實(shí)時語音實(shí)時轉(zhuǎn)為文字。
a、采用實(shí)時語音識別(也可采用阿里云等實(shí)時識別SDK)
b、將語音與存儲的所有聲紋對比后如果有匹配的聲紋,則將語音與聲紋建立關(guān)聯(lián)。
如:{386}語音正文內(nèi)容 386既為聲紋id
實(shí)施細(xì)節(jié):
將實(shí)時音頻轉(zhuǎn)文字后存儲于SD卡內(nèi)的SQLite數(shù)據(jù)庫中。
1、我愛方案網(wǎng)是會員制服務(wù),服務(wù)商通過競標(biāo)后即可聯(lián)系雇主;
2、項(xiàng)目預(yù)算與報(bào)價不代表最終成交價格,成交價以雙方協(xié)商為準(zhǔn);
3、平臺提供設(shè)計(jì)項(xiàng)目對接服務(wù),希望促成高效合作,對交易雙方不收取傭金,謝謝留意!