高考與中考同源的智能語音評測技術(shù),支持發(fā)音評分與發(fā)音錯(cuò)誤反饋,適用于口語教學(xué)、發(fā)音練習(xí)和人機(jī)口語測試。
發(fā)音評分用于評估 單個(gè)音素的準(zhǔn)確性,以及它們在單詞和句子中的發(fā)音質(zhì)量。
我們提供 全面的發(fā)音評測,涵蓋多個(gè)層級的評分,包括:
我們的 深度神經(jīng)網(wǎng)絡(luò)模型 基于 數(shù)千小時(shí)的母語者標(biāo)準(zhǔn)音頻 進(jìn)行訓(xùn)練。系統(tǒng)采用 10 毫秒幀分析 用戶音頻,提取 語音時(shí)長信息,并計(jì)算每個(gè)音素的 聲學(xué)相似度評分。
評分計(jì)算方式如下:
這種自下而上的精準(zhǔn)分析確保了高效、準(zhǔn)確的口語評測體驗(yàn)。
該標(biāo)準(zhǔn)適用于發(fā)音、流利度、完整度及整體評分,教育產(chǎn)品可根據(jù)目標(biāo)學(xué)習(xí)者調(diào)整閾值以優(yōu)化訓(xùn)練效果。
我們的API提供 5 種題型,覆蓋全場景語言訓(xùn)練:
不同類型的 API 對音頻長度和推薦文本長度有不同要求:
| API | 最大音頻長度 | 推薦文本長度 |
|---|---|---|
| 單詞級別 | 20 秒 | 單個(gè)單詞或字符 |
| 句子級別 | 90 秒 | 200 詞以內(nèi) |
| 段落級別 | 180 秒 | 200 詞以上 |
| 雅思口語評測 | 120 秒 | 無推薦限制 |
| 自由對話評測 | 290 秒 | 無推薦限制 |
聲通發(fā)音和口語評測 API 兼容多種常見音頻格式,以確保廣泛適配性。支持的格式包括:
建議使用高質(zhì)量音頻格式,以獲得更精準(zhǔn)的評測結(jié)果。
為了確保最佳的評測準(zhǔn)確性和文件大小,建議使用以下音頻參數(shù):
| 音頻屬性 | 推薦設(shè)置 |
|---|---|
| 采樣位深 | 16-bit |
| 采樣率 | 16000 Hz |
| 聲道 | 1(單聲道) |
| 比特率 | ≥ 96 kbps |
采用以上推薦設(shè)置可以有效優(yōu)化音頻文件的大小,同時(shí)提升評測系統(tǒng)的表現(xiàn)。
蘇州聲通信息科技有限公司
地址: 蘇州市工業(yè)園區(qū)騰飛創(chuàng)新園A2塔樓-1115
公司電話:0512-66356882
客服熱線:400-688-0573