導(dǎo)語:全世界有數(shù)千種語言,最具語言天賦的人也只能說數(shù)十種,普通人能夠?qū)W會兩三種語言已屬不易。然而,在科技日新月異的今天,具備自然語言對話能力的AI已經(jīng)能夠掌握上百種語言,擴展人類自身能力,為不同場景的跨境語言服務(wù)打開了更多可能性。
近期,微軟宣布Azure Neural TTS(神經(jīng)網(wǎng)絡(luò)版文本轉(zhuǎn)語音)新增160個聲音模型。更新后,微軟語音支持全球129個國家和地區(qū)的語言,提供334個聲音模型供用戶選擇。隨著Azure?認知服務(wù)功能從支持語音轉(zhuǎn)文本、OCR,擴展到對超百種語言的翻譯,Azure AI距離消除全球語言障礙的目標(biāo)又邁進了一大步。
圖:微軟Azure Neural TTS支持語言和聲音列表
同時,語言數(shù)量、聲音風(fēng)格的不斷增加,也讓Azure Neural TTS能更好地滿足企業(yè)跨區(qū)域、多語言業(yè)務(wù)發(fā)展的需求。無論是電話營銷、客服支持、導(dǎo)航播報、語音助手、游戲語音等業(yè)務(wù)場景,還是在旅游、教育、長音頻等更廣泛的行業(yè)領(lǐng)域中,企業(yè)利用這項服務(wù)即可將文本轉(zhuǎn)換成更多樣、極具本土特色且媲美人類的AI聲音。
Azure Neural TTS此次更新的64種語言和口音中,既有2億人使用的孟加拉語、1億人使用的波斯語、6000萬人使用的爪哇語等語言,也有少數(shù)人使用的語言,如高棉語、祖魯語、普什圖語、冰島語等。
微軟Azure認知服務(wù)不斷擴展自身能力,借助低資源TTS技術(shù),以領(lǐng)先于行業(yè)的速度持續(xù)擴展所支持的語言數(shù)量,對于缺乏平行語料的小語種也有更好的支持,并且還能用更少的數(shù)據(jù)訓(xùn)練出高質(zhì)量和多元化的語音模型,讓AI語音更加聲入人心。
點擊聲音示例,聲臨其境地感受新語言。
示例:am-ET Ameha?阿姆哈拉語 (埃塞俄比亞)
鏈接:https://tts.blob.core.windows.net/garhe/202110%20release/amET-Ameha.wav
示例:bn-BD Nabanita孟加拉語(孟加拉國)
鏈接:https://tts.blob.core.windows.net/garhe/202110%20release/bnBD-Nabanita.wav
示例:fa-IR Dilara波斯語(伊朗)
鏈接:https://tts.blob.core.windows.net/garhe/202110%20release/faIR-Dilara.wav
示例:km-KH Piseth高棉語(柬埔寨)
鏈接:https://tts.blob.core.windows.net/garhe/202110%20release/kmKH-Piseth.wav
示例:my-MM Nilar 緬甸語(緬甸)
鏈接:https://tts.blob.core.windows.net/garhe/202110%20release/myMM-Nilar.wav
示例:zu-ZA Themba 祖魯語(南非)
鏈接:https://tts.blob.core.windows.net/garhe/202110%20release/zuZA-Themba.wav
不同國家和地區(qū)的人們在說同一種語言時會產(chǎn)生不同的口音和使用習(xí)慣,有著不同的風(fēng)格。點此鏈接了解此次口音數(shù)量更新的更多信息。
點擊口音示例,感受更接地氣的英語口音。
示例:en-KE Asilia?肯尼亞口音英語?(肯尼亞)
鏈接:https://tts.blob.core.windows.net/garhe/202110%20release/enKE-Asilia.wav
示例:en-NG Abeo 尼日利亞口音英語(尼日利亞)
鏈接:https://tts.blob.core.windows.net/garhe/202110%20release/enNG-Abeo.wav
示例:en-TZ Imani 坦桑尼亞口音英語(坦桑尼亞)
鏈接:https://tts.blob.core.windows.net/garhe/202110%20release/enTZ-Imani.wav
活潑、甜美、深厚,更多聲音風(fēng)格任你選
在最新版本中,Azure發(fā)布了包括英語(英國)、法語(法國)和德語(德國)在內(nèi)的36個新聲音模型(預(yù)覽版),涵蓋多種音色和風(fēng)格,為不同場景帶來多樣化選擇。(注:這些聲音處于公開預(yù)覽階段,目前在美國東部、西歐和東南亞地區(qū)使用。)
點擊聲音風(fēng)格示例,感受豐富多彩的個性化聲音。
示例:en-GB Alfie?英國口音英語?–?英語
鏈接:http://tts.blob.core.windows.net/garhe/202201%20release/Voices%20expansion/Audios/en-GB-Alfie-demo-audio.wav
示例:en-GB Hollie 英國口音英語?–?英語
鏈接:http://tts.blob.core.windows.net/garhe/202201%20release/Voices%20expansion/Audios/en-GB-Hollie-demo-audio.wav
示例:en-GB Maisie 英國口音英語?–?英語
鏈接:http://tts.blob.core.windows.net/garhe/202201%20release/Voices%20expansion/Audios/en-GB-Maisie-demo-audio.wav
在XYZ-Code底層AI框架的支持下, Azure認知服務(wù)正在為更多人提供逼真、自然、接地氣的語音體驗。同時,微軟的所有技術(shù)進步都接受微軟負責(zé)任的AI流程的指導(dǎo),并遵循公平、包容、可靠性與安全性、透明、隱私與保障、負責(zé)的原則。
截止目前,Azure認知服務(wù)的文本轉(zhuǎn)語音模塊提供334個聲音,支持129個國家和地區(qū)的語言,可為全球用戶提供多樣化語言、語音服務(wù)。值得一提的是,Azure神經(jīng)網(wǎng)絡(luò)版聲音定制服務(wù)還可以讓企業(yè)以多種語言和風(fēng)格打造專屬的品牌聲音。
現(xiàn)在就通過Azure認知服務(wù)官網(wǎng)來體驗極具特色的文本轉(zhuǎn)語音服務(wù),或定制你的專屬聲音吧。???????
關(guān)鍵詞: