3秒就能複製聲音!阿里通義升級百聆語音模型 支援9語言18方言

阿里巴巴旗下「通義」團隊近日宣布,旗下「百聆」語音模型推出全新版本並正式開源。官方表示,新模型僅需約 3 秒的語音樣本,即可進行跨語言、跨方言的音色複製與語音生成,支援 9 種語言與 18 種中文方言,同時可控制情緒語氣,應用場景涵蓋語音助理、直播配音與無障礙服務等。 《詳全文...》

阿里巴巴旗下「通義」團隊近日宣布,旗下「百聆」語音模型推出全新版本並正式開源。官方表示,新模型僅需約 3 秒的語音樣本,即可進行跨語言、跨方言的音色複製與語音生成,支援 9 種語言與 18 種中文方言,同時可控制情緒語氣,應用場景涵蓋語音助理、直播配音與無障礙服務等。 《詳全文...》