仅仅需要五秒钟就能复刻你的声音?
快来登录火山引擎官网在语音技术下的开放产品体验中心
体验火山引擎声音复刻2.0版本的惊艳效果吧!
火山引擎声音复刻2.0采用了全新自研语音算法MegaTTS,经专业评测,声音复刻2.0版本与真人录音复刻的平均相似度已高达97.5%,不但超过一半的评测人员认为复刻合成效果与真并无任何差异,而且在金融客服、视频配音、智能语音助手、虚拟数字人等相关场景均可适用!
五秒钟复刻:极速获取高品质AI专属音色
传统技术下,通常声音复刻往往需要用户录制20-100句话,并训练几分钟甚至几小时后才可就绪,这样的“复刻门槛”往往让人缺乏耐心且质量也不尽如人意。
对此,火山引擎音色复刻2.0版本则在全面提升效果品质的同时,还攻克了录制量级及训练时长这两大难关。
其核心算法MegaTTS只需要五秒钟的数据量,就能对各种风格、口音以及声学环境下的音色进行克隆。同时MegaTTS算法具有大模型特有的In-context-learning能力,无需对用户音色进行Fine-tuning就能实现复刻。区别于传统的音色复刻模型,MegaTTS可以免除训练时长,即时极速复刻。