OpenAI首次展示音频模型Voice Engine,15秒即可复制原音

949次阅读  |  发布于7月以前

3月30日凌晨,OpenAI在官网首次展示了全新自定义音频模型“Voice Engine”。用户只需要提供15秒左右的参考声音,通过Voice Engine就能生成几乎和原音一模一样的全新音频,在清晰度、语音连贯、音色、自然度等方面比市面上多数产品都强很多。

除了能合成音频之外,OpenAI还展示了Voice Engine很多其他商业用途,例如,一位失去声音表达能力的女孩,在Voice Engine帮助下能像以前一样正常发音说话。

Copyright© 2013-2019

京ICP备2023019179号-2