OpenAI首次展示音频模型Voice Engine，15秒即可复制原音

949次阅读 | 发布于7月以前

3月30日凌晨，OpenAI在官网首次展示了全新自定义音频模型“Voice Engine”。用户只需要提供15秒左右的参考声音，通过Voice Engine就能生成几乎和原音一模一样的全新音频，在清晰度、语音连贯、音色、自然度等方面比市面上多数产品都强很多。

除了能合成音频之外，OpenAI还展示了Voice Engine很多其他商业用途，例如，一位失去声音表达能力的女孩，在Voice Engine帮助下能像以前一样正常发音说话。