微软自定义神经语音技术已允许用户创建高度逼真、类似于人类的声音_科技_网络

微软自定义神经语音技术已允许用户创建高度逼真、类似于人类的声音

发布日期：2021-03-04 19:31:10

导读

3月4日消息据微软官方发布，近期，Azure 认知服务中的语音服务的一部分自定义神经语音 (Custom Neural Voice)文本到语音功能已普遍推出。该功能将允许用户使用微软开创性的神经文本到语音模型，为应用创建高度逼真、类似人类的自定义语音。由于创建的语音非常逼真，微软限制了访问权限，以便用户负责任地使用这项技术。微

3月4日消息据微软官方发布，近期，Azure 认知服务中的语音服务的一部分——自定义神经语音 (Custom Neural Voice)——文本到语音功能已普遍推出。该功能将允许用户使用微软开创性的神经文本到语音模型，为应用创建高度逼真、类似人类的自定义语音。由于创建的语音非常逼真，微软限制了访问权限，以便用户负责任地使用这项技术。

微软表示，

“作为微软对负责任的人工智能承诺的一部分，我们设计和发布自定义神经语音的目的是保护个人和社会的权利，促进透明的人机交互，抵制有害的深层伪装和误导性内容的扩散。为此，我们对自定义神经语音的访问和使用进行了限制。”

要创建自定义语音，你只需录制音频并上传作为训练数据即可。Azure 语音服务将为你的录音创建一个独特的语音调整。自定义神经语音的声音逼真自然，可以代表品牌，让用户以自然的方式与应用进行对话互动。

微软强调，以下客户已经在使用这项最新的 TTS 功能。

AT&T / 华纳兄弟：他们最近在德克萨斯州达拉斯的 AT&T 体验店推出了一个首创的创意和互动体验，客户可以直接与兔八哥对话。 Progressive：利用标志性的 Progressive 保险发言人 Flo 的声音，创建了 Flo 聊天机器人，以简化客户咨询流程，提供个性化体验。 Duolingo：为了让学习一门新的语言感到可实现性和适用性，Duolingo 使用课程创建了多样化的风格化声音。

(文/小编)

• 亚马逊宣布完成35亿美元收购One Medical的交易	• 荣耀Magic5系列发布倒计时 “青海湖技术”悬念
• 《2022新消费品牌独角兽TOP30》、《2022新消费	• 红、黄灯政策让2023年消费创业和投资加速洗牌
• 微软新版必应放宽将上限调至100次	• 爱立信宣布今明两年将在全球范围内裁员8500人，
• 荣耀Magic5系列发布倒计时 “青海湖技术”悬念	• 亚马逊宣布完成35亿美元收购One Medical的交易
• 魅族20系列外观意外曝光采用居中开孔直屏	• 塔塔汽车拟出售部分电动车业务股权筹集10亿美元

台积电被曝大砍供应链	ASML拒绝美要求禁止对
美共和党就芯片问题警	iOS 16正式版将于9月1