当前位置：首页 > 创业科技 > 正文

微软公布 Text To Speech Avatar AI 工具：可 *** 虚拟 3D 数字人、基于 Azure 平台

创业科技
2023-12-09
6
更新：2023-12-09 14:08:25

微软表示，用户使用 Azure AI Speech text to speech (TTS) avatar，可以建立基于“输入文字说出内容”的虚拟化身，并结合现实人物照片训练，建立以真实人物为基础的“互动式聊天机器人”，可用于企业的营销、业务或客户服务等场景。

IT之家11 月 16 日消息，微软在 Ignite 大会中，为 Azure AI Speech 推出了一项名为“Azure AI Speech text to speech (TTS) avatar”的 AI 工具，号称可以生成人类逼真虚拟化身（数字人），目前这款工具已经开放给大众预览试用。

据悉，这项 Azure AI Speech text to speech (TTS) avatar 主要包含三个模块，分别是文字分析器、TTS 声音合成器及 TTS 虚拟化身合成器：

文字分析器会先分析用户输入的文字内容，产生音素序列（phoneme sequence）。接着 TTS 声音合成器中的 TTS 语音模型会预测用户输入文字的声学特征，再合成声音。最后，由神经 *** 声音合成模型 Avatar，根据上述声学特征预测人物的唇形影像，最终形成虚拟化身影像。

微软解释，传统虚拟化身 *** 费时耗工，需要建立专用拍摄环境、而拍摄剪辑后期过程也相当花成本。而当下运用微软最新的 Azure AI Speech text to speech (TTS) avatar 服务，在初次建立模型后，用户只要输入文字就可以 *** 各种产品介绍、互动视频等。配合微软 Azure OpenAI Service 及神经 *** TTS 功能，还能呈现更自然的互动体验。