Page 18 - 何晓冬:智能交互时代服务业数字化的实践与思考
P. 18
服务业数字化新场景 :数字人多模态交互(语音、情绪、视觉形象等)
通过3D图形学建模和音素识别技术,塑造可以实时播报的虚拟主播,让语音生“动”起来
数字人技术
形象风格定制 语音个性定制 口唇/情绪驱动
需要客户提供真人照片以及播 高自然度、有感情、个性化的语 形象和语音植入引擎,通过引擎
报视频,进行针对性训练 音合成服务,支持中英文双语 实现口型和表情的实时驱动匹配
在青海发展投资贸易洽谈会(青洽会)上通过AI 虚拟主播,将创新性的实现展会动态、新闻咨询报道主持、
云展馆等场景的全新表达和呈现,通过化身本次大会及展馆的三个虚拟主播形象“小青”、“小海”、“小云”,为
参会用户在线上提供丰富的大会动态资讯、云展馆综合内容报道等服务,让参会用户感受到有温度、更生动
的云上青洽会服务体验。该技术通过京东TTS语音驱动虚拟形象说话及反馈情绪和动作,将深度学习神经网络
和计算机图形学结合,可以理解语音的内容同时精细化驱动虚拟形象的口唇动作、面部表情、肢体姿态,生
成极具逼真感的虚拟形象动画。新闻编辑报道人员仅需输入文字内容,插入图片等素材,即可快速生成具备
同步口型、丰富面部表情及模型动作的AI虚拟主播视频。