数字虚拟人技术的商业应用场景 关于虚拟人的商用,大众首先会联想到虚拟偶像、虚拟演员等影视、游戏产业的应用,但金融服务、教育、医疗等落地场景也是未来的重要发展方向。虚拟数字人的诞生,看似充满噱头,其实隐含着未来科技、人机互动的发展方向。数字人的出现,只是产业智能化潮流的一个缩影,一个起始符号,随着产业转型升级的脚步逐渐加速,必然会有越来越多的数字人、虚拟人、智能人将出现在各行各业。 AI时代,智能机器人作为AI的伴生品得到了快速的发展。AI永远是服务于人类的,未来也将是人类的工具,并不会取代人类。“AI虚拟数字人存在的意义,更多的是人类生活服务的补充,或者弥补过去的某些缺憾。”AI虚拟数字人能够有效助力金融机构实现“降本增效”,各大金融巨头争相布局“数字员工”。临平呼叫中心AI虚拟数字人市场

虚拟数字人系统一般情况下由人物形象、语音生成、动画生成、音视频合成显示、交互等5个模块构成。交互模块为扩展项,根据其有无,可将数字人分为交互型数字人和非交互型数字人。首先看一下非交互型数字人:系统依据目标文本生成对应的人物语音及动画,并合成音视频呈现给用户。交互型数字人根据驱动方式的不同可分为智能驱动型和真人驱动型。智能驱动型数字人:通过智能系统自动读取并解析识别外界输入信息,根据解析结果决策数字人后续的输出文本,驱动人物模型生成相应的语音与动作来使数字人跟用户互动。这种人物模型是预先通过AI技术训练得到,可通过文本驱动生成语音和对应动画,业内将此模型称为TTSA(Text To Speech & Animation)人物模型。真人驱动型数字人:真人根据视频监控系统传来的用户视频,与用户实时语音,同时通过动作捕捉采集系统将真人的表情、动作呈现在虚拟数字人形象上,从而与用户进行交互。临平呼叫中心AI虚拟数字人市场“数字人”是一种新趋势,与照片写实技术的突破密切相关。

AI虚拟数字人构建:计算驱动的虚拟人构建是通过深度学习模型生成表情、身体、动作、语音等,一般需要经过以下的步骤:内容制作。基于语音合成技术TTS,将文本生成为语音,基于语音,利用驱动模型以及利用生成对抗模型GAN输出数字人的每帧图片,通过时间戳,将语音和数字人图像结合。渲染,生成成果形象。另外,针对特定应用场景,需要知识做支撑的,需要进行对话的,还需要加入语音识别,知识图谱等。AI虚拟数字人作为元宇宙中的交互实体,有非常大的潜力,在现阶段,虚拟数字人更多的是在现有的业务,比如传媒、直播、金融等领域有诸多应用。起到服务、身份代替等功能。
从是否具备双向交流能力来看,AI虚拟数字人可分为交互型和非交互型。交互型就是具备类似于人的沟通和互动能力,能实时与人双向交流,可以用在客户服务,教育培训,营销导购等互动式场景。非交互型主要是指按照事先设定好的内容和情境单向输出内容,比如AI虚拟数字人主播,或者电影和游戏中的AI虚拟数字人。AI虚拟数字人的呈现形式可分为真人形象, 仿真,和卡通类型。真人形象目前是2D为主,能做到对人的形象像素级还原,3D真人要做到实时驱动唇形,动作,表情,目前技术上可行度不高,而仿真和卡通类型可以做到3D。数字人在交互真实性方面,完善虚拟“数字人”的形象展示与声音播报,提供更真实、更自然的交互体验。

AI虚拟数字人支持口唇情绪驱动,深度匹配,实现动作、表情、语音、内容感知的深度匹配,基于嘴型数据库的发音声学,支持口型、表情、动作同步的全维度编排能力。可根据语音内容实时预测唇形变化,实现语音唇形同步,驱动虚拟形象自如动作,充分满足不同网络环境下的人机交互场景,轻松提升交互体验。技术驱动,强智能交互,多模态智能化交互,支持人机耦合与人机协作,多相阵拾音与噪音消除。AI虚拟数字人具备自动感应功能,无须多次触摸交互界面等待响应,具备免唤醒和全双工音视频互动能力,超级强抗干扰能力,定向识别对话人,支持随时发问,随时打断,轻松智能,实时判断用户对话的接入和业务的办理,提高服务效率和客户留存率。简而言之,数字人就是逼真的3D人体模型。临平呼叫中心AI虚拟数字人市场
AI虚拟数字人通过构建虚拟员工、虚拟主持人等角色,可以提供7*24小时的服务。临平呼叫中心AI虚拟数字人市场
当前虚拟数字人的理论和技术日趋成熟,应用范围也在不断扩大,虚拟数字人的产业链从可以分为基础层、平台层和应用层。基础层主要包括显示设备、光学器件、传感器、芯片、建模软件、渲染引擎等。平台层主要包括建模系统、动作捕捉系统、渲染平台、解决方案平台、AI能力平台等。应用层主要包括数字替身、虚拟主播、虚拟主持人、数字角色、数字员工、虚拟导游虚拟讲解员等。AI虚拟数字人是依托ASR、TTS、NLP等技术,实现智能语音交互,支持多轮对话和插话功能,以丰富生动的展现形式创造科技感强、耳目一新的互动体验,赋能品牌科技化和智能化升级。适用于接待引导、新闻播报、IVR导航等场景。临平呼叫中心AI虚拟数字人市场
杭州音视贝科技有限公司专注于人工智能领域智能语音、智能图像、虚拟数字人等产品的研发,通过将人工智能技术与企业服务场景深度融合,助力企业智能化升级,帮助企业降本提效、升级用户体验、挖掘更多的营销价值,致力于为企业提供营销、服务、运营、管理一站式智能化解决方案。
公司坚持科学发展,将技术研发和人才培养作为公司的发展目标,团队成员来自于华为、阿里巴巴、蚂蚁金服、同盾科技、金蝶软件等企业,拥有多年人工智能与企业服务相关产品研发和商业化经验,专注于智能语音、语义理解、语义分析、语音网关等人工智能技术的研究与应用,在音视频互动领域有长期的技术积累能力和商业实践。
在此基础上结合ASR、NLP、TTS和人脸识别等技术,打造出了智能客服、智能外呼、智能质检、智能语音机器人、虚拟数字人、智能媒资等产品。团队拥有出色的商业化和项目交付能力,已成功积累了多个行业的成功案例,目前已服务于曹操专车、中移在线、赣南医学院等多家单位。
未来公司将会进一步探寻技术领域,提供更专业、更符合各行业发展方向的智能外呼、智能客服、智能语音网关、虚拟数字人等产品,提供SAAS及PAAS的应用服务,保持研发技术持续走在行业前沿,实现长足发展。