A8号

百度李士岩:数字人3.0将具有千人千面的互动能力

糜静云238

1月14日下午,百度技术沙龙“AI,我去!在第四场活动现场,百度AI Cloud AI人机交互实验室负责人李时言指出,在虚拟数字人产业格局中,为数字人生产提供建模、渲染、动态捕捉等服务的基础设施服务商已经形成稳定格局,多由海外巨头掌控,但在工具和应用层,中国企业已经开始崭露头角。

目前,数字人已经经历了以“纸人”为代表的1.0阶段,以Vtuber主播为代表的2.0时代已经进化到了3.0阶段。具有高精度模型和人工智能驱动功能的数字人3.0已经成为行业主流。在李时言看来,AI参与了第三代数字人的建模和内容生产,使得数字人的生产更加高效和智能,可以面对更多的应用场景和全组用户,可以通过视频、直播、chatbot等载体进行承载,具备千人互动能力。

在李时言看来,数字产业有三大核心驱动力。火箭的第一层是用户需求和技术升级,第二层是政策支持和资本涌入,第三层是计算平台的迭代。“数字人的每一次发展,本质上都是技术驱动的。用户从图形图像、音频视频中获取信息和交互,转变为实时3D交互反馈的需求,这将成为数字人长期发展的根本动能,也将在未来创造大量需求。”李时言说。

尽管数字人产业具有强大的驱动力,但李时言认为,国内数字人大规模落地仍存在三大问题。

首先,数字人产业链的各个节点相对碎片化,无法高效协同,导致数字人的生产和优化壁垒较高。目前行业内大多数公司只是数字人生产经营全过程中的一个环节或几个环节。其次,服务场景和演艺场景之间没有有效的联系,说明演艺数字人不具备客户所要求的业务能力,而服务数字人缺人,难以与用户进行情感沟通。最后,满足高移动性和高频率要求的成本仍然很高,这最终是数字人的生产力。

面对当下数字人生产的高门槛,2021年12月,百度CTO王海峰在百度创造大会上正式发布“百度AI云西陵数字人平台”,打造集数字生活生产、内容创造、业务配置服务于一体的平台级产品。目前产品具备标准平台的快速交付能力,帮助不同领域的客户快速实现敏捷需求,降低成本,提高效率。

据李时言介绍,百度的数字人平台西岭具有全场景、一站式、平台化的特点,从数字人形象的初始定制、个人管理、业务编排、内容创作,都可以支持多种驱动模式下与用户交互的所有需求,这也意味着数字人的全链路调音可以在一个平台上实现,从而达到最佳效果。

早在2019年,百度就启动了“虚拟数字人战略”。基于AI技术多年的沉淀,AI能力已经成为百度AI Cloud西岭平台的核心能力,现在百度也在对外开放这一能力。李时言说,“我们这两年的目标是通过百度AI云西岭平台的开放,让大家实现数字自由。”(蒙文)

您可能还会对下面的文章感兴趣: