游戏NPC不再是站桩工具人,AI凭对话内容生成3D动作,比真人更像( 二 )
文章图片
语音驱动动作合成在离线建立动作库之后 , 就可以输入任意一段语音和对应的文本进行在线合成 。
在对语音和文本进行算法自动切分后 , 利用训练后的StyleGestures这一概率生成式的神经网络模型 , 生成期望的动作 。

文章图片
其中 , 上半身的动作最为重要 , 研究人员利用动态规划算法 , 从构建的动作图中搜索动作节奏和动作风格嵌入匹配误差最小的动作序列 , 同时保证前后动作的过渡代价小、过渡自然 , 最后输出一个节奏匹配的上半身动作序列 。
下半身动作的合成则不用考虑节奏 , 只考虑下半身动作之间过渡的自然性即可 , 同样经过图优化得到一个下半身动作序列 。
最后 , 采用混合的方式融合上下半身动作 , 就得到了和语音文本匹配的全身动作序列 。
与其他参赛系统相比 , 网易的新方法在在人类相似性评估中取得了最高的中位数分数 , 甚至超越了真实人类水平 。
在适当性评价中 , 该方法在上半身表现中排名第一 , 在全身表现中排名第二 。

文章图片
研究团队研究团队来自网易互娱AILab , 作者共三人 。

文章图片
研究人员指出 , 这项新技术不仅可用于游戏中 , 虚拟角色线上演讲、数字人动作动画合成、元宇宙形象等等场景也都能使用 。
论文链接附在文末 , 感兴趣的小伙伴可以自取~
论文链接:
https://dl.acm.org/doi/pdf/10.1145/3536221.3558063—完—
量子位QbitAI·头条号签约
- RTX|RX 7900 XT部分游戏性能反超RTX 4090 N饭强烈不满:这次过于激动了
- 暴雪|暴雪中国:《魔兽世界》国服团队正与新伙伴洽谈 1月23日前封存游戏
- 平时休闲时刻|手把手教你如何录制游戏视频
- 小米科技|风向变了?iPhone14不再是“香饽饽”,国内手机市场迎来大洗牌
- 2500的能用来干什么?对于DIY装机用户来说可以装配出一台性能还算不错的电脑。|2500元最新游戏电脑主机配置推荐
- 搭载RTX显卡的游戏本陆陆续续上架各大电商了|为什么rtx游戏本依然受人欢迎?
- 社交|用“游戏”思维为隐私“加密”
- GTX1080显卡自发布以来就很受游戏玩家的喜爱与追捧|gtx1080公版与gtx1080非公版哪个好
- 响应|响应时间仅0.03ms!LG推出首款240Hz OLED游戏显示器
- 效能出色的4K游戏显卡 撼迅Radeon RX 7900XT&7900XTX评测
