首页 > 车圈原创 > 车圈原创 > 人形机器人实现多语言逼真唇形动作

人形机器人实现多语言逼真唇形动作

发布时间:2026-01-21 17:33:47来源: 13041198719

美国哥伦比亚大学科学家设计出一种新型框架,使人形机器人面部能够根据音频生成逼真的唇部动作,实现与人类语音的同步。该技术还展示了较强的泛化能力,可推广至包括法语、汉语和阿拉伯语在内的多种语言,即使这些语言并未出现在训练数据中。研究团队在发表于最新一期《科学·机器人学》上的论文中指出,这一进展是朝着构建不仅能执行功能,还能进行人性化交流的机器人迈出的重要一步。

在对话中,如果机器人的唇部动作与声音不匹配,会显得呆板且不自然。然而,现有机器人普遍缺乏执行精细口部动作的灵活性,能实时将语音转化为自然唇部运动指令的技术也寥寥无几。

研究团队在2024年曾发表研究,描述了一种人形机器人面部可以预测人类的微笑并同时再现该表情。在此基础上,为更加精细化唇部与声音的匹配,团队设计了一套学习流程:首先采集机器人唇部运动的视觉数据,用于训练模型并生成运动参考点;随后通过一个名为“面部动作转换器”的模块产生运动指令,使机器人的唇部能够流畅配合不同词语。他们还专门研制了一种人形机器人面部结构,采用柔软硅胶皮肤,配合磁性连接器,具备10个自由度,可驱动复杂的唇部运动。其唇部结构能形成覆盖24个辅音和16个元音的各种口型。

在验证过程中,团队借助ChatGPT生成测试语句,并合成了具有理想唇部动作的视频作为对比基准。结果表明,该方法在5种比较方案中表现最优,其生成的唇部动作与理想视频差异最小。此外,该框架还能为11种不同语音结构的非英语语言生成自然的唇部同步效果。

研究团队推测,这类人形机器人在教育、老年护理等领域具有应用潜力。但他们也强调,未来的设计工作需格外谨慎,以防止技术被滥用。(科技日报记者 张梦然)

总编辑圈点

现在,AI让虚拟人物动嘴说话已经“不在话下”,然而让机器人做到这点还相当困难。大多数机器人“说话”时并不动嘴,即使动嘴,也只是象征性一张一合。这次,科研人员试图让机器人拥有人类一般细腻、精准的唇部动作,教它们通过合成视频以“照镜子”的方式学习;还开发了硅胶皮肤,设计了面部机械系统。结果表明,机器人可以“学会”多种语言的唇部动作。不过,研究也不禁让人思考,当机器人真的开口说话,“恐怖谷效应”是会加重还是减轻?

 

车圈原创更多>>

欧盟委员会正式公布《工业加速法案》(IAA),以“提升低碳转型竞争力”为名,推出严格的战略产业本地含量要求 沃尔沃汽车12月至2月销量下滑10% 在鸿蒙智行技术焕新发布会上,华为产品负责人宣布问界M9全系累计交付量突破28万台 华为乾崑发布最高896线激光雷达,将首搭尊界S800与问界M9 宝马工厂人形机器人,电爪来自中国 奇瑞汽车正式发布瑞虎7L官方图片,新车定位紧凑型SUV,将于2026年一季度正式上市 奔驰GLC终端让利大幅加码,多地经销商报出最高优惠12.5万元,入门版裸车价下探至27万出头 iCAR V27完整配置正式曝光,凭借越级智能与硬核实力,迅速成为硬派方盒子SUV市场焦点 OPPO Find N6真机现身,折痕控制很不错! IDC:智能手机市场恐将因存储芯片供应短缺而下滑13% 魅族确认放弃手机业务:后续聚焦AI驱动软件产品 OPPO Find N6确认配备AI手写笔,其搭载行业首发AI功能! 蓝厂最强旗舰来了!vivo X300 Ultra官宣:全大底三主摄加持 影像灭霸 博通发布多维堆叠芯片平台 高管扬言今明两年能卖出100万颗 百度2.0:一场由AI驱动的核心价值重构 京东APP正式上线「百亿超市」,剑指即时零售 2026年印尼汽车购置激励政策尚未明确,消费者延后购车,政府拟将资金转向国产车开发 3M凭借其材料科学领域的创新技术,正为汽车行业提供更加安全、环保与高效的解决方案 格兰海芬嘉定基地扩产增能项目签约,预计2026年实现产值约4.7亿 新合作!泉州市与宁德时代合作共建智能零碳电池工厂 上海2026汽车以旧换新政策落地,最高补贴2万元 流媒体后视镜风口正劲,华阳前装配套量同比激增近400% 单张不到五毛钱!谷歌深夜发布Nano Banana 2,没有颠覆性,但量大管饱! AI智能体不是越多越强:信息冗余构成了LLM Agent Scaling的瓶颈 特斯拉官宣进军摩洛哥市场,向这个北非国家推出Model 3和Model Y两款车型 保时捷992代911 GT3 RS首台车在越南正式上路 苹果硬抗内存飙升压力!iPhone 18 Pro/Pro Max起售价不变 2025年全球手机存量报告:苹果、三星破10亿断层领先 小米第三 iPhone 17 Pro Max续航测试:WiFi比5G多约3小时使用时长 三星官宣2月26日举办Galaxy Unpacked发布会