这个系统可让电脑读懂你的所有肢体语言

腾讯数码 2017-07-11 作者：亦九

　　来自卡耐基梅隆大学机器人研究所（CMU RI）的科学家们，正在研发一款可以读懂肢体语言、甚至是手指动作的电脑系统。这一系统可以实时工作，还可以同时理解一群人的动作，可以让人类与机器的交流更自然。

　　现阶段，与电脑的交流多依赖于打字、鼠标点击和触控。尽管也有一些语音助手，但人类不是只通过语言交流。所有了解青少年犯罪的人都知道，人类交流时一半依赖于肢体语言，如果没有肢体语言，交流将十分困难且费力。

　　这一系统的关键在于让电脑识别人类的姿势。人类姿势有很多细节，甚至每根手指的位置不同都能传达不同的信息，交流对象可能忽略这些细节。尽管现在有讲解面部表情和身体位置的大型数据库，但还没有针对手势和姿势的数据。

　　卡耐基梅隆大学副教授Yaser Sheikh带领团队，结合多种方法解决这一问题。一种方法是为电脑提供更多数据，让两名研究生站在镜头前，摆出了上千种不同的姿势和手势。

　　第二种方法是颠覆电脑识别姿势的传统方法。过去电脑是先观察整个人，再一点点理解手势，新系统则让电脑先观察独立的手、胳膊、腿、脸，再把他们拼成一个人。团队发现，这种方法特别有利于识别一群人的肢体语言。

　　第三种方法是使用卡耐基梅隆大学的全景工作室（Panoptic Studio），这间工作室为两层圆顶状，内有500台摄像机。在这里工作，电脑可以瞬间从上百种不同角度观察姿势。

　　机器人研究所的博士生Hanbyul Joo认为，在全景工作室工作，一次就能从500种角度观察手部。通常情况下，手部太小，所以一般相机难以捕捉手动作的细微变化，但在实验中，研究人员使用了31台高清相机，建立数据库。

　　团队现在正在研究，如何让2D模型转换为3D，用来更好地识别动作。研究的最终目的，是通过这一系统，用一个摄头、一台电脑也能读懂一群人的肢体语言。

　　卡耐基梅隆大学的研究团队认为，如果这项技术足够成熟，将可应用于多个领域。比如，新系统可以让人与机器的交流更简单，可以让无人驾驶汽车判断行人是否要过马路，可以帮助诊断行为障碍，还可以追踪捕捉运动员的动作、理解他们的行为。

　　这项研究将于7月21日至26日在檀香山举办的2017计算机视觉与模式识别大会（2017 Computer Vision and Pattern Recognition Conference）上发表。

责任编辑：王超

科普中国APP 科普中国微信 科普中国微博

腾讯数码

是中国科协为深入推进科普信息化建设而塑造的全新品牌，旨在以科普内容建设为重点，充分依托现有的传播渠道和平台，使科普信息化建设与传统科普深度融合，以公众关注度作为项目精准评估的标准，提升国家科普公共服务水平。

最新文章