给我一个化学结构,我能预测它的气味

果壳网 2016-11-24

  (亚得里亚海上的猪/编译)光和声都可以预测,气味则不。

  如果你知道了一束光的波长,就能告诉我它在大多数人眼中是什么颜色:480纳米看起来是蓝色,650纳米则是红色。如果你知道了一个音符的频率,你就能说出那个音符:261赫兹是中央C。

  可是,当你看见了一种分子的化学结构,你却并不能知道它闻起来是什么气味——或者它究竟有没有气味。如果不是把鼻子凑到苯甲醛上,你就不会知道它闻起来像是杏仁。光是在书本上看到二甲基硫醚的化学式,你是无法预测它带有大海的气息的。

  苯甲醛和二甲基硫醚的化学结构。看到这两个结构,你丝毫联系不到“杏仁味”和“大海气息”。

  这是一个由来已久的问题。但是现在,一组科学家(外加上一群志愿者和公民科学家)已经离它的答案稍稍近了一步。通过一项众包竞赛,洛克菲勒大学的安德里亚斯•凯勒(Andreas Keller)和莱斯利•伏肖尔(Leslie Vosshall)联手IBM的帕布洛•迈耶(Pablo Meyer)开发了一种算法,能够从一种分子的结构推算出它的气味。

  这些虚拟鼻子还远谈不上完善,但是它们已经比前人的想象高明许多了。要想设计带有特殊气味的分子,这是破解气味的第一步——香水和香料产业也将从中获得巨利。

  人和机器联手,嗅到化学结构的气味

  “我想许多人都会说这是一个无法解决的问题,”伏肖尔说,“但是我们居然取得了进展,这一点真是出人意料。”

  不过她也说这个进展是相当艰难的,原因有两点。首先,我们很难知道一种分子的哪些部分造成了它的气味。我们知道光的波长决定了它的颜色,就这么简单。但是一种分子的气味可能取决于它包含的碳原子数目、它的稳定程度,以及它伸出的支链。其次,科学家在研究气味时,专注的都是与食物和香水产业有关的分子,这一点无可厚非,但这就好比是要理解颜色视觉而只研究红色,对蓝绿均无闻不问。“这是一个狭隘的领域,”伏肖尔说,“我们想要有所突破。”

  于是她和同事安德里亚斯•凯勒着手收集了范围更广的分子,达480种之多,其中包括那些不常见、不好闻,甚至没有气味的分子。她们接着将这些化学物质呈现给55名志愿者,那都是他们在Craigslist网站上招募的。志愿者进入实验室,来到一架架玻璃瓶子前面,逐个打开了闻味。他们先要判断瓶子里是否有任何气味,如果有,就再按照几个类别打分:它有多浓郁?有多好闻?多像大蒜味?多像鱼腥味?水果味呢?

  这项研究产生了有史以来最大的气味数据组,凯勒和伏肖尔把它们交给了IBM的迈耶。迈耶正在经营“梦想挑战赛”(DREAM Challenges),参赛者提出各自的机器学习算法,使机器能从大量数据中做出有用的预测。迈耶说:“我喜欢把这称作是‘科学的彩饰陶罐’——每个人都尝试用不同的算法来敲打同一个问题。”参赛者对付的问题五花八门,从改进乳房X射线检查的精度到预测人体对感冒病毒的反应。2015年1月到5月,有22支队伍对气味问题开展了研究。

  参与“嗅觉预测”挑战赛的队伍有22支,他们在5个月的时间里开发了各自的算法。

  最后是亚利桑那州立大学的理查•格尔金(Richard Gerkin)和密歇根大学的官远芳团队写出的算法取得优胜,它依据的是来自338种分子的数据,后来又添加了69种分子作为改进,最后在另外69种分子上做了测试。竞赛之后,团队公布了所有结果,以期创造更好的模型。

  超级鼻子刚刚起步

  以0到1的分数计算,获胜算法在预测一种分子的好闻程度时达到0.71分,浓烈程度达到0.78分,预测另外19种指标时得到了0.1到0.7分,这些指标包括大蒜味、鱼腥味、水果味、酸味、麝香味、腐臭味、汗味、甜味、青草味和烧焦味。团队成员写道:“我们几乎可以预测任何分子的知觉性质,并以此推测出一种分子的气息,我们的预测是相当精确的。”

  这些算法的得分似乎并不算高,但它们已经超越了之前的各项研究了。贝茨学院的杰森•卡斯特罗(Jason Castro)指出:“他们在相关性方面并没有多少突破,不过我自己也做过这方面的研究,我知道这样的结果已经很了不起了。”

  他还说,人类的鼻子同样是不完善的。“如果我给你一种化学物质,让你在周二闻一次,周三再闻一次,你两次的知觉就会发生变化。而这些算法和人类的固有变化已经很接近了。”除此之外,不同的个体之间也有差异。同样一种分子,你和我可能闻出不同的气味,这就是为什么梦想挑战赛中的算法在预测分子的平均气味时表现出色,而预测它们对于特定被试的气味时就不那么准确了。

  成功的虚拟鼻子有赖于志愿者的鼻子——他们需要在一排排玻璃瓶间闻味、打分。这份工作看似枯燥,但实际神秘又性感。图片来源:123rf.com.cn正版图片库

  按照伏肖尔的说法,这已经是一种进步,但“我们还没有解决问题”。目前还没有一个完善的理论能在一种分子的性质和它的气味之间建立对应。如前文所说,一种分子的气味可能取决于它的碳原子数目、它的稳定程度以及它的支链。算法隐约揭示了某些特征和某些性质之间的关系:硫原子使物体较易发出烧焦味或大蒜味,大分子较易发出好闻的气味,香草醛一类的分子闻起来较像烘焙食品。

  “我们还没能在特征甲和知觉性质乙之间找到严格的对应。”卡斯特罗说,“不同的分子,彼此可能会有许多差异。”

  机器学习也许有助于处理这种复杂性,因为机器识别重要特征的速度要远远超过任何人类,但前提是你有一组优秀的数据。而说到数据,即使是伏肖尔和凯勒的巨量数据也只是一个开端。他们现在想招募更多志愿者、测试范围更广的气味。他们还想让被试判断气味的相似性——如果给你一种分子,你觉得它闻起来和其他十种分子有多少相似?

  这意味着他们要招募许多志愿者,让他们一天天地伏在一架架玻璃瓶上闻味——这多少是一项吃力不讨好的任务,但奇怪的是,人们对它的兴趣却偏偏很大。在他们的第一项研究中,“那些志愿者都显得努力而专注,每个人都在实验中投入了20个小时,最后我们不得不把他们劝走”。伏肖尔说:“嗅觉研究有着一种非常诱人的魅力。气味使人联想到性爱、香水和食物。气味是很撩人的。”(编辑:odette)

  题图来源:123rf.com.cn正版图片库

责任编辑:lijia

科普中国APP 科普中国微信 科普中国微博
果壳网
是中国科协为深入推进科普信息化建设而塑造的全新品牌,旨在以科普内容建设为重点,充分依托现有的传播渠道和平台,使科普信息化建设与传统科普深度融合,以公众关注度作为项目精准评估的标准,提升国家科普公共服务水平。

猜你喜欢