图片来源Engadget
科学研究领域中,追求真理经常意味着穿着白大褂在实验室做实验,其中免不了做一些失败的试验。没关系,因为失败的试验有时候也能带来很多新发现。现在,哈佛大学正努力帮助科学家加速试验研究的速度,通过一个可以预测化学反应成功率的机器学习算法,算法成功率超过了人类科学家。
算法分析了失败实验的数据。通常,这些数据呆在实验室的电脑里,只有做原始实验的科学家才会接触到这些数据。哈佛大学采取了另一种方法,将几千个成功和失败的数据数字化,创造了一个开放的巨大数据库。化学副教授Joshua Schrier将每个实验的特性分解,研究员化学副教授Alexander Norquist研究出了机器学习算法。
如《自然》杂志解释道,团队专注在结晶反应,这种反应需要将一组试剂在溶剂中混合并加热。具体来说,这需要一种叫做钒亚硒酸盐的材料,是铝、硒和氧气形成的化合物。研究员通过看笔记,基于多年的科研经验预测了新的反应结果。但是算法可以看得更加深入,发现数据背后人类科学家没有看出来的模式。
在大约500个案例中,算法可以以89%的比例生成结晶。而研究员只有78%的成功率。“用机器学习模型,不带任何偏见地来审视这些没有利用起来的数据,可以带来无价的预测帮助科学家。”哈佛化学及生物化学教授Alan Aspuru-Guzik说。“尤其是数据中可以产生有实质意义的关联和预测,这能加速新材料的研究发现。”
这样的思路还可能改变科学新发现的报导方式。目前,研究员经常只针对能够成功产生化合物的材料和过程发表论文,而各种失败的数据则被忽略,埋没在实验室的电脑硬盘里。“很可能在实验开发和情景优化的过程中,为了一次成功反应需要做一百次反应。”Norquist解释道,“我将这些失败的反应看做冰山在水面以下的部分——我们所见到的科研结果,只是冰山一角。”
团队的数据库科研在Dark Reaction Project项目网站(http://darkreactions.haverford.edu/)上获得。团队希望,其他科学家科研可以来分享他们的失败案例,从而不断提升数据库,以及机器学习的预测能力。
Via Engadget