近年来,机器学习(Machine Learning, ML)在蛋白科学领域的影响力迅速扩大。从 AlphaFold 带来的结构预测革命,到各类序列生成模型用于蛋白设计,算法正在以前所未有的速度探索蛋白序列空间。 然而,一个现实问题始终存在:算法只能“提出假设”,而蛋白功能的优劣,仍然必须由实验数据来验证。 尤其是在酶工程和功能蛋白优化中,ML 模型对训练数据提出了更高要求——不仅要多,还要真实反映蛋白功能差异。传统依赖细胞表达、纯化和动力学表征的流程,往往周期长、通量有限,很容易成为 ML 迭代的瓶颈。 在这一背景下,Thornton 等人在 ACS Synthetic Biology 发表的这项研究,给出了一个极具代表性的解决思路:
2026-03-06