Adv Sci | 李敏团队:AI 赋能蛋白质功能注释
蛋白质功能注释是理解生命活动、疾病机制和药物研发的核心。然而,随着测序技术的爆发,受限于高昂的实验成本,只有不到 0.1% 的已知序列得到了功能验证。近年来,人工智能(AI)的飞速发展为弥合这一“功能鸿沟”提供了强大动力。
近日,中南大学计算机学院李敏教授团队在国际期刊 Advanced Science 上发表了题为Artificial Intelligence Powers Protein Functional Annotation的综述论文。该文系统梳理了 AI 在基因本体(GO)和酶学委员会(EC)两大功能注释系统中的最新进展,深度剖析了建模范式,并为该领域的未来发展提供了方向。
面对日益复杂的算法模型,作者通过对数据模态和模型架构的深度剖析,将现有方法划分为“六大建模范式”的系统性框架,为理解 AI 在该领域的作用机理提供了统一视角:序列驱动范式 (Sequence-based)、结构驱动范式 (Structure-based)、网络驱动范式 (Network-based)、本体驱动范式 (Ontology-based)、多模态融合范式 (Multimodal integration)、大语言模型范式 (LLM-based)。在此基础上,文章针对GO和EC这两个互补的功能注释体系进行了全方位的介绍与比较:从代表性算法的演进到针对不同应用场景(如长尾分布、跨物种预测)的性能评估;从评价指标的选取到应对特定挑战的策略对比。这种全景式的评述不仅帮助研究者快速锁定合适的工具,更深刻揭示了不同注释任务背后的技术难点。最后,尽管AI已在蛋白质领域取得里程碑式成就,但依然面临诸多挑战。作者从三方面指出未来面临的机遇与发展趋势,包括“统一高效的生物数据表征建模”、“复杂生物环境建模”以及“领域专家大模型智能体 (LLM Agents) 开发”三个方向,旨在全方位、高精度以及自动化加速蛋白质未知功能探索过程。
1.功能注释示意图
2.未来挑战示意图
本文通讯作者为中南大学李敏教授,第一作者为中南大学王文康博士。
原文链接:https://advanced.onlinelibrary.wiley.com/doi/10.1002/advs.202524373
制版人:十一 来源:BioARt
最全1000+植物核基因组数据库IMP (点击图片直达)
高颜值免费 SCI 在线绘图(点击图片直达)
往期精品(点击图片直达文字对应教程)
LinuxPython
R绘图NGS基础GEO高级
生信自学生信书籍系列教程心得体会
转录组经典宏基因组蛋白质组单细胞系列测序发展史
免费在线画图色彩搭配图形排版图形解读
ChIP-seqTCGAGSEAWGCNA
海哥组学傻瓜系列文章写作
CytoscapeExcelPPT
机器学习
公众号投稿联系:陈同 (chentong_biology@163.com)
