学术动态

农学院刘耀光/祝钦泷团队开发首个植物功能基因组学智能问答系统PlantGPT

来源单位及审核人:农学院 林轩东 编辑:安沛审核发布:曾子焉发布时间:2025-06-09

近日,农学院、未来作物精准育种基础研究卓越中心、亚热带农业生物资源保护与利用国家重点实验室和岭南现代农业科学与技术广东省实验室刘耀光院士/祝钦泷研究员团队联合清华大学在国际著名期刊Advanced Science(中科院一区TOP期刊,影响因子16.3)在线发表了题为“PlantGPT: An Arabidopsis-based Intelligent Agent That Answers Questions About Plant Functional Genomics”的研究论文,并被选为Editor's Choice与Frontispiece(扉页论文)高亮推荐。该工作开发了一个以拟南芥为基础的植物功能基因组学专家问答系统PlantGPT,通过融合检索增强生成(RAG)技术和大语言模型(LLM)微调方法,实现了对植物功能基因组学专业问题的精准回答与分析,为植物科学研究领域提供了全新的人工智能辅助工具。


面对全球粮食安全和作物品质提升的挑战,功能基因组学研究在增加作物产量、改善营养品质、提高抗病虫性和逆境适应性等方面发挥了关键作用。然而,现有的计算生物学手段在解析复杂生物系统调控机制及整合多组学数据方面仍存在瓶颈。同时,传统植物数据库如TAIR(The Arabidopsis Information Resource)尽管包含丰富数据资源,但因交互方式局限,常常要求用户掌握精确的性状或基因命名才能有效检索信息。

该研究通过结合检索增强生成(RAG)技术和大语言模型(LLM)微调,建立了包含超过60,000篇植物研究文章摘要的向量数据库,使用13,993个拟南芥表型和23,323个基因功能数据构建了101,000个问答对进行模型优化。相比传统的计算生物学方法,PlantGPT能够准确回答植物功能基因组学领域的专业问题,并成功克服了大语言模型在专业领域应用中的“幻觉”问题。

AI驱动的植物功能基因组学研究

基于以上,研究团队成功开发了PlantGPT——首个专门用于植物功能基因组学研究的大语言模型AI助手。该系统基于拟南芥专业知识和文献构建,具备强大的生物知识泛化框架,能够在三个关键层面发挥重要作用:为公众提供农业知识普及,帮助早期研究者快速适应植物基因组学领域,以及支持资深研究人员进行战略决策。凭借其开源性、易迁移性和持续更新特性,PlantGPT不仅显著提升了植物科学领域的研究效率和知识传播效果,还为研究人员创建垂直领域专业Agent提供了有力支撑,标志着人工智能在植物功能基因组学研究中的重要突破。PlantGPT目前通过提供免费在线服务,未来计划扩展至合成生物学及更多作物物种的应用。

华南农业大学博士生张瑞祥、清华大学博士生王昱和博士生杨威杨为该论文共同第一作者,祝钦泷研究员、刘耀光院士和清华大学自动化系谷淼博士为共同通讯作者。该研究得到了国家自然科学基金、生物育种-国家科技重大专项、广东省未来作物精准育种基础研究卓越中心重大项目和广东省种业振兴项目的资助。


  相关论文链接:http://doi.org/10.1002/advs.202503926

           http://www.plantgpt.icu



文图/农学院

上一篇:下一篇: