5月28日,中国农业科学院作物科学研究所联合国内多家科研单位,构建了用于水稻基因组选择的大规模中国栽培稻群体数据集,提出了配套的全基因组预测深度学习模型DeepCCR,为育种者快速、高效地培育优良品种提供了有利工具。相关研究成果在线发表在《植物生物技术杂志(Plant Biotechnology Journal)》上。
基因组选择能够利用训练群体构建的育种模型,实现对育种材料的表型预测,可大幅度缩短育种周期,且减少育种投入。但由于构建训练群体的投入较高,一定程度上制约了基因组选择技术的应用和推广。
研究团队连续两年在我国六个稻作区的七个代表性生态鉴定点对4015份水稻品种(系)进行产量相关性状的表型考察,形成了第一个具有广泛遗传代表性的中国栽培稻群体数据集。随后,研究团队以该数据集为基础构建了一种基于卷积神经网络与双向长短期记忆相结合的深度学习方法DeepCCR,用于预测不同种植地点的表型值,并帮助育种家评估特定材料的最适合种植地点。同时,为了便于育种者使用该模型,研究团队建立了网络在线服务(www.ai-breeder.com),用户只需提交标准的 FASTQ 或 VCF 文件,系统就会自动提供10 个产量相关性状在不同地点的预测结果,该研究为我国水稻高效育种提供了一个有效的数据利用、分析和共享平台。
作科所副研究员马小定、博士生王浩和北京博凯森生物科技有限公司吴盛阳为本文共同第一作者,作科所韩龙植研究员、闫燊助理研究员和安徽省农科院水稻研究所周坤能研究员为论文的共同通讯作者。该研究得到了国家重点研发计划、科技创新2030-重大项目和中国农业科学院科技创新工程项目的资助。
原文链接:https://onlinelibrary.wiley.com/doi/10.1111/pbi.14384
日期:2024-06-04