高原种质库解析“藏茵陈”核心基源植物祁连獐牙菜基因组

2026-01-23

祁连獐牙菜(Swertia przewalskii Pissjauk.)是龙胆科獐牙菜属多年生草本植物,为青藏高原特有物种主要分布于青海祁连县海拔3486米左右的高海拔生境,是藏药“藏茵陈”的核心原植物之一。其含龙胆苦苷、獐牙菜苷、番木鳖酸等活性成分,具有显著抗炎功效,在藏药体系中应用广泛。该物种因分布范围狭窄、野生种群数量极少,被列入青海省首批极小种群植物名录,面临栖息地破碎化威胁。然而,此前祁连獐牙菜的基因组资源完全空白,严重限制了其濒危机制解析、种质资源保护及药用价值挖掘

近日,《Scientific Data》在线发表了高原种质库张发起研究员、陈世龙研究员团队完成的题为“A High-quality chromosome-level genome assembly of Swertia przewalskii Pissjauk”的研究论文。该研究首次构建了祁连獐牙菜染色体水平高质量基因组,系统揭示了其基因组特征、重复序列组成及基因功能注释信息,为该极小种群物种的保护遗传学研究、药用活性成分合成机制解析及种质资源改良提供了关键理论支撑与核心数据资源。 基因组注释结果显示,祁连獐牙菜基因组中重复序列占比高达86.5%,其中长末端重复逆转录转座子(LTRs)为绝对优势成分(占75.88%),是基因组扩张的核心驱动因素;LTR-Gypsy(28.72%)和LTR-Copia(23.63%)为主要LTR亚型。共预测到35,701个蛋白编码基因,平均编码序列长度1089.01 bp,每个基因含4.97个外显子;32,775个基因(91.80%)在NR、GO、Pfam、KEGG等数据库获得功能注释,其中11,964个基因被注释到KEGG代谢通路,为解析药用成分合成机制提供了关键靶点。为验证基因组质量,研究团队通过19-mer频率分析确认基因组杂合度仅1.14%,Hi-C互作热图清晰展示12条染色体的染色体内强互作特征,染色体水平共线性分析验证了组装的准确性(图4)。该基因组不仅是獐牙菜属首个染色体水平参考基因组,也为龙胆科植物的比较基因组学研究提供了重要素材。  

该研究不仅填补了祁连獐牙菜基因组资源的空白,更建立了“极小种群植物基因组组装-功能注释-保护应用”的研究范式:祁连獐牙菜的基因组特征是“LTR主导的重复序列扩张”的典型代表,其低杂合度特征反映了极小种群的遗传现状。基于此,研究建议针对祁连獐牙菜采取“基因组导向的保护与开发策略”,利用基因组数据挖掘药用成分合成关键基因,开发分子标记指导种质创新;通过生境修复与种群扩繁,保护其遗传多样性;同时基于功能注释结果,探索活性成分合成的分子机制,推动藏药资源的可持续利用。  

祁连獐牙菜基因组重复序列分析


文章引用:Han, S., Niu, Y., Xu, H., Yu, J., Han, Y., Zheng, Q., Guan, R., Zhang, F., & Chen, S. (2025). A High-quality chromosome-level genome assembly of Swertia przewalskii Pissjauk. Scientific Data, 12:2026. https://doi.org/10.1038/s41597-025-06292-y