Nature Communications---“香料之王”染色体级参考基因组揭秘


胡椒(Piper nigrum,2n = 52)是木兰亚纲(Magnoliids)胡椒目(Piperales)胡椒科(Piperaceae)胡椒属(Piper)的常绿热带藤本植物,是世界范围内使用历史最悠久的香料,素有“香料之王”的美誉。在中世纪的欧洲,胡椒是社会地位和财富的象征,甚至价格要高于金银可作为货币流通,价比黄金。历史上,西哥特人入侵罗马、十字军东征、新航路的开辟等重要事件与胡椒资源和贸易权的争夺有着密切联系,胡椒被认为是古代促进东西方文化交流的重要商品。在古代,胡椒贸易路线的拓展促成了新航路开辟、地理大发现等重要历史事件。如今,海南岛是我国胡椒种植的主要地区,占全国产量的95%以上,已发展成为关系到上百万热区百姓收入的重要热作产业。中国热带农业科学院香料饮料研究所位於海南省东南部万宁市兴隆华侨旅遊经济区,主要承担胡椒、咖啡、可可等热带香料饮料作物的科学研究和产业化配套技术研发任务。


华中农业大学作物遗传改良国家重点实验自2014年购置高性能集群平台以来,形成完善的生物信息学分析能力,先后完成异源四倍体陆地棉和海岛棉(百迈客助力四倍体海岛棉及陆地棉基因组发表于Nature Genetics)以及玉米(Nature Genet. | 华中农大严建兵团队公布热带玉米高质量基因组,并克隆了一个玉米产量基因)等重要农作物基因组图谱的构建,基于此中国热带农业科学院香料饮料研究所联合华中农业大学开展了热带重要作物胡椒高质量基因组图谱的构建项目,同时也服务于国家“一带一路”的倡议。

2019年10月16日,国际学术期刊Nature Communications在线发表了中国热带农业科学院香料饮料研究所联合华中农业大学、马来西亚科学院等7家单位完成的题为“The chromosome-scale reference genome of black pepper provides insight into piperine biosynthesis”的研究论文。该研究绘制了我国胡椒栽培种“热引1号”染色体级别精细基因组图谱(木兰亚纲胡椒目首次报道基因组组装的物种),综合解读胡椒的基因组特征,物种进化位置,并进一步对胡椒碱合成代谢网络和关键基因及其基因家族进行深入研究,为被子植物演化及胡椒碱生物合成提供了新的见解。

1. 构建染色体水平的高质量胡椒基因组

作为整个基部被子植物类群胡椒目中第一个完成全基因组测序的物种,kmer分析表明胡椒基因组的大小约为761.74 Mb,杂合度为1.33%,重复序列比例为59.54%,属高杂合且高重复序列的复杂基因组。因此,作者结合PacBio三代测序、10X Genomics、基于直接标记和染色(DLS)的BioNano单分子光学图谱和Hi-C染色体交互捕获四种测序技术对胡椒基因组进行de novo组装和染色体锚定,并用二代Illumina数据对组装结果进行潜在InDel和小片段错误组装的纠正。经过PacBio和10X Genomics数据初步组装的胡椒基因组(“Piper_nigrum_v1”)包含有1,277条scaffolds,其N50值为2.3 Mb,组装基因组大小为791.0 Mb。进一步的BioNano和Hi-C辅助组装后,得到组装基因组大小为761.2 Mb,其中包含45条scaffolds序列,且N50达到29.8 Mb的最终染色体级胡椒基因组组装结果“Piper_nigrum_v3”。CEGMA和BUSCO综合对胡椒基因组组装结果进行评估,显示了较高的完整性和准确性。

2. 完成胡椒基因结构和功能注释

首先通过从头预测和同源序列比对相结合的方法对胡椒基因组的重复序列进行注释和屏蔽,结果显示重复序列占总基因组的54.85%,其中54.01%属于散在重复序列,进一步细分有40.55%属于长末端重复序列反转录转座子(LTR-retrotransposons,LTR-RTs),LTR-RTs中主要类型LTR/Gypsy占27.63%和LTR/Copia占9.95%;随后选用BRAKER2基因结构注释流程,结合从头预测、胡椒属UniProt蛋白数据库数据和RNA-seq和Iso-seq测序转录组数据,对胡椒基因组基因结构进行预测。结果共注释到63,466个蛋白编码基因;另外,还注释到1,514个转运RNA(tRNA),1,206个核糖体RNA(rRNA),1,533个小核RNA(snRNA),256个非编码RNA(miRNAs),6,509个长链非编码RNA(lncRNAs),59个转录因子(TFs)家族, 157个转录调节因子(TRs)和646个染色质调节因子(CRs)。在基因功能注释中,有48,277和46,256个基因分别比对到NR和UniProt数据库,进一步InterProScan分析共鉴定到3,652个蛋白家族和2,071个GO分类。KEGG注释显示共有11,362个蛋白编码基因注释到KO功能,57,700个基因注释到330个代谢通路中。次生代谢物注释共鉴定到10与生物碱代谢通路相关的基因簇。

(a)胡椒染色体。(b-d)GC含量,重复序列密度和基因密度在500 Kb窗口内的分布。(e-l)不同组织基因表达情况(从外到内依次为2 MAP,4 MAP,6 MAP,8 MAP,根,茎,叶和花)。(m)次生代谢物(绿色正方形)和胡椒碱代谢路径(红色正方形)基因分布。(n)染色体共线性区块,带宽与共线性区块大小成正比。

3. 鉴定到发生于胡椒中的全基因组复制事件

对胡椒基因组进行共线性分析,结果显示胡椒基因组内存在1,295个共线性区块,占约基因组注释到总基因数量的45.10%,其中66.0%的旁系同源基因位于不同染色体间,34.0%的位于染色体内。其次,共线性dot图分析显示胡椒染色体内和染色体间存在大量的复制区域。此外,胡椒基因组的相互最佳匹配基因对和共线性区块基因对的同义替换率(Ks)分布显示在大约0.1处存在明显的单峰。明确了发生于胡椒的全基因组复制事件,并计算得出胡椒的WGD事件发生时间大致为17.2-17.9百万年前(MYA)。

4. 确定了胡椒及其所在木兰亚纲的系统发育位置

基于21个典型物种的比较基因组和系统发育分析,确定了胡椒及其所在木兰亚纲的系统发育位置。在胡椒、9个双子叶植物、3个单子叶植物、3个木兰亚纲植物、无油樟、2个裸子植物和两个低等植物外群共21个物种中鉴定出82个单拷贝直系同源基因。随后,利用这82个单拷贝直系同源基因进行物种进化树的构建和分歧时间的评估,结果显示木兰亚纲与整个单子叶-双子叶互为姐妹关系,进一步胡椒目与木兰目-樟目互为姐妹关系,且大约在175-187 MYA(95% HPD)发生分歧。

5. 初步揭示了胡椒中胡椒碱生物合成分子特征

通过分析胡椒中的基因家族扩增和不同组织的RNA-seq转录组数据,揭示了胡椒碱合成的重要代谢过程:苯丙烷代谢途径和赖氨酸代谢途径,以及酰基转移代谢过程。基因家族扩张分析发现,91个基因家族在胡椒中发生扩张,其中有35个基因家族发生显著扩张(family-wide P-value ≤ 0.01)。

胡椒物种特异的基因家族扩张相关基因显著富集在次生代谢相关功能和抗病防御相关基因中。不同组织的RNA-seq转录组数据分析发现参与到苯丙烷代谢途径和赖氨酸代谢途径的部分基因在果浆中特异高表达,且BAHD-AT和SCPL-AT基因家族的扩张伴随着在果浆组织中的高表达,将苯丙烷代谢和赖氨酸代谢联系起来。进一步对属于苯丙烷代谢途径和赖氨酸代谢途径以及BAHD-AT和SCPL-AT基因的扩张基因家族进行序列水平分析,检测到不同程度的纯化选择和正向选择。
为全面了解胡椒中胡椒碱合成代谢过程,作者集中在分析与胡椒碱生物合成相关生物过程和参与到胡椒碱代谢的基因家族的扩张情况。通过综合的比较基因组和基因家族分析,发现了参与到赖氨酸代谢的LDC基因,参与到苯丙烷代谢的GTF,CYP和HCT基因,以及BAHD-AT和SCPL-AT基因家族有显著变化。在植物的次生代谢过程中,苯丙烷和氨基酸代谢通路和酰基转移酶无处不在。如咖啡、苹果、葡萄、可可、茶树、菠萝和甜橙等物种均富含苯丙烷衍生物,且这些物种中相应次生代谢物的合成也通过聚合上述两个代谢过程(苯丙烷代谢和赖氨酸代谢)。特别是辣椒(chili pepper)中,辣椒素(capsaicinoids)的合成来源于苯丙烷和支链脂肪酸代谢通路。此外,烟草中烟碱合成的前体来源于萜类化合物代谢和氨基酸代谢过程。在荷花、罂粟、博落回和番木瓜等物种中,赖氨酸驱动的喹啉生物碱的合成同样通过聚合苯丙烷代谢和赖氨酸代谢两个过程。然而,胡椒碱合成起始于赖氨酸的脱羧反应和胺基氧化过程,这与通过聚合两个酪氨酸来进行苄基异喹啉生物碱(benzylisoquinoline alkaloid)的生物合成有明显的区别。随后来源于苯丙烷代谢和赖氨酸代谢的前体物质通过酰基转移酶催化进行胡椒碱的合成。其中苯丙烷代谢和赖氨酸代谢的聚合,特别是赖氨酸的脱羧反应,胺基氧化反应和酰基转移过程代表了胡椒碱合成的主要特征,并进一步通过基因水平、转录水平和序列进化过程揭示了胡椒中胡椒碱生物合成的特异性,初步阐述了胡椒碱生物合成分子机理。

6. Author contributions

C.H. and S.J. designed and supervised the research. Z.X. performed the genome assemblies and annotation. Z.X. and L.H. performed the transcriptome and phylogenetic analysis. L.H., H.W., X.Q., L.Y. and L.T. collected materials for sequencing and generated transcriptome data. Z.X., L.H., R.F. and B.W. analysed the RNA-seq data. M.W., D.Y., S.S., W.L., C.S., H.D., J.W., K.L. and X.Z. provided constructive comments and suggestions on data analysis. Z.X. and L.H. wrote the paper with input from all other authors. All authors approved the paper.

7. 基金支持

该研究得到了农业农村部物种资源保护、海南省自然科学基金、中央级公益性科研院所基本科研业务费等项目的支持,是中国热带农业科学院重视基础研究、大力实施以基础和前沿研究、推进“十百千”科技工程、促进原始创新成果产出的体现。中国热带农业科学院香料饮料研究所郝朝运研究员、华中农业大学金双侠教授为论文的共同通讯作者。中国热带农业科学院香料饮料研究所胡丽松副研究员、华中农业大学许忠平博士为论文的共同第一作者。

8. How to cite this article


The chromosome-scale reference genome of black pepper provides insight into piperine biosynthesis
类型 期刊文章
作者 Lisong Hu
作者 Zhongping Xu
作者 Maojun Wang
作者 Rui Fan
作者 Daojun Yuan
作者 Baoduo Wu
作者 Huasong Wu
作者 Xiaowei Qin
作者 Lin Yan
作者 Lehe Tan
作者 Soonliang Sim
作者 Wen Li
作者 Christopher A. Saski
作者 Henry Daniell
作者 Jonathan F. Wendel
作者 Keith Lindsey
作者 Xianlong Zhang
作者 Chaoyun Hao
作者 Shuangxia Jin
URL https://www.nature.com/articles/s41467-019-12607-6
版权 2019 The Author(s)
卷 10
期 1
页码 1-11
期刊 Nature Communications
ISSN 2041-1723
日期 2019-10-16
刊名缩写 Nat Commun
DOI 10.1038/s41467-019-12607-6
访问时间 10/23/2019, 11:55:31 AM
馆藏目录 www.nature.com
语言 en
摘要 Black pepper (Piper nigrum) belongs to the long-isolated lineage of basal angiosperm and its fruit has been used for food spice and phytomedicines for thousands of years. Here, the authors assemble the reference genome of this species and analyze gene families associated with piperine biosynthesis.
添加日期 10/23/2019, 11:55:31 AM
修改日期 10/23/2019, 11:55:31 AM


9. 社交链接

  • 微信推送
    • Nature Communications|华中农大与热科院香料饮料研究所合作解析“香料之王”-胡椒染色体级参考基因组
    • 胡椒基因组的意义,远不止胡椒碱的合成
  • 找到了!胡椒那么辣的原因
  • 中国科学家找到胡椒辛辣的原因:哪些基因起作用?
  • 海南日报:热科院等单位成功绘制胡椒染色体级别精细基因组图谱

10. 彩蛋

http://tiramisutes.github.io/SCIFigure/

tiramisutes wechat
欢迎关注

本文标题:Nature Communications---“香料之王”染色体级参考基因组揭秘

文章作者:tiramisutes

发布时间:2019年10月13日 - 09:36

最后更新:2019年10月23日 - 16:20

原始链接:http://tiramisutes.github.io/2019/10/13/hujiao.html

许可协议: 署名-非商业性使用-禁止演绎 4.0 国际 转载请保留原文链接及作者。

0%