叨叨游戏网
您的当前位置:首页马尾松毛虫线粒体全基因组的测定与分析

马尾松毛虫线粒体全基因组的测定与分析

来源:叨叨游戏网
第55卷第12期 20 19 年 12 月

林 业 科 学

SCIENTIA SILVAE SINICAE

Vol. 55,No. 12Dec.,20 19doi: 10. 11707/j.1001-74==. 20191217马尾松毛虫线粒体全基因组的测定与分析!杜会聪1王瑶2方加兴1张珍荫E张苏芳1刘 福1张真1孔祥波1% 1中国林业科学研究院森林生态环境与保护研究所 国家林业和草原局森林保护学重点实验室 北京100091#2.东北林业大学林学院 哈尔滨150040; 3.云南省丽江市玉龙纳西族自治县林业局 丽江674100)摘要:【目的】测定和分析马尾松毛虫线粒体基因组的特征,从线粒体基因组水平探究蛾类昆虫高级阶元的

系统发育关系$【方法】采用HiSeqXTen测序仪测定马尾松毛虫线粒体的全基因组序列,参考鳞翅目昆虫已知线

粒体基因组的全序列对其各基因进行定位和注释$采用tRNA Scan-SE2. 0软件预测tRNA基因的二级结构$基于

线粒体全基因组的核昔酸序列构建鳞翅目蛾类13个科50种昆虫的系统发育关系$【结果】马尾松毛虫线粒体基

因组全长15 417 Qp,A+T含量为79.6%,包括13个蛋白质编码基因)22个tRNA基因)2个rRNA基因和一段长度

为320 bp的A+T富含区,无基因重排$ 13个蛋白质编码基因中,氨基酸使用较频繁的依次包括Phe、Leu、Ee、Tyr

和Asn( Count>290),而A.和Arg的使用相对较少% Count<50);在其密码子使用中,除C0I以CGA为起始密码子

外,其余基因的起始密码子均为昆虫典型的ATN( ATA)ATT)ATG);终止密码子除C0I)C0/I和ND4基因为Th ,

其他基因的均为TAA$在所测得22个tRNA基因中,tRNASegAjN)缺少DHU臂,其余tRNA均为典型的三叶草结构$

A+T富含区存在1段由ATAGAA引导保守长度为14 bp的多聚T结构和2段长度为13 bp的重复单元以及1个 (AT) 7结构$马尾松毛虫与其他松毛虫属的线粒体基因组全序列及13个蛋白质编码基因的核昔酸序列进行比对

分析,结果表明,马尾松毛虫与文山松毛虫和油松毛虫三者间具有较高的同源性$系统发育树的结果显示:马尾松

毛虫与油松毛虫亲缘关系最近,思茅松毛虫和赤松毛虫亲缘关系最近$【结论】马尾松毛虫线粒体基因结构稳定, 基于线粒体基因组构建的鳞翅目蛾类昆虫的系统发育关系与传统的形态分类学结果基本一致$关键词: 鳞翅目;枯叶蛾科;马尾松毛虫;线粒体基因组;系统发育中图分类号:S718. 7

文献标识码:A 文章编号:1001-7488( 2019) 12-0162-11Sequencing and Analysis of the Complete Mitochondrial Genome of

Dendrolimus punctatus (Lepitoptera: Lasiocampitae)Zhang Zhenyin3

Zhang Sufang1

Liu Fu1Du Huicang1 Wang Yao2 Fang Jiaxing1

Zhang Zhen1 Kong Xiangbo1(1. Research, Institute of Forest Ecology, Environment and Protection, CAF Key Laboratory of Forest Protection of NationalForestry and Grassland Administration of China Beijing 100091 ; 2. ScOool of Forestry, Nofhecst Forestry Unive—ity HarCio 150040 ;3. Foresee Bureau of Yulong Naxi Autonomous County, Yunnan Province Ljiang 674100)Abshach: 【Objective] In thic study, we sequencad the mitochondrial genome of Deydrolimus punctatus , and analyzedthe mitochondriaO genome characteristics and the higher-levee phylogenetic relationships in moths of Lepidopterr.

【Method ] The campletR genome sequence of the mitochondrial genome of D. punctatus was determined by Hiseq X Ten

sequencer. The genes were located and annotated based on the known campleto mitochondriaO genomes of Lepidopteran species. The tRNA Scan-SE 2.0 was used R predict the secandarr structurr of the tRNA genes online. Based on the whole

nucleetide sequenca of mitochondrial genome, the phylogenetic relationships of 50 insect species from 11 families of

Lepidopter werr recanstructed.【Result ] The results showed that the campleto mitochondral genome of D. punctatus was a circular molecule of 15 417 bp, including 13 protein-cading genes , 22 tRNA genes, 2 rRNA genes and one cenRol

reeion without gene mangement. Among the 13 protein-cading genes, amino acids of Phe, Leu, Ee, Tyr, and Asn

(Count〉290) were used more frequently, while Ala and Ar were uesd less frequently ( Count 150) . In the use of its收稿日期:2019-01-11;修回日期:2019-08-26。基金项目:国家自然科学基金项目(31470654)。*孔祥波为通讯作者。第12期杜会聪等:马尾松毛虫线粒体全基因组的测定与分析163codon , except CGA as the starting codon of CO/ gene, the starting codons of the other genes were all typical ATN % ATA,

ATT, ATG) . The stop codon of COI)COH and ND4 was T, whCe that of the othee genes was TA A. All tRNAs showed the classic clover-leaf structure, eccopt that the dihydrouridine % DHU& arm of tRNASer%AGN) formed a simple loop. The % A +

T) -rich region contained some conserved structure including the motiC ATAGAA, 14 bp ploy % T) stretch and tworepeeting units with a length of 13 bp and one % AT) 7 structure. The complete mitochondrial genome sequenco and the

nucleotide sequenco of 13 protein-coding genes of D. punctatus were compared with oWco species of Dendrolimus genus, and the results showed that there was high homoloyy between D. punctatus, D. weeshanensis, and D. tabulaeformis.Phyloyenetic tree results show that D. punctatus is closely related with D. tabulaeformis, and D. tpectabiUs is closely related with D. kikuchii. ' Conclusion ] The mitochondrial genes structure of D. punctatus are stable, the phyloyenetic

relationship of some species from Lepidoptera based on mitochondrial genome Is consistent with the Waditional morpholoyicel classificotion.Key words : Lepidoptera ; Lasiocempidae ; Dendrolimus punctatus ; mitochondrial genome; phylogeny

昆虫线粒体基因组具有母系遗传、结构简单和

息构建系统发育树有助于昆虫的分类和进化研究,

进化速率快等特点,被广泛应用于昆虫的系统发育 和群体遗传等方面的研究中% Song f al., 2016;

为澄清松毛虫属分类中存在的问题提供系统发育方

面的依据$Cameron et al., 2007 ) $近年来,随着DNA测序技术 的成熟和分子生物学研究的快速发展,越来越多昆

1材料与方法1. 1试验材料 马尾松毛虫于2016年9月采自江 西省赣州市于都县(25O57,N,115O25,E),将采集到

虫种类的线粒体全基因组被测序(陈志腾等,2016)$目前,NCBI基因数据库收录了 140多种鳞 翅目(Lepidoptera )昆虫完整的线粒体基因组

的虫茧带回实验室,置于养虫笼在光周期15L:9D,

(Ramirez-Rios et al., 2016),松毛虫属(Decdrolimus )

温度25 T ± 1 °C ,相对湿度60%-80%的人工气候

收录 了 6 种,赤松毛虫(D. spectabis ) ( Kim et al.,箱中培养,待成虫羽化后将活体昆虫放入无水乙醇 中固定于-20 C冰箱保存备用$2016) 和思茅松毛虫(DPsuchis ( Liu et al, 2017 ) 的线粒体全基因组特征相继报道$由此可见,枯叶 蛾科(Lasiocampidae)昆虫线粒体基因组数据还严重

1.2方法挑选保存完好的马尾松毛虫标本,取其 胸部肌肉,加入到核裂解液中,置于小型匀浆机匀浆

匮乏$本研究通过测定分析马尾松毛虫(D.

punctatus )线粒体基因组的全部核昔酸序列,并结合

10 S,在65 C孵育裂解物20 min后,加入3 L RNA 酶溶液并混匀$ 37C孵育20 mo后冷却至室温,加 入200 L蛋白沉淀液并使用旋涡振荡器震荡20 s,

,已报道的50种鳞翅目蛾类的线粒体基因组进行比

,较分析,探究松毛虫所在的高级阶元的分类地位,以

置于冰上冷却5 min,然后在16 000 Xg下离心4

期丰富马尾松毛虫线粒体全基因组的基础数据$马尾松毛虫隶属于枯叶蛾科松毛虫属,是我国

min,加入600 L室温的异丙醇,移取上清液,使用

1%琼脂糖凝胶检测其纯度和浓度(120 ng-ixL^1 )$,危害最严重的森林害虫之一$马尾松毛虫广泛分布

1 ) Hlumina Hiseq X Ten高通量测序 上海美 吉生物公司利用Illumina HiSeq X Ten平台对马尾

于我国秦岭淮河以南的各省、市、自治区,经常大面 积暴发,严重影响林木生长,给林业生产带来巨大的

松毛虫样品进行paired-end ( PE)测序,构建460 bp 文库,将获得的原始序列进行质量剪切:去除reads 中的adapter序列,剪切去除5 -端含有非A、G、C、T

经济损失(张爱兵等,2004;贾玉迪等,2011 )$国 内外专家先后对其生物学特性、暴发机制、防治及管 理等方面都有较为深入的研究(蔡邦华等,1965;赵 清山等,1992; 1999 ;张苏芳等,2015;周夏芝,的碱基;修剪测序质量较低的reads末端(测序质量

值小于Q20);去除含N的比例达到10%的reeds; 舍弃adapter及质量修剪后长度小于25 bp的小

2017) ,然而在松毛虫属某些物种的亲缘关系及分 类地位上仍然存在着分歧(Qin et al., 2015 ;

片段$Kononoe et al., 2016) $测定分析马尾松毛虫线粒体

基因组特征,不仅丰富鳞翅目昆虫中线粒体全基因 组的信息,还可以对昆虫纲中一些进化关系给出合

2)序列拼接及注释 利用SOAPdenove v2. 04 (http : //soap.genomics.org.cn )拼接软件对质控后的

全部clean data进行de novo组装,将组装得到的

理的解释。根据昆虫线粒体基因提供的遗传进化信

contig与线粒体数据库进行比对,筛选得到来自线

1林业科学55卷粒体的contig;然后利用MITObim vl. 6迭代比对, 将测序的所有clean reads mapping于contig上延伸,

ClustaO X软件进行序列比对后,采用最大似然法

% maximum likelihood method , ML)构建系统发育树, 采用Bootstrap % 1 000次重复)检验系统树各分支节

通过gap close获得线粒体的全基因组序列。利用 DOGMA 软件 % http : //dogma, ccbb. utaxas. edu)对基

点的置信值 % Guindon et al., 2003) $2结果与分析因组中包含的gene、rRNA和tRNA进行预测,通过 blastp比对Nr数据库,获得预测基因的注释信息$3) 序列特征分析马尾松毛虫线粒体基因组 2. 1 马尾松毛虫mtRNA基因组全序列分析 马尾 松毛虫线粒体基因组全长15 417 bp,由2个rRNA、

全序列使用在线软件提交到GenBank % MK886799 ) 中$采用CGview软件进行线粒体基因组圈图的绘 制$使用MEGA6 % Tamure et al., 2013 )计算基因的

13个蛋白质编码基因)22个tRNA和1个非编码控 制区组成% control reeion) $在线粒体基因组编码的 37个基因中,由N链编码的基因有14个,分别是2

核昔酸组成,包括AT含量、AT偏斜和GC偏斜,并 分析蛋白质编码基因的氨基酸使用情况和相对同义

个 rRNA 基因[rrns( 12S RNA)、rrnl( 16S RNA)]、4 个蛋白质编码基因% ND1、ND4、ND4L和ND5)和8

密码子 % relativv synonymous codon usage, RSCU )的 相对使用度 ° 使用 tRNAscon-SE Search Servvr

个 tRNA 基因 % trnV、RnL 1、trnP、trnH、trnF、trnY、trnC 和tmQ);余下的9个蛋白质编码基因和14个

% Http : //lowelabb. ncsc. cdu/tRNAscon-SE )在线对 tRNA基因二级结构进行预测,没有被tRNAson-SE 预测出来的tRNA通过与其近缘种相应的tRNA比 对进行人工预测$使用MUSCLE软件对7种松毛

tRNA由J链编码,共23个$在马尾松毛虫线粒体基因组整个编码区的37

个基因中,相邻基因之间存在基因间隔或基因重叠

虫全序列及13个蛋白质编码基因的核昔酸序列进 现象$其中基因间隔区有17处,共201 bp, trnQ和

ND2之间间隔最长为58 bp,其次是trnY和C0I;基

行比对分析$4) 系统发育分析 基于鳞翅目13个科的50

因重叠有7处,共23 bp,最长一处位于RnW和trnC 之间,重叠序列为8 bp ;既无重叠又无间隔的区域 共有13处$马尾松毛虫的基因结构及顺序见图1 及表1 $种蛾类昆虫线粒体全基因组的核昔酸序列,选择鳞

翅目中与蛾类关系较近的枯叶峡蝶% Kallima

inachus )和武铠峡蝶% Chitoria ulupi )为外群,通过■ GC content■ Gc skew+■ GC skew-trnC-GCAtrnY-GATtrnQ-TTCtrnR-TCG trnN-GTT trnSl-GCT trnE-TTC图1马尾松毛虫线粒体基因组结构Fiv. 1 Structurr of the mitochondrial genome of D. punctatus第12期杜会聪等:马尾松毛虫线粒体全基因组的测定与分析表1马尾松毛虫线粒体基因组注释!165Tab. 1 Organization of the mitochondrial genome of D. punctatus基因Gene方向DireoWion起始位置SWarWpoeiWion终止位置SWop poeiWion长度Length/bp反密码子AnWioodon起始密码子SWarWoodon终止密码子SWop oodon基因 间 隔IGS/bpWnMesnIFFR175671352016761CATGATTTGATTTAA7-358WnQ13369ND2RnWFFRR2601 2671 3341 3921 4603 0253 0923 7743 8453 91 0784 7491 0086966681 2661 3271 3931 4953 0263 0933 7753 8493 9174 0724 7TCAGCA-2-8trnCtrnYGTACGATAA0T34COIWnL2FFFFFFFFFFFFFFFRRRRR1 531676820COTtrnKATACTTGTCATTATGATGTCCT00371trnD68162ATP8ATP6TAA0-7146787TAATAAcornWnG

5 5525 6205 9746 0406 1196 16 2686 3326 4025 5555 6215 9746 0566 1246 2016 2686 3376 405663542ATGNDftrnAWnRRnNTAA0-11567666865TGCTCGGTT411

-1trnS1GCTTTCWnEtrnF66GAA4ATTND5WnH8 1478 2159 5549 8729 94310 00810 5471 74368GTGTAA208 1488 2169 5799 8809 94410 01710 552ND41 339294ATGATGT024ND4LWnTWnPTAAFR65TGT70TGGND6CytBWsnS2FFFRRRRR531ATAATGTGAATGTAATAA811 70011 77012 72312 79214 25314 31815 09715 4171 149679544311 70411 77012 72512 79314 25414 31915 098ND'WsnL1rrnLTAA-168TAG11 461650TACtrnVrrnSDseoop000779320F①基因间隔一列中,正数表示基因间隔碱基数,负数表示基因重叠碱基数$ In the column of intergenic length % IGS ), the positive numberindicates interval base pairs between genes, while the negative indicotes the overlapping base pairs between genes.2. 2 马尾松毛虫基因组的核昔酸组成及密码子使

用马尾松毛虫线粒体全基因组序列中A、T、C、G

蛋白质编码基因密码子第1位点、第2位点和第3

位点的A + T含量分别为81.3%、75.9%和76.2%

%表2)。蛋白质编码基因、密码子第1位点、第2位

的碱基含量分别为41. 0%、38. 6%、12. 5%和7. 9%。

碱基A含量最高而G含量最低$ A+T含量为 79. 6% , G+C 含量为 20. 4% $ AT-skew 值为 0. 03% ,

点、第3位点和控制区的AT偏斜和GC偏斜均为负

值,表明其区域内碱基A和G的百分比含量均低于

GC-skew值为-0. 223%,表明基因组全序列中碱基 T和C; tRNA基因的AT偏斜和GC偏斜均为正值, rRNA基因的AT偏斜为负,GC偏斜为正$A和C的百分比含量高于T和G;蛋白质编码基因

中A+T含量为77. 8% ,比全序列A+T的含量稍低,

166林业科学表2马尾松毛虫线粒体基因组核基因序列Gene sequences55卷a酸组成A+T% %)

Tab. 2 Nucleotide composition of the complete mitochondrial genome of D. punctatusT % %)

C % %)A % %)G % %)

C+G% %)AT偏斜AT-skew0.030-0.134-0.124GC偏斜GCUskew全基因组 Whole genome38.612.510. . 141.033.77.979.677.881.375.976.220.422.2-0.223-0.027-0.024-0.070蛋白质编码基因Protein-cading genes密码子第1位1e cadon site密码子第2位2nd cadon site密码子第3位3rdcadon sitetRNA 基因 tRNA genes44. 145.741.911.49.612.911.710.635.634.031.441.841.218.724.111. 212. 18.5-0.105-0.174. 839. 143.749.423.819.115.1-0.0280.1100.430-0.28280.984.9rRNA 基因 rRNA genes4.35.010.82.80.033-0.029-0.072控制区 Control region42.2.27.82.3 马尾松毛虫线粒体基因组蛋白质编码基因 马尾松毛虫线粒体基因组蛋白质编码基因序列有 11 214 bp,占总基因组的72.74%。A、T、C、G的碱

基含量分别为 33.7%、44. 1%)10. 8%、11.4%, A+T 碱基含量为77. 8%,较整个线粒体基因组A+T碱基 含量要低1.8%。AT偏度为-0. 134, GC偏度为

-0. 204。13个蛋白质编码基因中ND5基因最长 % 1 743 bp),编码271个氨基酸;ATP9最短 % 162 bp),编码54个氨基酸。C0I以CGA为起始 密码子,其余蛋白质编码基因都是以ATN作为起始 密码子$ ND2、AAP8和ND5以ATT为起始密码子,

C0〃和ND6以ATA为起始密码子,ATP6、C0III、

ND3、ND4、ND4L、CytB 和 ND1 以 ATG 为起始密码

子。终止密码子中除C0IC0〃和ND4以T为终止 密码子外,其余编码基因的终止密码子均为TAA,

这与昆虫线粒体基因组普遍使用的终止密码子为 TAA或TAG相一致。马尾松毛虫线粒体基因组的全部蛋白质编码基 因的氨基酸使用情况%图2A)和相对密码子使用率

RSCU(图2B)的分析结果显示,马尾松毛虫13个蛋 白质编码基因中氨基酸使用最频繁的依次为Phe

%468)、Leu(457)、Ile( 372)、Tyr( 316)和 Asn% 292),

而Ala%43)和Arg%20)的使用相对较少;氨基酸的 密码子使用频率相对较高的依次为UUU、AUU、 UAU、UUA和AAU,其中UUA的相对同义密码子使

用频率最高,RSCU值为3.39,密码子GCG和CCG 的相对密码子使用频率最低,其RSCU值分别为 0.19和0.1。由此也反映了核昔酸组成的AT偏 好性。2.4 tRNA基因及rRNA基因的结构分析 马尾松 毛虫线粒体基因组一共检测到22个tRNA基因,A +

T的含量为80. 9%,tRNA基因的长度为61-71 bp。 其中亮氨酸和丝氨酸均包含2组同功受体。根据 tRNAScan-SE的预测及辅助人工校正的方法,对马

尾松毛虫线粒体基因组tRNA的二级结构进行分 析。22个tRNA基因中,21个可以形成常规的三叶 草结构,而tRNASer型的tRNA二级结构%图3 )。在马尾松毛虫线粒体

基因组22个基因的二级结构中出现了 22对碱基错 配现象,其中G-U错配16个,U-U错配4个,U-C和 A-C错配各1个。A-C错配出现在tRNASer密码子臂上,U-C错配出现在tRNAThr上,4个U-U错配分别位于tRNACys tRNASer错配是符合摆动配对原则的,对维持tRNA二级结

构的稳定起着重要的作用。rRNA基因是一类相对分子量较大的RNA基

因,可与蛋白质结合形成核糖体。马尾松毛虫线粒 体的核糖体小亚基rrnS基因和核糖体大亚基rrnL 基因的长度分别是779 bp和1 461 bp,分别位于

A+T 富含区与 tRNAVae量为84. 9%%表2),具有明显AT碱基偏向性。2. 5 A+T富含区的结构分析马尾松毛虫线粒体

全基因组包含18个非编码的基因间隔区,其中 最大的非编码区为AT富含区,位于rrnS与tRNA”\"

之间。松毛虫线粒体基因组A+T富含区长320 bp, A + T含量为92. 2%。在rrnS基因的下游由

ATAGAA引导保守长度为14 bp的多聚T结构%图4),这段多聚T结构在已测定的鳞翅目昆虫mtDNA

中都很保守,长度在12-22 bp不等,在马尾松毛虫 线粒体A+T富含区中还存在2段长度为13 bp的重

复单元,以及1个% AT) 7结构,类似结构在其他鳞翅 目昆虫中均有检测到。2. 6 松毛虫属7个物种间的基因组比较及序列比

对 对松毛虫属已知的7个物种线粒体基因组各组

分的核昔酸组成进行分析,结果%表3 )显示,7种松

毛虫线粒体全基因组序列的长度具有一定差异第12期杜会聪等:马尾松毛虫线粒体全基因组的测定与分析167llllllllllllllHPhUsage of amino acids ( A) and the relative synonymous codon usage ( B) of protein-coding genes of mitochondrial genome in D. punctatus(15 370〜15 418 bp),思茅松毛虫和云南松毛虫(D

相对较小,分别为15 370 bp和15 381 bp,其余

虫相似度次之,均为98.99%;基于蛋白质编码基因 的比对结果中,三者间的相似度仍位于所有比对中

5种均大于15 410 bp。全基因组的A+T含量排序

的前三,相似度依次为99. 46%)98. %和98. 84% , 说明马尾松毛虫、文山松毛虫和油松毛虫间相似度

依次为:思茅松毛虫(D. punctatus wenshanensis ) (78.8%) <文山松毛虫(79.4%)二赤松毛虫 (79. 4% ) <油松毛虫(D. tabulaeformis) ( 79. 5% ) < 马 尾松毛虫(79.6%) <云南松毛虫(80%) <落叶松毛 虫(D. tuperans) ( 80. 1 % ) o最高。2.7 马尾松毛虫高级阶元系统发育关系 以枯叶 峡蝶和武铠峡蝶为外群,选用已经测定的29种鳞翅 目蛾类昆虫和本研究中的马尾松毛虫线粒体全基因

使用MUSCLE软件对7种松毛虫全序列及13 组,基于13个蛋白质编码基因的核昔酸序列构建 ML树$结果(图5)显示,马尾松毛虫属的5个昆虫

个蛋白质编码基因的核昔酸序列进行比对分析,结 果(表4)表明,基于全序列和蛋白质编码基因的序

的系统发育关系为:云南松毛虫+ (马尾松毛虫+油 松毛虫)+(赤松毛虫+思茅松毛虫)$结果表明,马

列比对的相似度均大于90.78%。基于线粒体全序 列比对结果中,文山松毛虫和油松毛虫的相似度最

尾松毛虫和油松毛虫亲缘关系较近,思茅松毛虫和 赤松毛虫亲缘关系较近。50种鳞翅目昆虫的亲缘大为99. 55%,马尾松毛虫与文山松毛虫和油松毛

168林业科学55卷分析结果显示:天蚕蛾科(SatuYidae )、蚕蛾科

% Bombycidae)、天蛾科(Sphingidae)和枯叶蛾科聚为

螟科(Crambidae )和卷叶蛾科(Tortricidae )各自为一簇;蝙蝠蛾科% Hepialidae)与潜叶蛾科% Lyonetiidae)—簇;毒蛾科 % Lymantriidae)、灯蛾科 % Arctiidae)、尺亲缘关系相近为一簇。蛾科 % Geometriidae)和夜蛾科 % Noctuidae)为一簇,草丙氨酸AlanineA-U G-U G-C A-U U-A精氨酸ArginineA A-U A-U

天冬酰胺Asparagine :昌AU-AU・AA-UA-u天冬氨酸就Aspartic g・CA . U AAUUG

A-UA-U U-A AU UAAUG AAUUAC Cystenine c半胱氨酸.gGlutamine :谷氨酰胺Aaa\\uuaA 品晶 uaZu aaaau-aaua-uuaaccaa

A

U-AU-AA^CUl?%AA ACCA GAAuuC

Aa a^a Uuu 心 Aj严uA Au-aAAUA-UU-AC-GuA留

u询 r aA.uga gg U-A 3AUUAUAU-AU-AUA-U AAUGUGA%品叫 u金U-AA-UG-Cuu-Au\\ culjaAUAU AIlli uUAUAuuUua'ua Uugca谷氨酸淤Glutamic u-AA-UU-A

y-uuuuuui<

U-AU-A G-C

cA-UaUUCGaA-Uaa 幕: UGuCA-UA-UGUUA-UA-UU-A甘氨酸u

Glycine u

UAAUUUlk组氨酸HistidineA-UA-U异亮氨酸::Isoleucine G_uU-U i inlUA亮氨酸Leucine A・UA-u uUuuCAUUAAa^1

,

uAa

C aAAAU auaA A., aaaIlli

UUUA

a,飞曾AUGA../u UA%-aaUU-A A-U U-A U-GC G3cagacGgU U AcAUGUAAAGG 11aAgAg GuAUA-U U-A G-C G-CA CAaaUGUA-U U-AG-CA-U UU UA

UuagAuG-CuA・UC-G A-U

GU-A赖氨酸处T . U-ALysine A_uMethionine a甲硫氨酸壯-ua-uPhenylalanine u苯丙氨酸 gA\"UAAC-GProline A- uG-CA-UlAUuuucUU脯氨酸a-SaaAgucaGAGUAAa aA ,% Auu GuaAGUaCU-AUUUG-CG-CU-AC A

G-C A AC UCAUU A :A 皆雪 賞%A -AGCU,. UAUAA U AUUU-AG-AG-CG-CA A A A aaua-uuuuccu IIII fiA-U\"U(-U\"UCUAAUUUA X-—

丝氨酸tuSerine a-u丝氨酸Serine u-AA・UA・Uu aGAGUg

UUCG Illi GAUUAAA aAL|U-Agaau auuaccuu ayAGUGGuu-U-AA-Ugua11-A M務c(jUAUUGGThreonine u・Ag-c苏氨酸u::A-UA-U色氨酸 MMTryptophane G-C酪氨酸S:ATyrosine A-U缄氨酸JValine aU — Amino acid acceptor(AA)arm氨基酸接受臂屮环 _ 额外环_ TCJ —TPC(T)annVariable(V)loopG-C CU-AA

Anticodon(AC)arm反密码子环DHCUuguaG图3马尾松毛虫tRNA的二级结构环Fig・3 Secondare structures foc tRNA genes from = punctatus mtRNA表3松毛虫属7个近缘物种线粒体基因组核a酸组成Tab. 3 Nucleotide composition of 7 closely related species of Dendrolimus全基因组物种 SpeciesWhoie genomePCG大小 Size/bp11 21411 21411 21111 21111 21711 21911 211A+T

tRNAA+T-rich region登录号大小 Size/bp15 41715 41815 41115 37015 41715 38115 410A+T

% %)79. 679. 479.578.880.1% %)77.小 Size/bp1 4651 4681 4681 4731 4751 4771 468A+T % %)80.9大小 Size/bp320320A+T % %)92.292.592.8GenBank Accession No.马尾松毛虫D. punctatusMK886799KJ_913812

文山松毛虫 D. punctatus wenshanensis油松毛虫 D. tabulaeformis思茅松毛虫D. kikuchii落叶松毛虫D. superans77.677.781.081.080.7320KJ_913817KY_00041277.078.578.331931631932092.581.281.281.290.292.293.4KY_000413云南松毛虫D. hori80.0KJ_913817KJ_913816赤松毛虫 D. spectabilis79.477.5第12期rmS-15 097 bp杜会聪等:马尾松毛虫线粒体全基因组的测定与分析169TTATAIAATAAATATTATTACATAGArmTTTmTTTIATATTAAAATAITrAATAAACA轻链复制起点Origin of light strand replication

TTATTAAACATTTAATAATTTCTCTTAITTTTTCTTCATAATATTTATArTAAATACAAATTTGCTAIAIAAAATTrGAAAATTrGATAAATTACAAAAIAAIAATAIAAITAATATTAATTTTTTCAATTAITTAITAIAITAATAIAIAIAIAIAIACAArAAATAAITTAATArAITAATTAAIAA微卫星(AT)ii单元Microsatellite (AT)n elementATTAATGATAGTAATTAATTTATTTCTTTAATTGAACCGTTTACAATTTmTTATAGTAA13 bp的重复单元 13 bp repeat element

13 bp的重复单元13 bp repeat elementTTAATTAA 15 418 bp-tRNAMet图4马尾松毛虫线粒体基因组A+T富含区结构Fig.4 Structure of % A+T) -rich region of = punctatus mitochondrial genome表4 7种松毛虫线粒体基因组的序列比对①Tab. 4 Sequence alignment of mitochondrial genomes of 7 species of Dendrolimus

物种%赤松毛虫D spectabilis马尾松毛虫D punctatus文山松毛虫

D. punctatus wenshanens ss油松毛虫D tabulaeoormss思茅松毛虫D. kiOuchii落叶松毛虫D superans云南松毛虫D houiSpectee马尾松毛虫D. punctatus100. 0098.84100.0098.99.4690.8590.1.31文山松毛虫 D. punctatus wenshanensis98. 9998. 9991.4991.1493.4593.2993.3495. 1295.00油松毛虫 D. tabulaeformis思茅松毛虫D. kiOuchii99.5591.41.6693.7695.59100.0091.4990.8100.0091.2391.28100.0092.3691.85.0990.1. 1191.86100.00落叶松毛虫D. superans云南松毛虫D. houi91.7593.8495.91.191.8591.4193.38100.0093.995.91.3赤松毛虫 D. spectabilis91.5393.83①上三角基于编码蛋白基因比对的相似度,下三角基于全序列比对的相似度$ The number above the diagonal it based on alignmenO oC protein ceding gene, the number below the diagonai it based on alignment of ccmpleto sequence.3讨论基因的终止密码子均为TAA,这种现象普遍存在于 线粒体基因组中$虽然COT)CO*和ND4基因无完

马尾松毛虫线粒体全基因组的碱基含量为Al T〉C〉G,其A + T含量为79.6%, A + T含量远大于 C+G含量,这与已知的鳞翅目枯叶蛾科的思茅松毛

整的终止密码子,但这也表明其转录产物的3,末端 为T,加上mRNA 3,末端的PloyA尾,转录产物在加

工过程中加上多腺昔酸后可以形成TAA终止密码

虫 % Liu et al., 2017)、赤松毛虫 % Kim et al., 2016)等 子%孙志鹏等,2018 )$起始密码子与终止密码子的 使用情况也验证了昆虫线粒体基因组中A + T含量 偏向性的特征$马尾松毛虫线粒体基因组中除

几种昆虫类似$基因组的排列顺序同已报道的鳞翅 目其他昆虫的线粒体基因排列顺序一致,其中trnM- trnl-trnQ的排列方式与假想昆虫祖先的排列方式

tRNASer%AGN)缺少DHC环,其他21个tRNA均为典型 的三叶草结构,这在其他类群的昆虫中也有出现

% trnl-trnQ-trnM )不同 % Boore et al., 1998 ),但是这种 排列方式在鳞翅目昆虫中非常典型$鳞翅目线粒体

% Wang, 2017 ;林爱丽等,2018 )$鳞翅目昆虫线粒体基因组中的A + T富含区的 结构比较保守,其控制区大多具有4个共同结构:

基因组进化上的保守性,表明其适合解决科、目等高 级阶元的系统发育关系的问题% Boore, 1999 )$马尾松毛虫蛋白质编码区除COT基因以CGA 为起始密码子外,其他基因均以AT*为起始密码 子,这与大多数鳞翅目昆虫是一致的$研究发现,昆 虫物种的COT基因的起始密码子具有明显的多样

轻链复制起点、多聚T结构、微卫星% AT) /单元及 重复单元$ A+T富含区的位置比较保守,大多位于 tRNAMe基因和rrnS基因之间,其长度在物种间的变 化较大$马尾松毛虫长度仅320 bp,鳞翅目其他物 种如小红珠绢蝶% Parnassius nomion )和扬眉线峡蝶

性,包括四联体起始密码子% ATTA)ATAA和TTAG)

和六联体起始密码子% TATTAG和TTTTAG) % Clare

et al., 1983 ; de Bruijn, 1983 ; Kim et al., 2006);终

% Limenitis helmanno)等昆虫线粒体基因组A+T富含 区的长度均大于马尾松毛虫的长度,这与A+T富含 区是变异高发区域且可容纳积累基因突变的特点相止密码子上,除COT)CO *和ND4基因为T外,其他

170林业科学55卷柞蚕 Antheraea pemyi NC 004622

半目大蚕蛾 Antheraeayamamai NC 012739 琥珀蚕 Antheraea assama KU301792 柳蚕 Actias selene NC_018133

檢蚕 Eriogyna pyretorum NC_012727

合目大蚕蛾 Saturnia boisduvalii EF622227 大乌柏蚕 Attacus atlas EF006326 日樗蚕 Sarnia cynthia NC_017869 宽带樗蚕 Sarnia canningi KJ159909 茶箱蚕蛾 Andraca theae KX365419 棗树蚕嫌 Rondotia menciana KJ7172 象蓋蛾 Bombyx mori NC_002355

天蚕蛾科Satumiidae蚕蛾科 Bombycidae野桑蛾 Bombyx mandarina NC 003395

W W夫蛾 Ampelophaga rubiginosa KT 153024 Sphinx niorio KC470083

烟草蛾 Manduca sexta NC_010266 烟草蛾 Manduca sexta EU286785 竹竇毛虫 Euthrix laeta NC_031507 Apatelopteryxphenax KJ508055

波纹杂毛虫 Kunugia undans NC_035683 云南机毛虫 Dendrolimus houi NC 039840.1 马尾松毛虫 Dendrolimuspunctatus

油松毛虫 Dendrolimus tabulaeformis KJ913817 思茅松毛虫 Dendrolimus kikuchii NC 036347 赤松毛虫 Dendrolimus spectabilis KJ913815 辩毒蛾 Lymantria dispar NC_0123

茶黄毒蛾 Euproctispseudoconspersa KJ716847 奚国石城 Hyphantria cunea NC_014058

天蛾科 Spliingidae枯叶蛾科 Lasiocampidae毒蛾科 Lymantriidae灯蛾科Arctiidae

棉铃虫 Helicoverpa armigera NC_01668 大螟 Sesamia inferens NC_0158350 粘虽 Mythimna separata NC_023228 球菜叶蛾 Agrotis ipsilon NCj)22185

桑尺蟆 Phthonandria atrilineate NC_010522 来蛾 Corcyra cephalonica NC_016866 小療螟 Diatraea saccharalis NC 013274 二花硬 Chilo suppressalis NC_015612

夜蛾科Noctuidae尺蛾科 Geometriidae稻纵卷叶螟 Cnaphalocrocis medinalis NC_015985 豆野螟 Maruca vitrata NC_024099

桃蛀嗔 Dichocrocispunctiferalis NC 0213 梨小食心虫 Grapholita molesta NC_014806 衣梢卷叶蛾 Spilonota lechriapis NC_014294 傘桌蠹城 Cydia pomonel I a NC_020003 苹小卷A蛾 Acleris>^r/^NC_018754 案小卷冲晦 Adoxophyes honmai NC 008141 傘集小卷弁蛾 Adoxophyes orana NC_021396 旋纹潜蛾 Leucoptera malifoliella NC_018547 人支蝠晦 Thitarodes renzhiensis NC_018094 云南无物蝠蛾 Ahamus yunnanensis NC_018095 枯叶峡蝶 Kallima inachus ND_016196 武當族加 Chitori a ulupi NC 026569草螟科Crambidae卷叶蛾科Tortricidae潜叶蛾科Lyonetiidae蝙蝠蛾科Hepialidae峡蝶科 Nymplialinae图5基于马尾松毛虫线粒体全基因组的系统发育树(最大似然法)Fig.5 Phylogenetic tree based on whole mitochondrial genome of D. punctatus ( Maximum likelihood method )关,这也是导致物种间线粒体基因组总长度存在差 看,马尾松毛虫、油松毛虫和赤松毛虫的信息素成分

异的主要原因(Wallace, 2007 )$不同物种间多聚T 结构、微卫星(AT) /单元及重复单元的长度具有差 异,其具体功能有待进一步研究$均包含顺5 ,反7-十二碳二烯醇(Z5 ,E7-12: 0H)、 顺5 ,反7-十二碳二烯乙酸酯(Z5 , E7-12 : OAc)和

顺5 ,反7-十二碳二烯丙酸酯(Z5 , E7-12: OPr),说 明这3种松毛虫亲缘关系较近,思茅松毛虫的信息 素成分包括 Z5 ,E7-12: OH 和 Z5 ,E7-12: OAc,由 此说明思茅松毛虫与马尾松毛虫和油松毛虫亲缘关

基于线粒体全基因组的最大似然法系统发育分 析结果表明,马尾松毛虫与油松毛虫亲缘关系相近,

思茅松毛虫和赤松毛虫的亲缘关系较近$关于松毛 虫属某些物种的亲缘关系和分类地位的争议颇多,

系较远$在序列比对相似度上,马尾松毛虫和油松 毛虫的全基因组和蛋白质编码基因序列的相似度分 别为98. 99%和98. %,而思茅松毛虫与其他物种

从形态特征、食性等结果看马尾松毛虫和油松毛虫 应为同一物种(赵清山等,1992);根据杂交遗传实 验的结果显示:马尾松毛虫与油松毛虫最容易进行 杂交,与赤松毛虫其次(赵清山等,1999 );根据 DNA指纹谱探讨松毛虫属不同物种间亲缘关系的

的相似度最高值为91. 85%,这也说明马尾松毛虫 和油松毛虫亲缘关系相近$综上所述,无论形态学、

遗传学、分子生物学还是化学生态学阐述的这4种

结果也显示,思茅松毛虫与赤松毛虫关系较近,油松 毛虫与马尾松毛虫关系较近(张爱兵等,2004 );从

松毛虫间的亲缘关系,均与本研究的结果一致或相 近$然而松毛虫属物种亲缘关系的争议在历史上颇

松毛虫属性信息素成分的研究(孔祥波等,2006)来 多,至今仍没有形成一致看法$鳞翅目蛾类不同科

第12期杜会聪等:马尾松毛虫线粒体全基因组的测定与分析171的其他物种构建系统发育树后显示的进化关系与王

camplete mitochondriai genome of catfish Kryptopterus vitreolus. Chinese Journai of Fisheries,31( 2) : 12- 19. 1 in Chinese ])菊平等%2017)构建的系统发育树结果相同$4结论王菊平,曹天文,张 越,等-2017.扬眉线峡蝶线粒体基因组全序

列测定和分析-昆虫学报,60( 8) : 950-961.(Wang J P,Cao T W,Zhang Y,e* al 2017. Sequencing and analysis of

本研究通过测定分析马尾松毛虫线粒体全基因 组序列的特征,确认其碱基组成、37个基因的排列

the camplete mitochondriai genome of Limenitic helmanni

(Lepidoptera; Nymphalidae ) - Acta Entomologica Sinica,60 ( 8 ):

顺序、蛋白质编码基因的起始密码子和终止密码子、

950-961. 1 in Chinese])tRNA二级结构及A+T富含区结构特征均为昆虫线 粒体全基因组的典型特征$表明其适合解决目、科、

张爱兵,孔祥波,李典谟,等-2004.中国松毛虫属八个种和亚种亲

缘关系的DNA指纹证据-昆虫学报,47( 2) : 236-242.(Zhang A B, Kong X B, Li D M, et al. 2004. DNA fingerprinting

属等高级阶元的系统发育问题$系统发育分析的结

evidencc for the phylogenetic relationship of eight species and 果显示,思茅松毛虫与赤松毛虫的亲缘关系较近,鳞

翅目蛾类不同科属物种间的亲缘关系与前人的研究

一致$当前动物线粒体基因组的测序在飞速增长, 但枯叶蛾科线粒体基因组全序列的数据还明显偏

少,后续需要进一步对该科其他物种进行线粒体基 因组测序及深入分析,从而构建更合理的枯叶蛾科

各阶元之间的进化关系$参考文献蔡邦华,侯陶谦,宋士美.1965.松毛虫种间杂交及杂种生物学的初

步4察.昆虫学报,14(4) : 347-359.% Cai B H, Hou T Q,Song S M. 1965. Preliminary observation on

interspecific hybridization and hybrid biology of pinr moth. Acta

Entomoigica Sinicc,14( 4) : 347-359. 1 io Chinese])陈志腾,杜予州.2016.昆虫线粒体基因组重排的研究进展.环境昆

虫学报,38(4) : 843-851.(Chen Z T, Du Y Z. 2016. Rearrangement of mitochondriai genome in

insects. Journai of Environmentai Entomology,38 ( 4 ) : 843 - 851.

1 in Chinese ])贾玉迪,孔祥波,张 真,等.2011.基于线粒体COT基因部分序列

分析4种松毛虫的亲缘关系.东北林业大学学报,39 (11 ): 1­

5.(Jia Y D, Kong X B,Zhang Z, et al. 2011. Taxonomic position of four

species of pine caterpiiar moths based on sequences analysis of COT

Gene. Journai of Northeasi Forestry Univvrsity, 39 ( 11) : 1-5. [ in

Chinese ])孔祥波,张 真,王鸿斌,等.2006.枯叶蛾昆虫性信息素的研究进

展. 林业科学, 42(6): 115-122.(Kong X B, ZhangZ, WangH B, et al 2006. Investigation on sex

pheromones io Lasiocampidae: Advance and prospect. Scientio Silvve Sinicae,42 ( 6) : 115- 122. 1 io Chinese])林爱丽,李欣欣,赵新成,等.2018.黑毛皮蠹线粒体基因组分析及

皮蠹科系统发育分析.昆虫学报,61(4) : 477-487.(Lin A L, Li X X,Zhao X C,et al. 2018. Analysis of the mitochondriai

genome of Attgenus unicolor japonicus ( Coleoptera: Dermestidae )

and a phylogenetic analysis of Dermestidae. Acta Entomologica Sinica,61 (4) : 477-487. 1 in Chinese])孙志鹏,吕伟华,匡友谊,等.2018.玻璃缺鳍a线粒体全基因组序

列测定与分析.水产学杂志,31(2): 12-19.(Sun Z P,Lii W H,Kuang Y Y,et al 2018. Sequencing and analysic ot

subspecies of Dendrolimus ( Lepidoptera; Lasiocampinae ) in China.

Acta Entomologica Sinica,47( 2) : 236-242. 1 in Chinese])张苏芳,张 真,孔祥波,等-2015.马尾松毛虫常灾区、偶灾区和无

灾区松针挥发物特征-林业科学,51(3) : 170-174.(Zhang S F, Zhang Z, Kong X B, et al 2015. Volatilo characters of

masson pine needles from Dendrolimus punctatus frequent outbreak

area,occasional outbreak area,and non-outbreak area. Scientio SioveSiniae, 51(3) : 170-174.1 in Chineee] )赵清山,e文波,吕国平,等-1992.松毛虫的杂交遗传试验•昆虫学

报,35( 1) : 29-32.(Zhao Q S,Wu W B, Lii G P,et al 1992. Hybridization experiments

with two species of Dendrolimus. Acta Entomologica Sinica,35( 1):

29-32. 1 in Chineee] )赵清山,e文波,吕国平,等-1999.松毛虫种间杂交及其遗传规律

的研究-林业科学,35(4) : 45-50.(Zhao Q S,Wu W B,Lii G P,et al. 1999. Study on cross heredity of

pine caterpiCars Dendrolimus spp. Scientio Silvve Sinicae, 35 ( 4 ): 45-50. 1 in Chineee] )周夏芝,王振兴,余 燕,等-2017.马尾松毛虫幼虫高峰期发生量

的预测模型研究.应用昆虫学报,54(6) : 1031-1043.(Zhou X Z, Wang Z X, Yu Y, et al 2017. Comparison of model for

forecasting peak abundancc of Dendrolimus punctatus larvve. Chinese oouenaooo Appoied Entomooogy, 54 ( 6 ) : 1031 - 1043. 1 in

Chineee] )Boore J L, 1999. Animal mitochondrial genomes. Nucleic AcidsResearch,27( 8) : 1767-1780.Boore J L, Lavrov D V, Brown W M. 1998. Gene translocation links

insects and crustaceans. Nature,392 ( 6677) : 667-668.Cameron S L, Lambkin C L, Barker S C, et al 2007. A mitochondrid

genome phyoogeny oo Diptea: whooe genome eequence data accueateoy eeeoove eeoationehipe ovee beoad timeecaoee with high

p eeci eion. Sy etematic Entomo oogy, 32( 1) : 40-59.Clara D 0,Wolstenholme D R. 1983. Genes for cvtochrome c oxidase

subunit I, URF2,and three tiNAs in DrosopPih mitochondrial

DNA. Nucleic AciCs Research, 11( 19) : 6859-6872.De Brujin M H L. 1983. DrosopPih melanogaster 1^0(:110160x1 DNA,

a novee oryanization and genetic cade. Nature, 304 ( 5923 ) : 234 - 241.Guindon S, Ga ecue o0. 2003. A eimpoe, oaet, and accueateaogoeithm to

eetimateoaegephyoogenieebymaiimum oikeoihood.MoecuoaeSyetemeBiooogy, 52( 5) : 696-704.

172Liu J H, Fu J Q, Yang LY, 林业科学et al. 2017. Complete mitochondrial genome

Mitochondrial genome characterization of 55卷Tecim solanmore

of Simao pine caterpillar moth, Dendrolimus kikuchii % Lepidopterr:

% Lepidopeera: Geeeah idae) and ieiphyeogeneeiareeaeionihip wieh

oehereepidopeeran inieaei.Gene, 581: 107-116.Lasiocampidae) and the related phylogenetic analysis. Mitochondrial

DNA Part B,2%2) : 611-612.Song S N , Tang P , Wei S J, et al. 2016. Comparative and phylooenetia

Kim I, Lee E M, SeoO KY, e* al. 2006. The mitochondrial genome of the

analysis of the mitochondrial genomes in basal hymenopterans. Scientifia Report, 6 : 20972.Koreen hairstreek , Coreana raphaelis % Lepidopterr: Lycaenidae ).

Insect Molecular BioOgy, 15 % 2) : 217-225.Tamura K, Stecher G, Peterson D, et al 2013. MEGA 6: molecular

Kim M J, Kim J S, Kim S S, genome of the pine moth et al. 2016. Complete mitochondrial

evolutionary genetics analysis version 6. 0. Molecular Biolooy and

Dendrolimus spectablis % Lepidoptera:

Evelution, 30% 12) : 2725 -2729.Lasiocampidae & . Mitochondrial DNA Part B , 1 % 1 & : 180- 181.Wallacc D C. 2007. Why do we still have a maternalo inherited

mitochondrial DNA? Insights from evolutionary medicine. Annual Kononov A, Ustycntsev K, Wang B D, et al. 2016. Genetia diversity

among eight Dendrolimus speciee in Eurasia % Lepidoptera:

Lasiocampidae & inferred from mitochondrial COI and COII, and nucleer ITS2 marker. BMC Genetici, 17% S3) : 173- 182.Qin J, Zhang Y Z, Zhou X, et ai. 2015. Mitochondrial phylooenomics and genetia relationship of closely related pine moth

% Lasiocampidae: Dendrolimus & species in China, using whole

mitochondrial genomes. BMC Genomics, 16% 1) : 428-439-Ramirez-Rios V, Franco-Sierra N D, Alverez J C, et ai 2016.

Reviewof Biochemistry, 76 : 781-821.Wang Q Q, Tang G H. 2017. Genomic and phylooenetic analysis of the

camplete mitochondrial DNA sequencc of walnut leef pest

PaleosepParim posticata % Coleoptera: Chrysomeloidea ). J Asia Pac

Entomol, 20%3) : 840 -853.(责任编辑朱乾坤)

因篇幅问题不能全部显示,请点此查看更多更全内容