< 鳀科(Engraulidae)鱼类DNA 条形码电子芯片研究 MathJax.Hub.Config({tex2jax: {inlineMath: [['$', '$'], ['\\(', '\\)']]}});
  渔业科学进展  2016, Vol. 37 Issue (6): 19-25  DOI: 10.11758/yykxjz.20151203001
0

引用本文 

柳淑芳, 李献儒, 李达, 庄志猛. 鳀科(Engraulidae)鱼类DNA 条形码电子芯片研究[J]. 渔业科学进展, 2016, 37(6): 19-25. DOI: 10.11758/yykxjz.20151203001.
LIU Shufang, LI Xianru, LI Da, ZHUANG Zhimeng. Development of DNA Barcode-Microarray for Identification of Engraulidae Fishes[J]. PROGRESS IN FISHERY SCIENCES, 2016, 37(6): 19-25. DOI: 10.11758/yykxjz.20151203001.

基金项目

山东省科技发展计划项目(2012GHY11531)、科技基础性工作专项(2013FY110700)和泰山学者建设工程专项经费共同资助

作者简介

柳淑芳,E-mail: liusf@ysfri.ac.cn

通讯作者

庄志猛,研究员. E-mail:zhuangzm@ysfri.ac.cn.

文章历史

收稿日期:2015-12-03
收修改稿日期:2015-12-30
鳀科(Engraulidae)鱼类DNA 条形码电子芯片研究
柳淑芳1,2, 李献儒1,4, 李达1,5, 庄志猛1,3     
1. 农业部海洋渔业可持续发展重点实验室 中国水产科学研究院黄海水产研究所 青岛 266071;
2. 青岛海洋科学与技术国家实验室 海洋渔业科学与食物产出过程功能实验室 青岛 266071;
3. 青岛海洋科学与技术国家实验室 海洋生物学与生物技术功能实验室 青岛 266071;
4. 大连海洋大学水产与生命学院 大连 116023;
5. 上海海洋大学水产与生命学院 上海 201306
摘要: 本研究将基于线粒体COI部分序列的DNA条形码和DNA芯片技术相结合,以鳀科11属30种鱼类为研究对象,在比对分析其DNA条形码序列的基础上,利用软件Oligo Array 2.1筛选探针,经OligoCalc 优化探针,去除易形成发夹(Hairpin)、茎环(Stem-loop)及自身二聚体结构(Homo- dimers)的探针,再利用Oligo heat map对探针与靶标序列进行虚拟杂交,共有14个物种的24条探针能与靶标序列特异性结合。利用DNA条形码芯片技术能将14个物种鉴定到种,虽然物种识别能力仅占总物种数的46.7%,但鉴定准确率可达100%。因此,基于COI基因的DNA芯片技术对鳀科鱼类物种鉴定有一定的实用价值,但该技术对物种的识别能力尚有较大提升空间,通过筛选和优化得到高质量的分子探针则是突破该项技术的关键。
关键词: 鳀科    DNA条形码    探针    DNA芯片    电子杂交    
Development of DNA Barcode-Microarray for Identification of Engraulidae Fishes
LIU Shufang1,2, LI Xianru1,4, LI Da1,5, ZHUANG Zhimeng1,3     
1. Key Laboratory of Sustainable Development of Marine Fisheries, Ministry of Agriculture, Yellow Sea Fisheries Research Institute, Chinese Academy of Fishery Sciences, Qingdao 266071 ;
2. Laboratory for Marine Fisheries Science and Food Production Processes, Qingdao National Laboratory for Marine Science and Technology, Qingdao 266071 ;
3. Laboratory for Marine Biology and Biotechnology, Qingdao National Laboratory for Marine Science and Technology, Qingdao 266071 ;
4. College of Fisheries and Life Science, Dalian Ocean University, Dalian 116023 ;
5. College of Fisheries and Life Science, Shanghai Ocean University, Shanghai 201306
Corresponding author: ZHUANG Zhimeng. E-mail:zhuangzm@ysfri.ac.cn.
Abstract: Species identification plays a key role in the protection of biodiversity. However, there have been great challenges in traditional morphological identification because of its innate limitations and the lack of experienced techniques. Recently thanks to the development of molecular biology, DNA-based identification is becoming a more accurate alternative method. The cytochrome oxidase I (COI) barcode is a short piece of DNA from a standard region of the mitochondrial genome, which can be used to identify and classify different species and has been proved to be highly effective in many species including fish. The advantage of COI is that it is long enough to identify variations among species yet short enough to be sequenced quickly at low cost. In this study, we analyzed DNA barcoding of Engraulidae species in order to explore the feasibility of DNA microarray technology in species identification. Oligonucleotide probes were designed based on the COI sequences of mitochondrial obtained from 101 individuals of 30 fish species in 11 genera. Forty-six specific probes obtained from 24 species were selected with online software Oligo Array 2.1, among which the probes potentially forming hairpin, stem-loop, or homo-dimers were identified with Oligonucleotide Properties Calculator and excluded. The remaining probes were virtually hybridized with the target sequences in Oligo Heat Map (OHM), and subsequently a total of 26 probes from 16 species bound to the target sequences specifically. The DNA microarray technology identified 14 species, accounting for 46.7% of the total with 100% accuracy. Therefore, DNA microarray based on COI sequences should have practical values in the identification of Engraulidae fish species. Nevertheless, this technique needs further improvement and the key step would be screening and optimization of high quality molecular probes.
Key words: Engraulidae    DNA barcode    Probe    DNA Microarray    Electric hybridization    

作为生物多样性保护的重要组成部分,物种的快速分类鉴定至关重要。形态学鉴定的局限性和不断缩减的形态分类学家队伍,使分类学的发展面临巨大的挑战。基于DNA条形码技术的分类系统是分类学中辅助物种鉴定的新技术(Austerlitz et al,2009),其原理为选择不同物种的一段同源DNA序列,通过序列比对和聚类分析,将物种鉴定为已知种或发现新物种(Xiao et al,2004; Moritz et al,2004)。Hebert等(2003)通过DNA条形码技术成功区分了鳞翅目200个物种,认为以COI序列为基础的DNA条形码系统具有可靠、廉价、易推广等特点,并提出利用该技术进行生物分类鉴定的设想。随后,该团队又对260种北美鸟类进行了DNA条形码分析,发现种间差异约为种内差异的18倍,并成功将鸟类鉴定到种(Hebert et al,2004)。Ward等(2005)利用DNA条形码技术对澳大利亚207种海洋鱼类进行分类,发现所有鱼类都能被成功区分,认为该技术可应用于鱼类的分类鉴定。鉴于DNA条形码在物种鉴别上的广泛尝试和应用,2007年,加拿大正式筹建了国际生命条形码数据库系统(Barcode of Life Data Systems,BOLD)。2008年,我国成为iBOL四个中心节点之一。全球鱼类DNA条形码计划(Fish Barcode of Life Initiative,FISH-BOL)始于2004年,我国相关单位也积极参与其中,鱼类DNA条形码数据库不断得到扩充。本团队也陆续开发了一批近海鱼类、头足类等渔业生物的DNA条形码(柳淑芳等,2010; 王鹤等,2011),并结合形态学分类结果探讨了DNA条形码在渔业生物分类鉴定上的可行性。

目前,国内外关于DNA条形码的研究仍然集中在积累数据,进而充实数据库。本研究尝试将DNA条形码与DNA芯片结合起来,以期利用DNA芯片的高通量、重复性好、操作性强等优点弥补DNA条形码需要测序、繁琐费时的不足。目前,开发了用于多种细菌病原体检测的特异性DNA芯片(Schena et al,1998; Kozal et al,1996; Dudda-Subramanya et al,2003; Santini et al,1999),但鲜见将该技术应用到渔业生物分类鉴定的研究报道。鳀科(Engraulidae)鱼类隶属于硬骨鱼纲(Osteichthyes)、辐鳍亚纲(Actinopterygii)、鲱形目(Clupeiformes),为世界海洋渔业最主要的类群之一,其总产量在各科鱼类中位居世界第3位。例如,日本鳀(Engraulis japonicus)既是日本、朝鲜、俄罗斯和中国在西太平洋远东海洋渔业中的重要捕捞对象,也是海洋掠食者的重要饵料生物。我国的日本鳀资源量曾高达300万t(张世义,2001),是我国海洋渔业资源的重要组成部分(刘瑞玉,2008)。全世界的鳀科鱼类约16属139种(Whitehead et al,1988),我国分布有7属24种(张世义,2001)。本研究综合运用多种分子生物学软件,在鳀科鱼类物种DNA条形码的基础上筛选特异性分子探针,并探讨其在DNA电子芯片杂交中的有效性。

1 材料与方法 1.1 实验材料

本研究样本来自中国水产科学研究院黄海水产研究所渔业生物样本库,主要采自我国黄海、东海。参考《中国鱼类系统检索》、《鱼类分类学》(成庆泰等,1987; 孟庆闻等,1995)进行形态学分类鉴定。鳀科鱼类样品共计37份,初步鉴定为5种(表 1)。参考FishBase(http://fishbase.org/)和综合分类学信息系统(Integrated Taxonomic Information System,ITIS)对物种的有效名以及分类地位进行确定。对每个样本拍照记录,取背部肌肉组织用于DNA提取。

1.2 DNA提取、PCR扩增及测序

采用酚-氯仿法提取DNA(Maniatis et al,1985),-20℃保存备用。PCR扩增采用DNA条形码通用引物(Ward et al,2005),由华大基因公司合成。引物序列为:F1(TCA ACC AAC CAC AAA GAC ATT GGC AC);F2(TCG ACT AAT CAT AAA GAT ATC GGC AC);R1(TAG ACT TCT GGG TGG CCA AAG AAT CA);R2(ACT TCA GGG TGA CCG AAG AAT CAG AA)。PCR反应总体积为25 μl,10×缓冲液成分为100 mmol/L Tris-HCl(pH=8.0)、500 mmol/L KCl、15 mmol/L MgCl2、0.1%明胶,dNTPs终浓度为200 μmol/L,各引物终浓度为1.0 μmol/L,Taq聚合酶0.125 U,总DNA量为50 ng。采用升式PCR,反应程序为:94℃ 3 min;94℃ 30 s,53℃ 30 s,72℃ 40 s,8个循环;94℃ 30 s,54℃ 30 s,72℃ 40 s,8个循环;94℃ 30 s,55℃ 30 s,72℃ 40 s,16循环;72℃ 10 min。每次PCR反应设立不含DNA模板的空白对照。

阳性PCR产物送至华大基因公司采用ABI PRISMTM3730XL DNA Analyzer DNA测序仪进行序列测定,用PCR扩增引物作为测序引物进行双向测序。

1.3 公共序列信息下载与筛选

从GenBank下载与本研究扩增区段一致的鳀科鱼类COI基因序列,通过BOLD数据库对下载序列进行准确性验证,同时在Fishbase中检验种名的有效性,最终从公共数据库中筛选出11属25种鳀科鱼类的64条序列,与本研究获取的5种鳀科鱼类37条序列合并为11属30种101条COI基因序列。相关信息见表 1

表 1 30 种鳀科鱼类COI基本信息 Table 1 Information of COI genes of 30 Engraulidae species
1.4 序列分析 1.4.1 建立本地Blast数据库

鳀科所有COI基因序列整合成序列文件seq.fasta,建立本地Blast数据库,将序列文件seq.fasta格式化,输出文件seq.fasta. nsq,用于搜索靶标序列和Blast数据库中所有序列的相似性,评估探针的特异性。

1.4.2 筛选探针

鳀科的11属30种101条序列为数据集1。利用软件Oligo Array 2.1为数据集分别筛选探针,输入序列为鳀科的序列文件及格式化文件。设置参数为:探针长度23-27 bp,Tm值70-82℃,GC含量40%-55%,Na+和DNA浓度分别为1 mol/L和1 μmol/L,形成二级结构的最大Tm值和交叉杂交最小Tm值为65℃,2个探针间距离为25 bp,最大探针数为5,连续出现的单一碱基数不超过4个(如AAAA)。

1.4.3 物种特异性探针的筛选

本研究中使用NCBI-blast-2.2.24-win32.exe、Oligo Array 2.1和Oligo Array Aux 3.8软件筛选属级特异性及物种特异性探针。选取的标准是该探针为该属或物种所特有且与其他物种序列无同源性。所得探针在OligoCalc在线软件(http://www.simgene.com/OligoCalc)中优化,排除易形成发夹、茎环及自身二聚体结构的不合格探针。设定探针序列自身不存在大于5个碱基的互补配对,和大于4个碱基的反向互补配对。

1.4.4 探针与靶标序列虚拟杂交

各数据集序列利用ClustalX比对切齐。优化后的物种特异性探针与切齐序列在Oligo heat map(OHM)在线软件(http://bioinfo.unice.fr/softwares/ohm/)进行虚拟杂交,查看杂交结果。若探针能且只与其所代表物种的靶标序列结合,则此探针可作为代表物种的鉴别探针;若探针不能与其靶标序列结合,或者与其靶标序列结合的同时还能与其他物种的非靶标序列结合,这两种情况下的探针均不能作为物种的鉴别探针。

2 结果与分析 2.1 鳀科鱼类DNA条形码信息

通过对鳀科的11属30种101条COI基因序列进行比对,保留共有序列615 bp用于DNA条形码分析。结果显示,30种鳀科鱼类的DNA条形码序列的平均碱基组成为A(24.2%)、T(28.4%)、C(28.2%)和G(19.2%),可见碱基组成表现出明显的偏倚性,A+T含量(52.6%)高于G+C含量(47.4%)。所分析序列核苷酸位点中保守位点501个,变异位点114个,其中,转换位点70个,颠换位点44个。87%的转换和98%的颠换发生在第3密码子位点;第2密码子位点最稳定,没有转换和颠换。

依据K2P模型计算30种鳀科鱼类的种内和种间遗传距离。结果显示,种内平均遗传距离为0.004,种间平均遗传距离为0.146,种间与种内平均遗传距离比为37;仅有日本鳀和新西兰鳀(Engraulis australis)2个物种的种间/种内遗传距离比为2.3;其他物种均符合Hebert等(2004)提出的“10×规则”。

采用邻接法对30种鳀科鱼类的COI条形码序列构建分子系统进化树,可以看出,鳀科30种鱼类均聚类成独立的分支,且具有较高支持度,各物种均能得到有效区分,表明COI基因作为DNA条形码用于鳀科物种分类鉴定是可行的。

2.2 鳀科物种探针信息及杂交结果

鳀科30个物种通过Oligo Array 2.1进行第1轮筛选,得到24个物种的46条特异性探针;通过OligoCalc检验去除20条不合格探针,第2轮得到16个物种的26条探针(表 2)。第3轮筛选,利用Oligo heat map(OHM)将探针与鳀科物种COI基因序列虚拟电子杂交,杂交结果如图 1所示,TZ53为银鳀的探针,但它并没有与银鳀的靶标序列杂交,探针灵敏性不强。新西兰鳀的探针TZ52不仅与新西兰鳀的序列杂交,还与新日本鳀、欧洲鳀、银鳀的序列杂交,TZ71为印度洋鲚的探针,还能与黄吻棱鳀的序列结合。上述2条探针在于其靶标序列结合的同时还能与其他非靶标序列结合,探针特异性不强,故不能作为对应物种的特异性探针。其余14个物种的24条探针均能且只能与靶标序列特异性结合,均可以作为对应物种的鉴别探针。因此,本研究对30种鳀科鱼类的COI基因探针进行3轮筛选,最终获得24条特异性探针,这些探针可以准确、特异地检测出14种鳀科鱼类。虽然这批探针对鳀科鱼类的检测效率仅为46.7%(14/30),但对杂交成功的物种的鉴定准确率可达100%。

表 2 鳀科物种24条特异性探针编号及序列 Table 2 IDs and sequences of 24 probes of Engraulidae species
图 1 鳀科鱼类DNA条形码电子杂交 Figure 1 Electronic hybridization of DNA barcoding of Engraulidae species
3 讨论

本研究利用在线软件筛选鳀科鱼类DNA条形码探针,经过两轮筛选优化后将探针与鳀科鱼类COI基因序列进行虚拟电子杂交,整个技术流程与实物DNA芯片大致相同,包括探针的筛选、芯片的杂交和实验结果的统计分析3个步骤。作为流程的第1步,探针筛选的质量高低直接影响最终实验结果,准确的探针是芯片实验成功的必要条件(Hanharan et al,2003)。探针的筛选主要有三方面的要求:同一性、灵敏性、特异性。由于探针均为在相同的条件下与靶标序列结合,所以探针要有相似的特征,即探针的同一性(包括探针长度、熔解温度、GC含量等);探针能与其靶标序列杂交即探针的灵敏性;探针不能与其他物种的序列杂交即探针的特异性。寡核苷酸芯片探针的筛选需要复杂的生物信息学信息分析,因此,易于应用的探针设计软件非常重要(Li et al,2006)。Oligo Array 2.1是在基因组水平上为寡核苷酸芯片的建立筛选探针的免费软件(Rouillard et al,2003)。该软件筛选探针基于三个标准:一是寡核苷酸探针的熔解温度,二是探针对靶标序列的特异性,三是在杂交温度下探针不能形成稳定的二级结构。本研究利用Oligo Array 2.1对鳀科11属30种鱼类筛选特异性探针,共筛选出24个物种的46条探针,占所选物种数的80.0%。未能筛选出有效探针的物种主要是因其DNA序列设计探针的区段与其他物种的相似性较高,导致与其他序列共享探针,这种情况下的探针不具有物种特异性。可见,物种间的同源性高,序列相似度高,会影响到探针的筛选。Trewick(2008)通过对新西兰特有属Sigaus进行条形码分析,发现两种在形态学上具有明显差异的物种却拥有相同的mtDNA单倍型,这种情况也无法成功筛选出物种特异性探针。

严格的探针筛选会大大降低探针的获取数量,甚至一些物种无法获得物种特异性探针,但这样筛选可增加探针的准确性、灵敏性和实用性。筛选出的探针必须能与靶标序列结合,即探针的灵敏性要强。探针本身如果形成发夹、茎环及自身二聚体等结构,则会影响其与靶标序列的结合,灵敏性降低。OligoCalc是用来获得单链和双链DNA或RNA序列性质的在线软件,这些性质包括熔解温度、序列分子量、GC含量以及光吸收系数等。本研究利用OligoCalc对筛选出的46条探针进行进一步筛选,去除易形成发夹、茎环及自身二聚体的探针,最后剩余16个种的26条探针,占所选物种数的比例下降到53.3%。

探针筛选是为了检验探针能否与靶标序列结合,进而达到物种鉴定的目的。OHM是用来评估和显示寡核苷酸探针与DNA序列杂交的在线工具(Croce et al,2008)。本研究将筛选优化后的16个种共26条探针与靶标序列在OHM中虚拟杂交,最后有14个物种的24条探针可与其靶标序列特异性杂交,可以作为物种的特异性鉴别探针。经过三轮筛选得到可用DNA芯片技术鉴别的物种数占总物种的46.7%,虽然检测效率不高,但探针的特异性强。Kochzius等(2010)利用DNA条形码和芯片技术对50种欧洲海洋鱼类进行分类分析,结果只能鉴定出10%的物种。可见,DNA条形码和芯片技术结合对物种的识别能力尚有较大提升空间。如果在保证探针质量的前提下增加有效探针的数量,或者根据DNA条形码序列在不同区段设计多个探针同时与靶基因杂交,则有望大大提高DNA条形码芯片技术对物种的识别能力。因此,突破DNA条形码电子芯片技术的关键是如何筛选和优化获得高质量的分子探针。

参考文献
王鹤, 林琳, 柳淑芳, 等. 中国近海习见头足类DNA条形码及其分子系统进化. 中国水产科学 , 2011, 18 (2) : 245-255
成庆泰, 郑葆珊. 中国鱼类系统检索. 北京: 科学出版社, 1987 .
刘瑞玉. 中国海洋生物名录. 北京: 科学出版社, 2008 : 913 -916.
张世义. 中国动物志硬骨鱼纲(鲟形目、海鲢目、鲱形目、鼠鱚目). 北京: 科学出版社, 2001 : 119 -156.
孟庆闻, 苏锦祥, 缪学祖. 鱼类分类学. 北京: 中国农业出版社, 1995 : 153 -172.
柳淑芳, 陈亮亮, 戴芳群, 等. 基于线粒体COI基因的DNA条形码在石首鱼科(Sciaenidae)鱼类系统分类中的应用. 海洋与湖沼 , 2010, 41 (2) : 223-232
Austerlitz F, David O, Schaeffer B, et al. DNA barcode analysis: a comparison of phylogenetic and statistical classification methods. BMC Bioinformatics , 2009, 10 (S14) : 296-300
Croce O, Chevenet F, Christen R. OligoHeatMap (OHM): an online tool to estimate and display hybridizations of oligonucleotides onto DNA sequences. Nucleic Acids Res , 2008, 36 : 154-156 DOI:10.1093/nar/gkn221
Dudda-Subramanya R, Lucchese G, Kanduc D, et al. Clinical applications of DNA microarray analysis. J Exp Ther Oncol , 2003, 3 (6) : 297-304 DOI:10.1111/jet.2003.3.issue-6
Hanharan R. The analysis of microarray data. Pharmacogenomics , 2003, 4 (4) : 477-497 DOI:10.1517/phgs.4.4.477.22744
Hebert PDN, Cywinska A, Ball SL. Biological identifications through DNA barcodes. Proc R Soc Lond B Biol Sci , 2003, 270 (1512) : 313-321 DOI:10.1098/rspb.2002.2218
Hebert PDN, Stoeckle MY, Zemlak TS, et al. Identification of birds through DNA barcodes. PLoS Biol , 2004, 2 (10) : 1657-1663
Kochzius M, Seidel C, Antoniou A, et al. Identifying fishes through DNA barcodes and microarrays. PLoS One , 2010, 5 (9) : 1-15
Kozal MJ, Shah N, Shen N, et al. Extensive polymorphisms observed in HIV-1 clade B protease gene using high-density oligonucleotide arrays. Nat Med , 1996, 2 (7) : 753-759 DOI:10.1038/nm0796-753
Li WJ, Ying XM. Mprobe 2. 0 computer-aided probe design for oligonucleotide microarray. Appl Bioinformatics , 2006, 5 (3) : 181-186
Moritz C, Cicero C. DNA barcoding: promise and pitfalls. PLoS Biol , 2004, 2 (10) : 1529-1531
Maniatis T, Fritsch EF, Sambrook J. Molecular cloning: A laboratory manual. Acta Biotechnol , 1985, 5 (1) : 104 DOI:10.1002/(ISSN)1521-3846
Rouillard JM, Zuker M, Gulari E. Oligo Array 2. 0: design of oligonucleotide probes for DNA microarrays using a thermodynamic approach. Nucleic Acids Res , 2003, 31 (12) : 3057-3062
Santini JT, Cima MJ, Langer R. A controlled-release microchip. Nature , 1999, 397 (6717) : 335-338 DOI:10.1038/16898
Schena M, Heller RA, Theriault TP, et al. Microarray: biotechnology's discovery platform for functional genomics. Trends Biotechnol , 1998, 16 (7) : 301-306 DOI:10.1016/S0167-7799(98)01219-0
Trewick SA. DNA barcoding is not enough: mismatch of taxonomy and genealogy in New Zealand grasshoppers (Orthoptera: Acrididae). Cladistics , 2008, 24 (2) : 240-254 DOI:10.1111/j.1096-0031.2007.00174.x
Ward RD, Zemlak TS, Innes BH, et al. DNA barcoding Australia’s fish species. Philos Trans R Soc Lond B Biol Sci , 2005, 360 (1462) : 1847-1857 DOI:10.1098/rstb.2005.1716
Whitehead PJP, Nelsonand GJ, Wongratana T. FAO species catalogue. Vol 7. Clupeoid fishes of the world (Suborder Clupeoidei). An annotated and illustrated catalogue of the herrings, sardines, pilchards, sprats, shads, anchovies and wolf-herrings. Part 2-Engraulididae. FAO Fish Synop , 1988, 125 (7/2) : 305-579
Xiao JH, Xiao H, Huang DW. DNA barcoding: new approach of biological taxonomy. Acta Zool Sin , 2004, 50 (5) : 852-855