2. 中国水产科学研究院黄海水产研究所 青岛海洋科学与技术试点国家实验室海洋渔业科学与食物产出过程功能实验室 山东 青岛 266071
2. Yellow Sea Fisheries Research Institute, Chinese Academy of Fishery Sciences; Laboratory for Marine Fisheries Science and Food Production Processes, Pilot National Laboratory of Marine Science and Technology (Qingdao), Qingdao, Shandong 266071, China
环境DNA宏条形码技术(environmental DNA metabarcoding)可以通过高通量测序对环境DNA (eDNA)进行多物种分类鉴定。随着eDNA宏条形码技术的应用和发展,该技术对群落中单一或组合物种的定量评估逐渐显现出优势。无论是水族箱或中观实验等小型生态系统(Minamoto et al; Moyer et al, 2014; Pilliod et al, 2013; Thomsen et al, 2012; Doi et al, 2017),还是江河湖泊等自然淡水系统(Doi et al, 2017; Lacoursiereroussel et al, 2016),甚至是开放式的海洋系统(Jo et al, 2017),研究人员都尝试过使用eDNA宏条形码技术测算种群相对数量。大量研究表明,特定环境中物种的个体数量和基于eDNA宏条形码技术获得的高通量测序reads数之间具有明显的相关性。Evans等(2016)设计了一个包含鱼类和两栖类的中观实验,证明水体中物种个体数或生物量相对丰度与eDNA宏条形码技术获得的高通量测序reads数呈正相关;Hanfling等(2016)对比较了一个天然湖泊的长期监测鱼类丰度结果与eDNA宏条形码技术得到的高通量测序reads数之间的相关性,结果表明二者呈正相关;Thomsen等(2016)研究发现,当将鱼类的eDNA高通量测序reads数聚类到“科”的分类等级时,eDNA宏条形码技术测得的深海生境中的生物量与传统拖网捕捞数据比较吻合。可以预见,eDNA宏条形码技术具有快速测算群落中物种丰度的潜能,将成为资源保护和管理中具有应用前景的调查工具。
然而,通过对已发表的相关文献进行梳理和归纳,发现当前大多数利用eDNA高通量测序结果的reads数来评估自然环境中生物相对数量的研究并不能得到明确的量化关系结果(Lim et al, 2016)。究其原因,是因为从生物到eDNA以及从eDNA再到高通量测序结果的2个过程中的数学关系难以理清。其中,实验室操作过程中的主要问题是:(1)自然水体中,不同浓度eDNA富集效率不同(Kelly et al, 2016);(2)PCR扩增过程中,通用引物对不同物种DNA存在偏倚性(Elbrecht et al, 2015; Pinol et al, 2015)。假定水体中的eDNA全部回收,且PCR扩增时不存在引物偏倚性,这种理想状态下的水体中eDNA组成与其高通量测序reads数是否完全呈线性关系?为了探究这个问题,本研究在实验室可控条件下,选择2个同属近缘种,对其DNA样品进行不同比例混合,模拟从自然水体中富集到的eDNA复合样品,既保证了样品的回收率,又降低了引物偏倚的干扰。以此为模板,探究eDNA宏条形码技术检测种群相对数量的准确性,旨在为验证eDNA宏条形码技术监测水生生物资源量的可行性提供直接证据。
1 材料与方法 1.1 实验方案设计 1.1.1 实验样品的选择鉴于通用引物对不同物种的扩增效率有所不同,本研究实验样品选取2个同属近缘物种用于制备模拟eDNA样品,以确保将PCR过程中因引物对物种DNA的偏移引起的实验误差降低到最小程度。
实验样品选择了2种常见对虾:凡纳滨对虾(Penaeus vannamei)和墨吉对虾(Penaeus merguiensis),它们同为节肢动物门(Arthropoda)、软甲纲(Malacostraca)、十足目(Decapoda)、对虾科(Penaeidae)、对虾属(Penaeus),是较为常见的同属近缘种。
1.1.2 模板DNA的提取采用传统的酚–氯仿–异戊醇方法分别提取2种对虾肌肉组织DNA,经纯化后使用超微量核酸蛋白分析仪(GE,美国)检测浓度,稀释DNA浓度至20 ng/μL (±1%),–20℃保存备用。
1.1.3 模拟eDNA的制备人工模拟eDNA复合样品,共设7个实验组:将凡纳滨对虾和墨吉对虾的DNA模板分别按照1∶1、1∶2、1∶4、1∶8、1∶10、1∶50和1∶100的比例均匀混合,且混合后DNA终浓度一致。设阳性对照2组:分别选用凡纳滨对虾和墨吉对虾DNA样品。设阴性对照1组:用纯水代替DNA样品。每组样品设3个重复。
将上述制备的eDNA复合样品作为eDNA宏条形码检测的模板DNA。
1.2 通用引物的选取考虑到后续高通量测序及DNA条形码数据库信息资源的丰富度,本研究选取了Leray等(2013)推荐的长度为313 bp的线粒体COⅠ基因序列作为待测eDNA目标片段,该片段长度适中、数据资源丰富、物种鉴定特异性好,且引物通用性强。通用引物序列见表 1,由华大基因有限公司合成。
PCR扩增体系:2×Rapid Taq Master Mix (Vazyme) 25 μL,上下游引物(mlCOⅠintF/jgHCO2198) (10 mmol/L)各2 μL,DNA模板5 μL,无菌水补齐总体积至50 μL。
为了增强扩增特异性,使用Touch down PCR反应程序:95℃预变性10 min;95℃变性30 s,62℃退火30 s,72℃延伸30 s,16个循环;95℃变性30 s,50℃退火30 s,72℃延伸30 s,25个循环;72℃延伸3 min;4℃保存。
用1%琼脂糖凝胶电泳检测PCR产物质量,选用DL2000 DNA marker,目标条带约为300 bp。挑选电泳条带单一且明亮的PCR产物用于高通量测序。
1.4 测序及结果注释将所得PCR产物送至青岛欧易生物科技有限公司,进行高通量测序。采用Illumina Miseq平台测序。
按照97%相似性对非重复序列(不含单序列)进行OTU(operational taxonomic units)聚类,在聚类过程中去除嵌合体(chimera,融合了2个不同序列信息的序列)、异源双链序列等干扰序列,得到OTU聚类结果,然后对不同OTU的代表序列进行结果注释。在结果注释时,参照NCBI公共数据库(https://www.ncbi.nlm.nih.gov/)来进行分类学信息的标注,同时使用中国重要渔业生物DNA条形码信息平台(http://www.fisherybarcode.cn)对注释结果进行辅助校正。
1.5 数据处理统计每个样品高通量测序的原始reads数,以所有样本中reads数最低值为基准,进行抽平,使每个样品测序结果的reads数相同,用于后续数据分析。
在推导数学关系时,设:eDNA样品来自2个物种,分别为A、B;实际参与PCR反应的底物模板DNA的量为n;参与PCR反应的底物模板DNA理论量为x;每个循环中,参与扩增的2个物种底物模板DNA比率为λ;扩增的循环数为c;PCR产物的高通量测序reads数为y。假定理想情况为:在PCR扩增的不同循环中,参与扩增的2个物种底物模板DNA比率固定;PCR扩增全程都保持底数为2的指数增长型(反应物足够),则高通量测序reads数可以反应eDNA样品中2个物种的相对量,即推得公式(1):
$\frac{{{y_A}}}{{{y_B}}} = \frac{{{2^c} \times {n_A}}}{{{2^c} \times {n_B}}} = {\lambda ^c} \times \frac{{{x_A}}}{{{x_B}}}$ | (1) |
经变形得公式(2):
$y = {\lambda ^c} \cdot x$ | (2) |
以人工模拟的7组eDNA复合样品及对照组样品为模板,使用eDNA宏条形码通用引物进行PCR扩增,经1%琼脂糖凝胶电泳检测,结果显示,阳性对照和7个实验组均成功扩增出300 bp左右的目标片段,阴性对照无扩增产物(图 1)。
本研究对7个实验组共21个PCR产物进行了高通量测序。统计高通量测序获得的序列长度分布,显示99.80%以上序列的长度分布于301~350 bp之间(图 2)。抽平后共计获得有效序列674, 205条,序列平均长度为312.41 bp。
将每个样品reads总数抽平后,对674, 205条序列进行分类学信息注释,保留有效序列(序列长度在301~350之间,且分类学信息注释结果是墨吉对虾和凡纳滨对虾)的reads。各实验组高通量测序reads数及其分类注释结果详见表 2。实验组Ⅰ的3组平行样共获得94, 774条序列,每个样品注释出的墨吉对虾和凡纳滨对虾平均reads数分别为11, 097和20, 494,二者的比值为13/24;实验组Ⅱ的3组平行样共获得95, 208条序列,二者reads数比值为18/23;实验组Ⅲ的3组平行样共获得95, 572条序列,二者reads数比值为77/73;实验组Ⅳ的3组平行样共获得95, 250条序列,二者reads数比值为67/44;实验组Ⅴ的3组平行样共获得94, 408条序列,二者reads数比值为43/24;实验组Ⅵ的3组平行样共获得94, 640条序列,二者reads数比值为127/35;实验组Ⅶ的3组平行样共获得95, 526条序列,二者reads数比值为187/23。
当模板中2个物种DNA浓度比例为1∶1 (墨吉对虾/凡纳滨对虾)时,2个物种的模板DNA含量相同,扩增过程中主要是引物对不同底物的偏好引起的扩增产物差别,此时主要是引物偏倚引起的reads数差距。根据公式(2)变形得:
${\rm{ \mathit{ λ} }} = \sqrt[c]{{\frac{y}{x}}}$ | (3) |
代入扩增循环数,由reads平均数比值,计算得到每个循环中参与反应的2个物种模板DNA的平均比率为66/67,换言之,PCR扩增的每个循环中,平均偏倚率为1/67,约为1.5%,即该引物在同一PCR体系中,每次退火过程对墨吉对虾DNA模板的结合率比凡纳滨对虾DNA模板大约少1.5%。
2.2.4 eDNA组成与高通量测序reads数的函数关系以各实验组设置的底物中墨吉对虾DNA与凡纳滨对虾DNA的比值为横坐标,以各实验组样品高通量测序结果注释的墨吉对虾与凡纳滨对虾reads平均数的比值为纵坐标,绘制eDNA组成与高通量测序reads数的函数关系图。在公式(2)的前提假设条件下,在高通量结果中,2种对虾的reads数之比和初始PCR模板DNA中2种对虾的DNA比例应呈现y=kx线性关系,对表 2中的7个实验组的reads平均数比值和PCR模板DNA比值的2组数据进行一元线性回归分析,最终得出eDNA组成与高通量测序reads数的函数关系:y=0.0716x+0.7043 (r2=0.9824)(图 3)。
利用eDNA宏条形码技术来评估水体中不同物种的相对数量,是该技术最具潜力的应用前景之一。与传统调查方法相比,eDNA宏条形码技术具有操作简便、省时高效且对自然资源破坏小等特点。如何使用该技术来监测水体中的生物量,一直是学界关注的焦点,但水体中的eDNA难以完全富集,且富集到的eDNA成分复杂;PCR扩增时,引物对不同种类DNA模板的偏好还会导致扩增效率不同,这些问题亦是eDNA宏条形码技术推广应用的最大障碍。为运用eDNA宏条形码技术检测环境生物相对数量而设计的中观实验,大都是在尝试推导生物量与高通量测序结果reads数的数学关系,主要包括环境中生物量与eDNA量、环境中eDNA量与提取的eDNA量和提取的eDNA模板与PCR产物的高通量测序结果等3个对应关系,其中任何一个关系不明确,都将影响eDNA宏条形码技术的检测结果,所以,必须逐步理清这3种对应关系的函数关系,进而得到“高鲁棒性”(模式体系固定且成熟,效果准确且稳定)的eDNA宏条形码方法应用体系。
分解困难是解决问题的有效方法之一,剖析DNA宏条形码技术全过程,当只关注富集到的eDNA扩增及测序时,如果能创造一种eDNA成分简单、无引物偏好影响的理想条件,进而探索eDNA高通量测序reads数和底物eDNA含量之间的数学关系,便可以收获“柳暗花明”的结果。
3.1 混合模板PCR扩增的引物偏倚性影响多物种eDNA混合模板PCR扩增效率的主要原因之一,便是PCR过程中引物对不同模板DNA碱基组成存在偏好性(Kanagawa, 2003)。理论上,引物的每个脱氧核苷酸和模板DNA链上同源区段的每个脱氧核苷酸可以实现一一对应的关系,但实践过程中通常难以实现,任何一个错配位点的出现都会导致相应的扩增效率降低,从而减少产物。为此,通用引物中加入了简并碱基以降低错配的影响。然而,在进行复杂模板的PCR扩增时,即使使用含简并碱基的通用引物,引物结合能力也会因为不同模板DNA引物结合区段序列的GC碱基含量高低而不同(Acinas et al, 2005),GC含量高的引物结合力较强(Fonseca, 2018)。为了提高模板DNA引物结合区段碱基组成的一致性,从而降低引物偏倚的影响,本研究选择较为常见的同属近缘种凡纳滨对虾和墨吉对虾作为实验对象。同时,基于基因的进化速率及其数据库信息的丰富程度等因素,决定以mtDNA中的COⅠ基因片段作为检测的目的基因。
通过控制上述引物偏好的条件,最终高通量测序结果中引物的偏倚程度如何。研究分析发现,当eDNA模板中凡纳滨对虾和墨吉对虾DNA组成比例为1∶1时,高通量测序获得对应物种reads数比例为13/24。根据扩增循环数和公式(2),推导此时参与扩增的2种DNA比约为66/67,即PCR扩增的平均偏倚率为1/67,约1.5%。可见选择凡纳滨对虾和墨吉对虾制备简单eDNA混合模板产生的引物偏倚程度影响较小,符合最初的实验设计预期。此时,2个物种的模板浓度相同,高通量测序结果的偏倚主要是由于引物对不同模板的“偏好”程度不同产生的。在后续eDNA宏条形码技术的数量性研究探索中,设计实验时可选用近源种作为实验对象,从而降低扩增过程中引物对不同模板偏好性不同而导致的“偏倚”现象。
3.2 eDNA组成与高通量测序reads数的相关性当面对实际环境样本时,如果直接应用eDNA宏条形码技术分析高通量测序reads数与待测样本生物量的关系,从生物到eDNA以及从eDNA再到高通量测序结果的两个过程中的数学关系则难以理清。鉴于此,本研究采取“化繁为简”的策略,主要关注eDNA与高通量测序reads数之间的关系。同时,考虑到复合底物的PCR过程比较复杂(Harper et al, 2019),最终注释到每个物种的测序reads数都受其反应体系的影响,故直接比较样本间的reads数会产生一定偏差。充分考虑这些影响因素,本研究采用了样本内的2个物种reads数比值,用于确定其与模板eDNA浓度的相关性。
统计分析实验组的reads平均数比值与PCR模板eDNA比值2组数据,进行一元线性回归分析,最终得出eDNA组成与高通量测序reads数的函数关系:y = 0.0716x + 0.7043 (r2=0.9824)。等式中的斜率可反应出PCR扩增过程中的偏倚程度(主要是引物偏倚),当扩增循环数相同,斜率越小,扩增过程中偏倚程度越大。等式中的截距主要是实验过程中的误差或者污染导致的。该等式可描述为:当环境水样中只存在墨吉对虾和凡纳滨对虾的DNA时,可通过高通量测序的reads数推算出2个物种的相对生物量。
在实际操作中,可能由于模板eDNA的回收率存在差异,使之不能完全符合预设的比例;另外,PCR扩增时并不是全程以底数为2的指数式增长,且存在其他不可避免的系统误差,这些因素都会导致上述线性关系式出现一定偏离。但实验结果已充分表明,高通量测序reads数与初始模板eDNA含量呈线性正相关。
ACINAS S G, SARMA-RUPAVTARM R, KLEPAC-CERAJ V, et al. PCR- induced sequence artifacts and bias: Insights from comparison of two 16S rRNA clone libraries constructed from the same sample. Applied and Environmental Microbiology, 2005, 71(12): 8966-8969 DOI:10.1128/AEM.71.12.8966-8969.2005 |
DOI H, INUI R, AKAMATSU Y, et al. Environmental DNA analysis for estimating the abundance and biomass of stream fish. Freshwater Biology, 2017, 62(1): 30-39 DOI:10.1111/fwb.12846 |
ELBRECHT V, LEESE F. Can DNA-based ecosystem assessments quantify species abundance? Testing primer bias and biomass: Sequence relationships with an innovative metabarcoding protocol. PLoS One, 2015, 10(7): e0130324 DOI:10.1371/journal.pone.0130324 |
EVANS N T, OLDS B P, RENSHAW M A, et al. Quantification of mesocosm fish and amphibian species diversity via environmental DNA metabarcoding. Molecular Ecology Resources, 2016, 16(1): 29-41 DOI:10.1111/1755-0998.12433 |
FONSECA V G. Pitfalls in relative abundance estimation using eDNA metabarcoding. Molecular Ecology Resources, 2018, 18(5): 923-926 DOI:10.1111/1755-0998.12902 |
HANFLING B, HANDLEY L L, READ D S, et al. Environmental DNA metabarcoding of lake fish communities reflects long-term data from established survey methods. Molecular Ecology, 2016, 25(13): 3101-3119 DOI:10.1111/mec.13660 |
HARPER L R, BUXTON A S, REES H C, et al. Prospects and challenges of environmental DNA (eDNA) monitoring in freshwater ponds. Hydrobiologia, 2019, 826(1): 25-41 DOI:10.1007/s10750-018-3750-5 |
JO T, MURAKAMI H, MASUDA R, et al. Rapid degradation of longer DNA fragments enables the improved estimation of distribution and biomass using environmental DNA. Molecular Ecology Resources, 2017, 17(6): e25-e33 |
KANAGAWA T. Bias and artifacts in multitemplate polymerase chain reactions (PCR). Journal of Bioscience and Bioengineering, 2003, 96(4): 317-323 DOI:10.1016/S1389-1723(03)90130-7 |
KELLY R P, PORT J A, YAMAHARA K M, et al. Harnessing DNA to improve environmental management. Science, 2014, 344(6191): 1455-1456 DOI:10.1126/science.1251156 |
LACOURSIEREROUSSEL A, COTE G, LECLERC V, et al. Quantifying relative fish abundance with eDNA: A promising tool for fisheries management. Journal of Applied Ecology, 2016, 53(4): 1148-1157 DOI:10.1111/1365-2664.12598 |
LERAY M, YANG J Y, MEYER C P, et al. A new versatile primer set targeting a short fragment of the mitochondrial COI region for metabarcoding metazoan diversity: Application for characterizing coral reef fish gut contents. Frontiers in Zoology, 2013, 10(1): 1-14 DOI:10.1186/1742-9994-10-1 |
LIM N K M, TAY Y C, SRIVATHSAN A, et al. Next-generation freshwater bioassessment: eDNA metabarcoding with a conserved metazoan primer reveals species-rich and reservoir-specific communities. Royal Society Open Science, 2016, 3(11): 160635 DOI:10.1098/rsos.160635 |
MINAMOTO T, YAMANAKA H, TAKAHARA T, et al. Surveillance of fish species composition using environmental DNA. Limnology, 2012, 13(2): 193-197 DOI:10.1007/s10201-011-0362-4 |
MOYER G R, DIAZFERGUSON E E, HILL J E, et al. Assessing environmental DNA detection in controlled lentic systems. PLoS One, 2014, 9(7): e103767 DOI:10.1371/journal.pone.0103767 |
PILLIOD D S, GOLDBERG C S, ARKLE R S, et al. Estimating occupancy and abundance of stream amphibians using environmental DNA from filtered water samples. Canadian Journal of Fisheries and Aquatic Sciences, 2013, 70(8): 1123-1130 DOI:10.1139/cjfas-2013-0047 |
PINOL J, MIR G, GOMEZPOLO P, et al. Universal and blocking primer mismatches limit the use of high-throughput DNA sequencing for the quantitative metabarcoding of arthropods. Molecular Ecology Resources, 2015, 15(4): 819-830 DOI:10.1111/1755-0998.12355 |
THOMSEN P F, KIELGAST J, IVERSEN L, et al. Monitoring endangered freshwater biodiversity using environmental DNA. Molecular Ecology, 2012, 21(11): 2565-2573 DOI:10.1111/j.1365-294X.2011.05418.x |
WILLERSLEV E. Environmental DNA from seawater samples correlate with trawl catches of subarctic, deepwater fishes. PLoS One, 2016, 11(11): e0165252 DOI:10.1371/journal.pone.0165252 |