Illumina 甲基化芯片(850K)
表观基因组是目前多组学研究的热点,而DNA的甲基化修饰又是表观遗传研究中最重要的领域。DNA甲基化修饰是基因表达调控的重要方式,在分化、发育、基因印迹、X染色体失活与维持组织特异性等众多方面起着重要作用。同时在许多复杂疾病,如癌症、神经系统紊乱、糖尿病等,的发生发展也与DNA甲基化有着千丝万缕的关系。
在后基因组时代,随着高通量技术成本的日益降低,海量组学数据与研究结果让我们越来越认识到生命现象的复杂性。目前的研究前沿越来越倾向于以多组学的角度:从遗传和表观遗传到转录和代谢,从机制到表型,进行整合研究以得到全局结果。
在当前的科研需求下,Illumina的甲基化芯片Infinium MethylationEPIC BeadChip(简称850k芯片),提供了性能优越且经济可靠的甲基化解决方案。850K芯片是在原450K芯片巨大成功的基础上,推出了新一代的DNA甲基化芯片。在数据上既包含了原450K芯片91%的位点,以充分利用原有450K珍贵数据,又增加了413,745个位点(总共853,307个CpG位点)。850K芯片全面覆盖基因启动子区、基因编码区、CpG岛以及ENCODE及FANTOM5计划中发现的增强子区(图 1)。
850K甲基化芯片不但是肿瘤和其他复杂疾病研究的有力工具,也是目前最适合表观全基因组关联分析(EWAS)研究的DNA甲基化研究技术。
图 1 Illumina BeadArray与850K 甲基化芯片的示意图。芯片上有超过850,000个直径3微米,间距约5.7微米的硅珠,每个硅珠上覆盖了几十万条特定的寡核苷酸探针,对目的CpG位点的甲基化进行检测。
一、 芯片原理
850K芯片沿承了Illumina应用在450K芯片中经典的BeadArray技术,通过Infinium I及II探针设计,在对目标区域全面覆盖的同时也保证数据稳定可靠。
Infinium I的设计是通过两种不同的探针的信号值来区分甲基化的CpG位点(C)和非甲基化的CpG位点(T)的比例;而在Infinium II的设计中,每个检测位点只设计一个探针,通过比较该探针掺入的两种荧光的信号值来计算目的位点的甲基化比例。详见下表与图3。
表格 1 Infinium I 及Infinium II探针原理
探针类型 | 探针介绍 | 反应类型 | 标记类型 | β值计算方式 | ||
Infinium I 探针 | U型磁珠:尾部为A,用来检测非甲基化位点(T) | 单碱基延伸原理:仅当探针最后一个碱基与模板配对时,荧光标记的核苷酸才能掺入并被检测到荧光信号。 | ddTTP-DNP | β=M/(M+U+100) | ||
M型磁珠:尾部为G,用来检测甲基化位点(C) | ||||||
Infinium II 探针 | 只使用一种磁珠,探针末端为C,与目的位点的前一个碱基配对,只延伸一个碱基(ddATP-DNP, ddGTP-BioT分别与非甲基化或甲基化位点配对)。 | 普通延伸反应 | ddATP-DNP | β=G/(G+A+100) | ||
Infinium I与Infinium II 探针设计原理图
图 2 Infinium I与Infinium II 探针设计原理图:在InfiniumI设计中,每个甲基化位点都对应设计有两种探针:M型磁珠、U型磁珠分别检测甲基化位点(C)。和非甲基化位点(T)。根据单碱基延伸的原理,仅当探针最后一个碱基与模板配对时,荧光标记的ddNTP才能掺入并被检测到荧光信号,并根据M和U的荧光信号的结果计算甲基化值。而Infinium Ⅱ 探针只使用一种磁珠,通过延伸的A或G碱基(分别对应非甲基化与甲基化位点)的信号值计算目的位点的甲基化程度。
二、 850k芯片技术特点:
1. 全面的基因组覆盖范围:检测>853,000个CpG位点,全面覆盖CpG岛、启动子、编码区、开放染色质和增强子。此外还包括CpG岛外的CpG位点,已知DMR位点,脱氧核糖核酸酶超敏位点以及miRNA启动子区域。
2. 高质量的数据:同时采用Infinium I及II探针设计,使检测范围最大化。
3. 分辨率高:单碱基分辨率,可以直接检测到发生甲基化的确切位点。
4. 可重复性高: 自身技术重复相关性R2 > 0.98;与450K交集探针间相关性R2 > 0.98。
5. 起始模板量低:仅需 250ng,大大节约了样品量。
6. 适用于FFPE样本。
三、 850K芯片探针覆盖技术参数
850K芯片传承了450K芯片对基因组的功能元件的设计理念,有目的性地对CpG岛以及基因及实现了空前全面覆盖,下图及表格统计展示了850K芯片对于不同染色体、基因组功能元件的覆盖及分布。以上的设计不但可从泛-增强子及编码区域角度分析甲基化组,还在全基因组表观遗传关联研究(EWAS)中发挥重要作用。850K芯片中包含的一系列有价值的位点:
? CpG岛及岛外的CpG位点(Island:17.8%, Shore: 16.9%, Shelf: 8.8%, Open sea: 56.5%)
? 人类胚胎干细胞中的非CpG甲基化位点(CHH位点)
? 肿瘤vs正常(多种类型的癌症),以及不同组织间的差异甲基化位点
? FANTOM5增强子, ENCODE开放染色质和增强子
? DNase I超敏位点
? miRNA启动子区域
图 3. 850K 芯片探针在不同染色体及基因组功能元件中的分布。
四、样本要求
样品类型:组织、细胞、基因组 DNA
样品纯度:OD 260/280 值应在 1.7~2.0 之间;RNA 应该去除干净;不得有其它个体或其它物种的 DNA 污染。
样品浓度:浓度不低于 50ng/μl;
样品总量:每个样品总量不少于 500ng。
样品溶剂:溶解在 TE 中。
样品运输:DNA 低温运输(-20℃);在运输过程中请用 parafilm 将管口密封好,以防出现污染。
五、分析流程