1 基因芯片概述
随着人类基因组计划( Human Genome Project)即全部核苷酸测序的即将完成,人类基因组研究的重心逐渐进入后基因组时代( Postgenome Era)向基因的功能及基因的多样性倾斜。通过对个体在不同生长发育阶段或不同生理状态下大量基因表达的平行分析,研究相应基因在生物体内的功能,阐明不同层次多基因协同作用的机理,进而在人类重大疾病如癌症、心血管疾病的发病机理、诊断治疗、药物开发等方面的研究发挥巨大的作用。它将大大推动人类结构基因组及功能基因组的各项基因组研究计划。
基因芯片的工作原理与经典的核酸分子杂交方法(southern 、northern)是一致的,都是应用已知核酸序列作为探针与互补的靶核苷酸序列杂交,通过随后的信号检测进行定性与定量分析,基因芯片在一微小的基片(硅片、玻片、塑料片等)表面集成了大量的分子识别探针,能够在同一时间内平行分析大量的基因,进行大信息量的筛选与检测分析。基因芯片主要技术流程包括:芯片的设计与制备;靶基因的标记;芯片杂交与杂交信号检测。
基因芯片的设计实际上是指芯片上核酸探针序列的选择以及排布,设计方法取决于其应用目的,目前的应用范围主要包括基因表达和转录图谱分析及靶序列中单碱基多态位点(single nucleotide polymorphism,SNP)或突变点的检测,表达型芯片的目的是在杂交实验中对多个不同状态样品(不同组织或不同发育阶段、不同药物刺激)中数千基因的表达差异进行定量检测,探针序列一般来自于已知基因的cDNA 或EST库,设计时序列的特异性应放在首要位置,以保证与待测目的基因的特异结合,对于同一目的基因可设计多个序列不相重复的探针,使终的数据更为可靠。基因单碱基多态检测的芯片一般采用等长移位设计法,即按靶序列从头到尾依次取一定长度的互补的核苷酸序列形成一探针组合,这组探针是与靶序列完全匹配的野生型探针,然后对于每一野生型探针,将其中间位置的某一碱基分别用其它三种碱基替换,形成三种不同的单碱基变化的核苷酸探针,这种设计可以对某一段核酸序列所有可能的SNPs位点进行扫描。
芯片制备方法主要包括两种类型:(1)点样法:首先是探针库的制备, 根据基因芯片的分析目标从相关的基因数据库中选取特异的序列进行PCR扩增或直接人工合成寡核苷酸序列,然后通过计算机控制的三坐标工作平台用特殊的针头和微喷头分别把不同的探针溶液逐点分配在玻璃、尼龙以及其它固相基片表面的不同位点上,通过物理和化学的方法使之固定,该方法各技术环节均较成熟,且灵活性大,适合于研究单位根据需要自行制备点阵规模适中的基因芯片。(2)原位合成法:该法是在玻璃等硬质表面上直接合成寡核苷酸探针阵列,目前应用的主要有光去保护并行合成法,压电打印合成法等,其关键是高空间分辨率的模板定位技术和高合成产率的DNA化学合成技术,适合制作大规模DNA探针芯片,实现高密度芯片的标准化和规模化生产。
待分析样品的制备是基因芯片实验流程的一个重要环节, 靶基因在与芯片探针结合杂交之前必需进行分离、扩增及标记。标记方法根据样品来源、芯片类型和研究目的的不同而有所差异。通常是在待测样品的PCR扩增、逆转录或体外转录过程中实现对靶基因的标记。对于检测细胞内mRNA表达水平的芯片,一般需要从细胞和组织中提取RNA,进行逆转录,并加入偶联有标记物的dNTP,从而完成对靶基因的标记过程,对于阵列密度较小的芯片可以用同位素,所需仪器均为实验室常规使用设备,易于开展相关工作,但是在信号检测时,一些杂交信号强的点阵容易产生光晕,干扰周围信号的分析。高密度芯片的分析一般采用荧光素标记靶基因,通过适当内参的设置及对荧光信号强度的标化可对细胞内mRNA的表达进行定量检测。近年来运用的多色荧光标记技术可更直观地比较不同来源样品的基因表达差异,即把不同来源的靶基因用不同激发波长的荧光素标记,并使它们同时与基因芯片杂交,通过比较芯片上不同波长荧光的分布图获得不同样品间差异表达基因的图谱,常用的双色荧光试剂有Cy3- dNTP和Cy5- dNTP。对多态性和突变检测型基因芯片采用多色荧光技术可以大大提高芯片的准确性和检测范围,例如用不同的荧光素分别标记靶序列及单碱基失配的参考序列,使它们同时与芯片杂交,通过不同荧光强弱的比较得出靶序列中碱基失配的信息。
基因芯片与靶基因的杂交过程与一般的分子杂交过程基本相同,杂交反应的条件要根据探针的长度、GC碱基含量及片的类型来优化,如用于基因表达检测,杂交的严格性较低,而用于突变检测的芯片的杂交温度高,杂交时间短,条件相对严格。如果是用同位素标记靶基因,其后的信号检测即是放射自显影,若用荧光标记,则需要一套荧光扫描及分析系统,对相应探针阵列上的荧光强度进行分析比较,从而得到待测样品的相应信息。由于基因芯片获取的信息量大,对于基因芯片杂交数据的分析、处理、查询、比较等需要一个标准的数据格式,目前,一个大型的基因芯片的数据库正在构建中,将各实验室获得的基因芯片的结果集中起来,以利于数据的交流及结果的评估与分析。
2 基因芯片的应用
基因表达图谱的绘制是目前基因芯片应用广泛的领域,也是人类基因组工程的重要组成部分,它提供了从整体上分析细胞表达状况的信息,而且为了解与某些特殊生命现象相关的基因表达提供了有力的工具,对于基因调控以及基因相互作用机理的探讨有重要作用。人类基因组编码大约100000个不同的基因,因此,具有监测大量mRNA的实验工具很重要。基因芯片技术可清楚地直接快速地检测出以1∶300000水平出现的mRNA,且易于同时监测成千上万的基因。目前,已能够在1.6cm2面积上合成和阅读含400000个探针的阵列,可监测10000个基因的表达状况。斯坦福大学的Brown用制备的酵母cDNA芯片,获得酵母在不同细胞周期状态以及在热休克冷休克处理后其2473个基因的表达图谱,较直观地反应了不同条件和状态下基因转录调控水平,从而为寻找基因调控的机理提供了一条有效的途径。
定量监测大量基因表达水平在阐述基因功能、探索疾病原因及机理、发现可能的诊断及治疗的靶基因等方面具有重要价值的。Derisi等选用来自恶性肿瘤细胞系UACC903中的1161个cDNA克隆制成芯片,通过比较正常和肿瘤细胞的表达差异,发现在恶性肿瘤细胞中P21基因处于失活或关闭状态,但在逆转的细胞系中呈高表达。Golub等应用cDNA 芯片检测基因表达的差异进行癌症的分类,成功地区分出急性髓细胞性白血病(AML)和急性淋巴细胞性白血病(ALL),预期这种方法还能诊断出新的白血病种类。在炎症性疾病类风湿性关节炎(RA)和炎症性肠病(IBD)的基因表达研究中,可检测出炎症疾病诱导的基因如TNF-α、IL或粒细胞集落刺激因子,同时发现一些以前未发现的基因如HME基因和黑色素瘤生长刺激因子。目前,大量涌现的人类ESTs给cDNA微阵列提供了丰富的序列资源,数据库中ESTs代表了人类基因,因此ESTs微阵列可在缺乏其它序列信息的条件下用于基因发现和基因表达检测,从而加快人类基因组功能分析的进程。
基因芯片的另一重要应用是基因多态位点及基因突变的检测,现有大量实例说明,基因组多样性的研究对阐明不同人群和个体在疾病的易感性和抵抗性方面表现出的差异具有重要意义,一旦对基因组的编码序列进行系统筛查,就有可能找出与疾病易感性有关的大量基因变异。基因芯片技术可大规模地检测和分析DNA的变异及多态性。Wang等应用高密度基因芯片对2.3Mb人类基因的SNP 进行筛查,确定了3241个SNPs位点,显示出大规模鉴定人类基因型的可能。Lipshutz等人采用含18,495个寡核苷酸探针的微阵列,对HIV-1基因组反转录酶基因(rt)及蛋白酶基因(pro)的高度多态性进行了筛选,这些变异将导致病毒对多种抗病毒药物包括AZT、ddI、ddC等表现出抗性,因此rt与pro的变异与多态性的检测具有重要的临床意义。随着大量疾病相关基因的发现,变异与多态性分析将在疾病的诊断与治疗方面体现出越来越重要的价值。Affymetrix公司已将P53 基因的全长序列和已知突变的序列制成探针集成在芯片上,可对与P53 基因突变相关的癌症进行早期诊断。Hacia等采用含96600个20聚寡核苷酸高密度阵列对遗传性乳腺和卵巢癌BRCA1基因3.45kb的第11个外显子进行杂合变异筛选,结果准确诊断出15个已知变异的患者样品中的14个,而在20个对照样品中未发现1例假阳性,表明DNA芯片技术在某些疾病相关基因可能的杂合变异的检测方面所具有的灵敏度与特异性是令人满意的。
芯片技术中杂交测序技术(sequencing by hybridization,SBH)是一种新的高效快速测序方法,也是基因芯片的另一重要应用,其原理与芯片检测多态位点相类似,即通过与一组已知序列的核酸探针杂交进行序列测定,用荧光标记的待测序列与基因芯片上对应位置的核酸探针产生互补配对时,通过确定荧光强度强的探针位置,获得一组序列互补的探针序列,据此可重组出靶核酸的序列。用含65536个8聚寡核苷酸的微阵列,采用SBH技术,可测定200bp长DNA序列采用67108864个13聚寡核苷酸的微阵列,可对数千个碱基长的DNA测序。
3 结束语
基因芯片技术的出现不过短短几年时间,其发展势头十分迅猛,在生命科学的各个领域得到广泛地应用,但其存在的缺陷也是相当明显的。首先是成本的问题,由于芯片制作的工艺复杂,信号检测也需专门的仪器设备,一般实验室难以承担其高昂的费用,其次在芯片实验技术上还有多个环节尚待提高,如在探针合成方面,如何进一步提高合成效率及芯片的集成程度是研究的焦点。而样品制备的简单化与标准化则芯片应用进一步普及的前提。虽然芯片技术还存在这样或那样的问题,但其在基因表达谱分析、基因诊断、药物筛选及序列分析等诸多领域已呈现出广阔的应用前景,随着研究的不断深入和技术的更加完善基因芯片一定会在生命科学研究领域发挥越来越重要的作用。