图2 3′RACE扩增产物(a)、5′RACE扩增产物(b)和全长cDNA PCR扩增产物(c)
Fig.2 3′ RACE product (a), 5′ RACE product (b) and full length PCR product (c)
M. λDNA/PstⅠ DNA marker; 1. Nested PCR product; 2. First round PCR product.
2.3 全长cDNA的PCR扩增
依据3R1.2和5R2.2的核苷酸序列,设计特异引物P4、P3及其嵌套引物P3′,与Adaptor 引物AP1扩增全长cDNA(图2,c)。第一轮PCR以P3和AP1为引物,得到一条800 bp左右主带。为提高扩增的特异性,第二轮嵌套PCR以P3′和P4为引物进行, 得到530 bp左右的特异条带, 回收克隆此片段至pGEM-T vector进行序列测定,结果如图3 (78~608 bp)。该片段命名为FL4.3。FL4.3全长531 bp(图3,78~608 bp),包含一个完整的ORF(open reading frame),编码171个氨基酸。此氨基酸序列与在蛋白测序中得到的氨基酸序列以及3′RACE和5′RACE 扩增片段推导的氨基酸序列完全一致。
2.4 序列相似性检索及蛋白质结构域预测
全长cDNA 通过Blast 2.0 Network Service 与GenBank中已报道的序列进行序列相似性检索,结果表明其与火烧兰(Epipactis helloborine)、二叶兰(Listera ovata)的甘露糖结合蛋白(EHMBP、LOMBP) 以及雪花莲(Galanthus nivalis L.)的甘露糖结合凝集素(GNA)具有很高的同源性。在核苷酸水平上,重叠区分别为474 bp、473 bp和168 bp;同源性分别为72%、71%和61%。在氨基酸水平上,重叠区分别为167、161和127个氨基酸,相同性分别为76%、78%和33%;相似性分别为82%、83%和53%。
图3 GAFP-1 cDNA的核苷酸序列及推导的氨基酸序列
Fig.3 Nucleotide and deduced amino acid sequence of GAFP-1 cDNA
Primers for amplification of 3′RACE fragment are in bold and wave underlined; primers for amplification of 5′RACE fragment are in bold and underlined; primers for amplification of full length cDNA are in bold and double underlined; arrowhead shows the possible cleavage site of signal peptide; the putative phosphoralation sites are double underlined; the putative N-glycosylation site is indicated by*; the putative N-myristoylation sites are in box.
将推导的全长氨基酸序列通过Protein Prediction软件进行蛋白质结构域预测。结果表明在此蛋白序列中含有一个可能的N糖基化位点(150NGTA)、两个可能的磷酸化位点(29SDR、104TNR)及三个豆蔻酰化位点(41GGSLAQ、150GTAAAS、157GAAQNK)。
3 讨论
RACE 是一种以PCR为基础快速分离包含3′和5′末端的cDNA的方法[8]。其优点在于快速、简便,仅知少量序列信息时即可扩增得到全长cDNA,多数情况下无需构建cDNA文库。我们在仅知GAFP-1 N端部分氨基酸序列的情况下, 依据此序列设计简并引物,先通过3′RACE扩增得到含3′末端的cDNA片段。以此片段序列为基础设计特异引物通过5′RACE扩增得到了含5′末端的cDNA片段。根据以上两个片段的核苷酸序列,设计了特异引物扩增得到了包含完整编码区的全长cDNA。为提高PCR扩增的特异性,采用了两种策略:第一,在引物设计中尽量选取GC含量较高的区段,以保证其退火温度在70 ℃以上;第二,采用两轮PCR扩增,嵌套引物设计在前一轮引物的内部,两者之间不含重叠区。由嵌套引物引导的第二轮PCR可显著提高扩增产物的特异性。应用RACE这种方法,在未构建cDNA文库的情况下,我们得到了GAFP-1全长cDNA。
GAFP-1 cDNA编码区全长171个氨基酸,根据von Heijine[10]的蛋白质剪切规则推测其信号肽的剪切位点位于第28位的丙氨酸和第29位的丝氨酸之间,这与我们根据成熟蛋白N端序列所推测的剪切位点完全吻合。从28Ala 和29Ser之间切除一个28个氨基酸的信号肽后,成熟蛋白全长143个氨基酸,推导分子量为15.7 kD,这比由质谱确定的分子量仍大3 kD左右,因此我们推测在蛋白的C端可能还存在一个翻译后的剪切位点,从而形成12 kD左右的成熟蛋白。在3′RACE和5′RACE扩增中我们还分别得到了3′和5′的非编码区,长度分别为141 bp和55 bp。在3′非编码区含有两个腺苷酸化位点(AATAAA)和长度为26个腺苷酸的poly(A)。