基因组所密码子偏好性研究获新进展
在遗传信息编码过程中,编码同一种氨基酸的多个同义密码子(Synonymous Codons)的使用频率并不相等,这种现象称为密码子使用偏好(Codon Usage Bias,CUB)。密码子使用偏好在不同物种甚至某一物种内的不同基因都具有特异性,隐藏在这种偏好性背后的是基因与物种长期进化过程中突变、选择和漂变的综合作用。密码子使用偏好与基因表达紧密关联,通过比较密码子偏好性差异可以推断基因是否受到不同程度的翻译选择(Translational Selection)。大量研究证实,在同一物种内,高表达水平的基因由于需要提高翻译准确性及效率而倾向于使用最优密码子,因此表现出高的密码子使用偏好性。
翻译选择的研究主要集中在原核生物以及单细胞真核生物(例如大肠杆菌、酵母)。人的基因组结构极为复杂,使得关于翻译选择的相关研究变得非常困难,甚至无法确切判断是否有翻译选择存在。已有研究报道,不改变蛋白质序列,因为翻译准确性或效率的改变会导致人类疾病,例如囊性纤维化(CF)。基因组水平的大规模SNP筛查显示大量的同义突变与多种人类疾病存在相关性,但对很多同义突变的具体作用方式了解较少。
为更加全面与深入了解密码子使用偏好性的生物学意义以及基因表达调控的机制与进化,中国科学院北京基因组研究所基因组科学与信息重点实验室章张研究组与张治华研究组,与沙特阿卜杜拉国王科技大学崔鹏博士、美国麻州总医院和哈佛医学院朱江博士,针对人类基因的翻译选择这一问题开展合作研究,相关研究成果于2014年7月发表在期刊《Biology Direct》上。
在北京基因组所高性能计算平台的有力支撑下,研究发现人类基因中也存在翻译选择,但与细菌以及酵母不同的是,翻译选择并非仅与表达量密切相关。通过高通量测序数据,研究团队将人类基因按照表达模式分为三类:组织特异基因(仅在一个组织中表达,Tissue-Specific Genes),普遍表达但表达水平可变的基因(Expression Variable Genes;EVG),普遍表达且表达水平相对恒定的基因( Expression Invariable Genes;EIG)。通过这三类基因的比较分析发现,EIG的表达量与密码子使用偏好性存在相对较强的相关性,进一步分析显示这种较强的相关性并非完全与高的表达量相关。通过与tRNA使用频率的关联分析,发现EIG对最优密码子的使用存在明显偏好。这一研究结果显示,在大量组织中表达且表达水平相对恒定的EIG基因,受到了明显的翻译选择。与TS和EVG相比,EIG的密码子使用偏好相对更多来自于翻译选择的作用。
上述研究揭示了翻译选择的普遍性以及作用在不同物种中存在有差异性,为后续从原核生物到真核生物的翻译选择作用水平的演化及其机制研究提供了新思路。
该研究得到了中国科学院、科技部和国家自然科学基金委的资助。
密码子使用偏好性与基因表达的相关性