医学遗传学概述

作者:Quasar S. Padiath, MBBS, PhD, University of Pittsburgh
Reviewed ByGlenn D. Braunstein, MD, Cedars-Sinai Medical Center
已审核/已修订 修改的 6月 2025
v1123197_zh
看法 进行患者培训

基因是遗传的基本单位,是脱氧核糖核酸(DNA)的一个片段,包含合成多肽(蛋白质)或一个功能性RNA分子所需的信息。蛋白质的合成、折叠、及三级四级结构最终决定了机体的主要结构和功能。

DNA提供了决定个体发育和生长的许多方面以及影响健康的因素的密码。然而,基因功能会因基因表达的变异性而不同,这种变异性可能源于遗传、表观遗传或环境因素。许多介导基因表达的生化机制的认知正在迅速增长。

以下是描述基因组成与表达的术语:

基因组指生物体内全部遗传物质,包括所有基因和非编码序列。

基因型是细胞或生物体中某个或某些基因的特定等位基因组成。

表型指个体可观察特征,如身高、眼色或血型。表型是由包括基因型、基因表达和环境因素在内的多种因素的复杂相互作用决定的。特定的基因型可能与表型相关,也可能没有相关性。

基因表达是指基因中编码的信息被用于调控下游分子(蛋白质或RNA)组装的过程。基因表达取决于多种因素,如性状是显性还是隐性,基因的外显率和表达率(见影响基因表达的因素),表达是否受性别限制或染色体失活或基因组印记的影响,环境因素,以及其他未知因素。

DNA的结构

根据基因的定义,人类有大约20,000到25,000个基因(1)。基因位于染色体上,染色体存在于细胞核和线粒体中。(线粒体DNA及相关疾病将单独讨论。)

每条染色体由几个主要结构组成:着丝粒(一对染色体在细胞分裂时连接然后分离的区域);端粒(每条染色体末端的区域,在DNA复制过程中帮助保持结构完整性);染色单体(染色体的两条臂:每条染色体有一条短臂,标记为“p”,一条长臂,标记为“q”)。(见图染色体结构。)

染色体结构

着丝粒是两条染色单体相连的缢缩部位。染色单体是染色体的臂;每条染色体都有一条短臂,标记为“p”,一条长臂,标记为“q”。端粒是染色体每条臂末端的区域。DNA分子通过组蛋白缠绕压缩形成染色体内部的致密结构。

Credit: GWEN SHOCKEY / SCIENCE PHOTO LIBRARY

核型是个体细胞中全套染色体的组成。基因检测结果中,核型图以数字顺序展示全部染色体对的图像。在此过程中(称为核型分析),通常从样本(如血液、羊水或组织)中收集细胞;进行培养以促进细胞分裂;然后在中期(此时染色体最清晰可见)停止细胞分裂。经染色和拍照后生成核型图,显示细胞样本中染色体的大小、形态和数量。

人类大多数细胞为体细胞(非生殖细胞),细胞核含有23对染色体,共计46条(二倍体)。在体细胞中,每对染色体由 1 条来自母亲的染色体和 1 条来自父亲的染色体组成。在23对染色体中,1到22号被称为常染色体,这些染色体通常是同源的(大小、形状、位置和基因数量与另一对染色体相同)。第23对为决定性别的X和Y染色体。雌性体细胞核中有两条 X 染色体,雄性有一条 X 染色体和一条 Y 染色体。

X染色体携带多种遗传性状相关基因。女性两条X染色体同源,每个基因都能在另一条X染色体上找到配对。男性的X染色体与较小的Y染色体为异源配对。Y 染色体携带启动男性性别分化的基因,以及少量其他基因。因为X染色体比Y染色体有更多的基因,所以男性的许多X染色体基因是不配对的。然而,在女性的每个细胞中,一条X染色体在胎儿早期就会失活(里昂化),从而维持男性和女性之间遗传物质的平衡。在某些细胞中,母系 X 染色体处于失活状态,而在另一些细胞中,则是父系 X 染色体。一旦在单个细胞中发生X染色体失活,该细胞的所有后代细胞都会具有相同的X染色体失活。

生殖细胞(卵子和精子细胞)在某些阶段含有46条染色体;然而,在减数分裂期间,染色体对分开,因此每个配子(精母细胞或卵母细胞)只包含每条染色体的一个副本,从而产生23条染色体(单倍体)。未配对的染色体可以进行重组,这是一个母源和父源染色体可以发生互换的过程(同源染色体之间交换)。当卵子在受精时与精子结合,受精卵中46条染色体的数目得以恢复。

染色体包含基因(转录活跃的染色体片段,称为常染色质)以及不编码蛋白质的额外物质(转录不活跃的片段,称为异染色质)。基因在染色体的DNA中呈线状排列。每一个基因在染色体上有其特定的位置(位点),在同源染色体上,基因的位点是一致的。在同一对的两条染色体上占据两个等同位点的基因(一个来自父亲,另—个来自母亲)称为等位基因。每个基因由特定的序列构成。两个等位基因可有相同的或略有不同的核苷酸序列。某个基因的两个等位基因相同,称为纯合子;两个等位基因不同,则为杂合子。有些基因存在多个拷贝,这些拷贝可能彼此相邻,也可能分散在相同或不同染色体的多个位置上。

DNA 的结构

DNA(脱氧核糖核酸)是细胞的遗传物质,存在于每一个细胞核和线粒体的染色体中。

除某些细胞(例如精子和卵细胞)外,细胞核含有 23 对染色体。一条染色体含有许多基因。基因是提供用于构建蛋白质或 RNA 分子的编码的 DNA 片段。

DNA 分子是一条长长的、盘绕着的、像一条旋梯一样的双螺旋结构。其中,由糖(脱氧核糖)和磷酸分子组成的两条链由成对的 4 个分子(称为碱基)连接,这些碱基构成了楼梯的梯级。在梯级上,腺嘌呤和胸腺嘧啶配对,而鸟嘌呤和胞嘧啶配对。每一对碱基都被氢键联结在一起。基因由碱基序列构成。3 个碱基序列编码一个氨基酸(氨基酸是构成蛋白质的分子)或其他信息。

结构参考

  1. 1.National Human Genome Research Institute.What Is a Genome?Accessed March 5, 2025.

基因功能

基因由DNA组成。DNA的结构是一个双螺旋,其中的核苷酸(碱基)是成对存在的:

  • 腺嘌呤(A)与胸腺嘧啶(T)配对

  • 鸟嘌呤(G)与胞嘧啶(C)配对

基因的长度决定了由基因编码合成的蛋白质或RNA的长度。为了蛋白质合成,DNA 转录 会发生,其中 DNA 的 1 条链被用作模板,从中合成信使 RNA (mRNA)。除了尿嘧啶(U)由胸腺嘧啶(T)替代而外,RNA和DNA有着相同的碱基对。mRNA分子从细胞核进入细胞质,然后进入核糖体,一种细胞结构。在核糖体中,翻译过程将mRNA序列转化为合成特定蛋白质所需的氨基酸序列。转运RNA(tRNA)根据mRNA上的编码顺序将每一种氨基酸携带至核糖体,并将氨基酸加至延伸的多肽链上。当氨基酸链被组装时,它会自我折叠形成复杂的三维结构,而这一过程受到邻近伴侣蛋白分子的辅助。

DNA中的序列和4种核苷酸碱基为蛋白质合成提供了编码。特定的氨基酸由 3 个碱基(三联体)的特定组合(称为密码子)编码。由于有四种核苷酸,可能的三联密码子数目为43(等于64种可能的密码子)。然而,只有20种标准氨基酸,导致遗传密码冗余,这意味着多个密码子可以编码相同的氨基酸。除了这些编码三联体,一些密码子还承担特殊功能。例如,某些三联体被指定为起始密码子(通常是AUG,它也编码甲硫氨酸),表示蛋白质合成的开始;而另一些则作为终止密码子(例如,UAA、UAG和UGA),表示蛋白质合成的终止。这种结构既允许蛋白质的编码,也允许其合成的调控(1, 2)。

基因包含外显子和内含子。对于蛋白质编码基因,外显子编码最终蛋白质的氨基酸成分。内含子是不编码氨基酸但包含调节蛋白质生产速度和蛋白质生产类型信息的核苷酸序列。外显子和内含子一起转录成前体 mRNA,但从内含子转录的片段后来被剪接掉,从而产生成熟的 mRNA。此外,某些DNA片段编码反义RNA,这些RNA可与mRNA序列结合,并能抑制其翻译成蛋白质。DNA上的非转录链亦可作为合成RNA的模板,来调控另一条链的转录。

内含子剪接(也称为可变剪接)是一种基因表达变异的机制。在选择性剪接过程中,内含子被剪切,剩余的外显子可以多种方式组合,从而产生许多不同的mRNA,这些mRNA能够被翻译成多种不同的蛋白质亚型。因此,尽管人类基因组仅包含约2万多个基因,但其能够合成的蛋白质数量超过10万种。

基因功能参考文献

  1. 1.Liu CC, Simonsen CC, Levinson AD.Initiation of translation at internal AUG codons in mammalian cells.Nature.1984 May 3-9;309(5963):82-5.doi: 10.1038/309082a0

  2. 2.Brown A, Shao S, Murray J, Hegde RS, Ramakrishnan V.Structural basis for stop codon recognition in eukaryotes.Nature.2015 Aug 27;524(7566):493-496.doi: 10.1038/nature14896

表观遗传因素

不涉及DNA序列改变的遗传性变化被称为表观遗传学。影响基因表达而不改变基因序列的关键机制包括DNA甲基化和组蛋白修饰,例如甲基化和乙酰化。

DNA甲基化通常与基因表达的沉默有关。组蛋白类似于 DNA 缠绕的线轴,影响 DNA 的折叠和展开。组蛋白修饰如乙酰化或甲基化可以增加或减少特定基因的表达。

另一个重要的机制涉及微小RNAs(miRNAs)。miRNA是由发夹衍生的短RNA,在转录后抑制靶基因表达(发夹指RNA序列结合在一起时呈现的形状)。miRNA可能参与多达60%的转录蛋白的调节。

性状和遗传模式

所谓性状,可以如眼睛的颜色那样简单,也可以如对糖尿病的易感性那么复杂。一个性状的表达可涉及一个基因或多个基因。一些 单基因缺陷可引起多组织的异常,这种效应称为基因多效性。例如,成骨不全症 (由单个胶原基因异常引起的结缔组病)可导致脆骨病、耳聋、蓝巩膜、牙齿发育不良、关节活动度过大和心瓣膜异常)。某些特征,如易患精神分裂症的倾向,似乎是由多个基因引起的,因此被称为多基因特征。

绘制家系图谱

家系图(家族树)用于表示遗传的模式。系谱通常用于遗传咨询。家系图运用规定的符号代表家族成员及他们的健康情况(见图 构建家谱谱系的符号)。某些表型一样的家族性疾病可以有多种遗传模式。

构建家谱谱系的符号

在家谱系谱中,各代以罗马数字标记,最老的一代在顶部,最年轻的在底部。在同一代中,各人以阿拉伯数字从左到右标记。同胞按年龄大小排列,最年长者在左边。 因此,系谱中每一成员可用两个数字来确定(如Ⅱ,4)。配偶同样有一个标记数字。

关键点

  • 表型是由包括基因型、基因表达和环境因素在内的多种因素的复杂相互作用决定的。

  • 基因表达调节机制正在被阐明,包括内含子剪接、DNA 甲基化、组蛋白修饰、microRNA 和 3D 基因组组织。

quizzes_lightbulb_red
Test your KnowledgeTake a Quiz!
ANDROID iOS APPS in CHINA
ANDROID iOS APPS in CHINA
ANDROID iOS APPS in CHINA