GC含量
GC含量(GC-content)は、DNA分子中の窒素塩基のうちグアニンとシトシンの割合である[1]。また、この用語はDNA・RNAの特定の断片や、ゲノム全体に対しても用いられる。
AT対が2つの水素結合で結ばれているのに対し、GC対は3つの水素結合で結ばれている。GC含量の高いDNAは低いものよりも安定しているが、この安定性は水素結合によるものではなく、主にスタッキング相互作用によるものである[2]。遺伝物質の高い耐熱性に関わらず、高いGC含量のDNAを含む細胞は自己融解を起こし、細胞の寿命自体は短い[3]。高GC含量のDNAを持つ生物の頑健性のため、GC含量は温度適応に重要な役割を果たすと信じられてきたが、この仮説は反証された[4]。しかし同じ研究で、高温と(rRNA・tRNAや他のncRNAのような)構造RNAのGC含量との間で強い相関が示された。近年初めて行われた、遺伝子を中心とした体系的な大規模相関分析によって、特定のゲノム部位についてのみGC含量と温度の間に相関が見られることが示された[5]。
PCRでは、プライマーのGC含量から相補DNAのアニーリング温度が予測される。高いGC含量を持つプライマーは、高いアニーリング温度を持つことが示唆される。
目次
1 GC含量の決定
2 ゲノムのGC比
3 GC比と配列決定
4 分類学への応用
5 出典
6 外部リンク
GC含量の決定
GC含量%は次のように計算される[6] 。
- G+CA+T+G+C× 100{displaystyle {cfrac {G+C}{A+T+G+C}}times 100}
別の表現としてAT/GC比があり、次のように計算される[7]。
- A+TG+C{displaystyle {cfrac {A+T}{G+C}}}
これらは様々な方法で測定可能であるが、最も単純な方法の1つに、分光測色法を用いたDNAの「融点」の測定がある。DNAによる波長260nmの吸光は、二重鎖DNAが十分に加熱されて一本鎖DNAに分離すると急激に増加する[8]。最も一般的に用いられている手法として、ATまたはGCのみに結合する蛍光色素を用いた、大量のDNAサンプルに対するフローサイトメトリーの利用がある[9]。
別の自明な方法として、DNA・RNAの塩基配列が決定されると、単純計算によりGC含量を正確に算出できる。
ゲノムのGC比
ゲノム中のGC比はかなり変動がある。複雑な生物では、高GC比領域はモザイク状に点在し、アイソコアと呼ばれる"小島"状の領域を形成する[10]。これは、染色体の染色強度の違いに直接現れる[11]。アイソコアはタンパク質コード領域を多く含むため、これらの領域のGC比の決定は、遺伝子の多い領域をゲノム中から特定することに役立つ[12][13]。
GC比と配列決定
ゲノム配列を俯瞰すると、非コード領域に対し、タンパク質コード領域は高いGC含量を持つことがよく見られる。コード領域の長さがGC含量に正比例することを示す証拠も得られている[14]。終止コドンがアデニンとチミンに偏っているという理由から、配列が短いほどATバイアスは高くなる[15]。
分類学への応用
分類群によってGC含量が異なる理由として、進化過程における選択・突然変異バイアス・DNA修復時のバイアス等の寄与が想定されている[16]。原核生物分類学の種の定義における問題は、細菌の分類に関する様々な示唆を与え、ad hoc committee on reconciliation of approaches to bacterial systematicsは細菌の高次分類にGC比を用いることを勧告した[17]。例えば、放線菌は「高GC含量の細菌」として特徴づけられ[18]、その1種であるストレプトマイセス属のStreptomyces coelicolor A3(2)では72%である[19]。細菌以外のモデル生物では、出芽酵母では38%[20]、シロイヌナズナでは36%である[21]。コドンの性質のため、GC含量が0%や100%に近い状態となることは実質的にはあり得ないが、熱帯熱マラリア原虫では20%以下と非常に低く[22]、AT含量が多い(つまりGC含量が少ない)生物としてしばしば言及される[23]。
出典
^ Definition of GC – content on CancerWeb of Newcastle University,UK
^ Yakovchuk P, Protozanova E, Frank-Kamenetskii MD (2006). “Base-stacking and base-pairing contributions into thermal stability of the DNA double helix”. Nucleic Acids Res. 34 (2): 564–74. doi:10.1093/nar/gkj454. PMC 1360284. PMID 16449200. http://nar.oxfordjournals.org/cgi/pmidlookup?view=long&pmid=16449200.
^ Levin RE, Van Sickle C (1976). “Autolysis of high-GC isolates of Pseudomonas putrefaciens”. Antonie Van Leeuwenhoek 42 (1–2): 145–55. doi:10.1007/BF00399459. PMID 7999.
^ Hurst LD, Merchant AR (March 2001). “High guanine-cytosine content is not an adaptation to high temperature: a comparative analysis amongst prokaryotes”. Proc. Biol. Sci. 268 (1466): 493–7. doi:10.1098/rspb.2000.1397. PMC 1088632. PMID 11296861. http://journals.royalsociety.org/openurl.asp?genre=article&issn=0962-8452&volume=268&issue=1466&spage=493.
^ Zheng H, Wu H (December 2010). “Gene-centric association analysis for the correlation between the guanine-cytosine content levels and temperature range conditions of prokaryotic species”. BMC Bioinformatics 11: S7. doi:10.1186/1471-2105-11-S11-S7. PMC 3024870. PMID 21172057. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3024870/.
^ Madigan,MT. and Martinko JM. (2003). Brock biology of microorganisms (10th ed.). Pearson-Prentice Hall. ISBN 84-205-3679-2.
^ Definition of GC-ratio on Northwestern University, IL, USA
^ Wilhelm J, Pingoud A, Hahn M (May 2003). “Real-time PCR-based method for the estimation of genome sizes”. Nucleic Acids Res. 31 (10): e56. doi:10.1093/nar/gng056. PMC 156059. PMID 12736322. http://nar.oxfordjournals.org/cgi/pmidlookup?view=long&pmid=12736322.
^ Vinogradov AE (May 1994). “Measurement by flow cytometry of genomic AT/GC ratio and genome size”. Cytometry 16 (1): 34–40. doi:10.1002/cyto.990160106. PMID 7518377.
^ Bernardi G (January 2000). “Isochores and the evolutionary genomics of vertebrates”. Gene 241 (1): 3–17. doi:10.1016/S0378-1119(99)00485-0. PMID 10607893. http://linkinghub.elsevier.com/retrieve/pii/S0378-1119(99)00485-0.
^ Furey TS, Haussler D (May 2003). “Integration of the cytogenetic map with the draft human genome sequence”. Hum. Mol. Genet. 12 (9): 1037–44. doi:10.1093/hmg/ddg113. PMID 12700172. http://hmg.oxfordjournals.org/cgi/pmidlookup?view=long&pmid=12700172.
^ Sumner AT, de la Torre J, Stuppia L (August 1993). “The distribution of genes on chromosomes: a cytological approach”. J. Mol. Evol. 37 (2): 117–22. doi:10.1007/BF02407346. PMID 8411200.
^ Aïssani B, Bernardi G (October 1991). “CpG islands, genes and isochores in the genomes of vertebrates”. Gene 106 (2): 185–95. doi:10.1016/0378-1119(91)90198-K. PMID 1937049.
^ Pozzoli U, Menozzi G, Fumagalli M, et al (2008). “Both selective and neutral processes drive GC content evolution in the human genome”. BMC Evol. Biol. 8: 99. doi:10.1186/1471-2148-8-99. PMC 2292697. PMID 18371205. http://www.biomedcentral.com/1471-2148/8/99.
^ Wuitschick JD, Karrer KM (1999). “Analysis of genomic G + C content, codon usage, initiator codon context and translation termination sites in Tetrahymena thermophila”. J. Eukaryot. Microbiol. 46 (3): 239–47. doi:10.1111/j.1550-7408.1999.tb05120.x. PMID 10377985.
^ Birdsell JA (1 July 2002). “Integrating genomics, bioinformatics, and classical genetics to study the effects of recombination on genome evolution”. Mol. Biol. Evol. 19 (7): 1181–97. doi:10.1093/oxfordjournals.molbev.a004176. PMID 12082137. http://mbe.oxfordjournals.org/cgi/pmidlookup?view=long&pmid=12082137.
^ Wayne LG, et al (1987). “Report of the ad hoc committee on reconciliation of approaches to bacterial systematic”. International journal of systematic bacteriology 37 (4): 463–4. doi:10.1099/00207713-37-4-463.
^ Taxonomy browser on NCBI
^ Whole genome data of "Streptomyces coelicolor" A3(2) on NCBI
^ Whole genome data of Saccharomyces cerevisiae on NCBI
^ Whole genome data of Arabidopsis thaliana on NCBI
^ Whole genome data of Plasmodium falciparum on NCBI
^ Musto H, Cacciò S, Rodríguez-Maseda H, Bernardi G (1997). “Compositional constraints in the extremely GC-poor genome of Plasmodium falciparum”. Mem. Inst. Oswaldo Cruz 92 (6): 835–41. doi:10.1590/S0074-02761997000600020. PMID 9566216. http://www.scielo.br/pdf/mioc/v92n6/3431.pdf.
外部リンク
- Table with GC-content of all sequenced prokaryotes
Taxonomic browser of bacteria based on GC ratio on NCBI website.- Genome Composition Database List of species