GC含量






AT対とGC対。矢印は水素結合を指している。


GC含量(GC-content)は、DNA分子中の窒素塩基のうちグアニンとシトシンの割合である[1]。また、この用語はDNA・RNAの特定の断片や、ゲノム全体に対しても用いられる。


AT対が2つの水素結合で結ばれているのに対し、GC対は3つの水素結合で結ばれている。GC含量の高いDNAは低いものよりも安定しているが、この安定性は水素結合によるものではなく、主にスタッキング相互作用によるものである[2]。遺伝物質の高い耐熱性に関わらず、高いGC含量のDNAを含む細胞は自己融解を起こし、細胞の寿命自体は短い[3]。高GC含量のDNAを持つ生物の頑健性のため、GC含量は温度適応に重要な役割を果たすと信じられてきたが、この仮説は反証された[4]。しかし同じ研究で、高温と(rRNA・tRNAや他のncRNAのような)構造RNAのGC含量との間で強い相関が示された。近年初めて行われた、遺伝子を中心とした体系的な大規模相関分析によって、特定のゲノム部位についてのみGC含量と温度の間に相関が見られることが示された[5]


PCRでは、プライマーのGC含量から相補DNAのアニーリング温度が予測される。高いGC含量を持つプライマーは、高いアニーリング温度を持つことが示唆される。




目次






  • 1 GC含量の決定


  • 2 ゲノムのGC比


  • 3 GC比と配列決定


  • 4 分類学への応用


  • 5 出典


  • 6 外部リンク





GC含量の決定


GC含量%は次のように計算される[6]


G+CA+T+G+C× 100{displaystyle {cfrac {G+C}{A+T+G+C}}times 100}{cfrac  {G+C}{A+T+G+C}}times  100

別の表現としてAT/GC比があり、次のように計算される[7]


A+TG+C{displaystyle {cfrac {A+T}{G+C}}}{cfrac  {A+T}{G+C}}

これらは様々な方法で測定可能であるが、最も単純な方法の1つに、分光測色法を用いたDNAの「融点」の測定がある。DNAによる波長260nmの吸光は、二重鎖DNAが十分に加熱されて一本鎖DNAに分離すると急激に増加する[8]。最も一般的に用いられている手法として、ATまたはGCのみに結合する蛍光色素を用いた、大量のDNAサンプルに対するフローサイトメトリーの利用がある[9]


別の自明な方法として、DNA・RNAの塩基配列が決定されると、単純計算によりGC含量を正確に算出できる。



ゲノムのGC比


ゲノム中のGC比はかなり変動がある。複雑な生物では、高GC比領域はモザイク状に点在し、アイソコアと呼ばれる"小島"状の領域を形成する[10]。これは、染色体の染色強度の違いに直接現れる[11]。アイソコアはタンパク質コード領域を多く含むため、これらの領域のGC比の決定は、遺伝子の多い領域をゲノム中から特定することに役立つ[12][13]



GC比と配列決定


ゲノム配列を俯瞰すると、非コード領域に対し、タンパク質コード領域は高いGC含量を持つことがよく見られる。コード領域の長さがGC含量に正比例することを示す証拠も得られている[14]。終止コドンがアデニンとチミンに偏っているという理由から、配列が短いほどATバイアスは高くなる[15]



分類学への応用


分類群によってGC含量が異なる理由として、進化過程における選択・突然変異バイアス・DNA修復時のバイアス等の寄与が想定されている[16]。原核生物分類学の種の定義における問題は、細菌の分類に関する様々な示唆を与え、ad hoc committee on reconciliation of approaches to bacterial systematicsは細菌の高次分類にGC比を用いることを勧告した[17]。例えば、放線菌は「高GC含量の細菌」として特徴づけられ[18]、その1種であるストレプトマイセス属のStreptomyces coelicolor A3(2)では72%である[19]。細菌以外のモデル生物では、出芽酵母では38%[20]、シロイヌナズナでは36%である[21]。コドンの性質のため、GC含量が0%や100%に近い状態となることは実質的にはあり得ないが、熱帯熱マラリア原虫では20%以下と非常に低く[22]、AT含量が多い(つまりGC含量が少ない)生物としてしばしば言及される[23]



出典





  1. ^ Definition of GC – content on CancerWeb of Newcastle University,UK


  2. ^ Yakovchuk P, Protozanova E, Frank-Kamenetskii MD (2006). “Base-stacking and base-pairing contributions into thermal stability of the DNA double helix”. Nucleic Acids Res. 34 (2): 564–74. doi:10.1093/nar/gkj454. PMC 1360284. PMID 16449200. http://nar.oxfordjournals.org/cgi/pmidlookup?view=long&pmid=16449200. 


  3. ^ Levin RE, Van Sickle C (1976). “Autolysis of high-GC isolates of Pseudomonas putrefaciens”. Antonie Van Leeuwenhoek 42 (1–2): 145–55. doi:10.1007/BF00399459. PMID 7999. 


  4. ^ Hurst LD, Merchant AR (March 2001). “High guanine-cytosine content is not an adaptation to high temperature: a comparative analysis amongst prokaryotes”. Proc. Biol. Sci. 268 (1466): 493–7. doi:10.1098/rspb.2000.1397. PMC 1088632. PMID 11296861. http://journals.royalsociety.org/openurl.asp?genre=article&issn=0962-8452&volume=268&issue=1466&spage=493. 


  5. ^ Zheng H, Wu H (December 2010). “Gene-centric association analysis for the correlation between the guanine-cytosine content levels and temperature range conditions of prokaryotic species”. BMC Bioinformatics 11: S7. doi:10.1186/1471-2105-11-S11-S7. PMC 3024870. PMID 21172057. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3024870/. 


  6. ^ Madigan,MT. and Martinko JM. (2003). Brock biology of microorganisms (10th ed.). Pearson-Prentice Hall. ISBN 84-205-3679-2. 


  7. ^ Definition of GC-ratio on Northwestern University, IL, USA


  8. ^ Wilhelm J, Pingoud A, Hahn M (May 2003). “Real-time PCR-based method for the estimation of genome sizes”. Nucleic Acids Res. 31 (10): e56. doi:10.1093/nar/gng056. PMC 156059. PMID 12736322. http://nar.oxfordjournals.org/cgi/pmidlookup?view=long&pmid=12736322. 


  9. ^ Vinogradov AE (May 1994). “Measurement by flow cytometry of genomic AT/GC ratio and genome size”. Cytometry 16 (1): 34–40. doi:10.1002/cyto.990160106. PMID 7518377. 


  10. ^ Bernardi G (January 2000). “Isochores and the evolutionary genomics of vertebrates”. Gene 241 (1): 3–17. doi:10.1016/S0378-1119(99)00485-0. PMID 10607893. http://linkinghub.elsevier.com/retrieve/pii/S0378-1119(99)00485-0. 


  11. ^ Furey TS, Haussler D (May 2003). “Integration of the cytogenetic map with the draft human genome sequence”. Hum. Mol. Genet. 12 (9): 1037–44. doi:10.1093/hmg/ddg113. PMID 12700172. http://hmg.oxfordjournals.org/cgi/pmidlookup?view=long&pmid=12700172. 


  12. ^ Sumner AT, de la Torre J, Stuppia L (August 1993). “The distribution of genes on chromosomes: a cytological approach”. J. Mol. Evol. 37 (2): 117–22. doi:10.1007/BF02407346. PMID 8411200. 


  13. ^ Aïssani B, Bernardi G (October 1991). “CpG islands, genes and isochores in the genomes of vertebrates”. Gene 106 (2): 185–95. doi:10.1016/0378-1119(91)90198-K. PMID 1937049. 


  14. ^ Pozzoli U, Menozzi G, Fumagalli M, et al (2008). “Both selective and neutral processes drive GC content evolution in the human genome”. BMC Evol. Biol. 8: 99. doi:10.1186/1471-2148-8-99. PMC 2292697. PMID 18371205. http://www.biomedcentral.com/1471-2148/8/99. 


  15. ^ Wuitschick JD, Karrer KM (1999). “Analysis of genomic G + C content, codon usage, initiator codon context and translation termination sites in Tetrahymena thermophila”. J. Eukaryot. Microbiol. 46 (3): 239–47. doi:10.1111/j.1550-7408.1999.tb05120.x. PMID 10377985. 


  16. ^ Birdsell JA (1 July 2002). “Integrating genomics, bioinformatics, and classical genetics to study the effects of recombination on genome evolution”. Mol. Biol. Evol. 19 (7): 1181–97. doi:10.1093/oxfordjournals.molbev.a004176. PMID 12082137. http://mbe.oxfordjournals.org/cgi/pmidlookup?view=long&pmid=12082137. 


  17. ^ Wayne LG, et al (1987). “Report of the ad hoc committee on reconciliation of approaches to bacterial systematic”. International journal of systematic bacteriology 37 (4): 463–4. doi:10.1099/00207713-37-4-463. 


  18. ^ Taxonomy browser on NCBI


  19. ^ Whole genome data of "Streptomyces coelicolor" A3(2) on NCBI


  20. ^ Whole genome data of Saccharomyces cerevisiae on NCBI


  21. ^ Whole genome data of Arabidopsis thaliana on NCBI


  22. ^ Whole genome data of Plasmodium falciparum on NCBI


  23. ^ Musto H, Cacciò S, Rodríguez-Maseda H, Bernardi G (1997). “Compositional constraints in the extremely GC-poor genome of Plasmodium falciparum”. Mem. Inst. Oswaldo Cruz 92 (6): 835–41. doi:10.1590/S0074-02761997000600020. PMID 9566216. http://www.scielo.br/pdf/mioc/v92n6/3431.pdf. 




外部リンク



  • Table with GC-content of all sequenced prokaryotes


  • Taxonomic browser of bacteria based on GC ratio on NCBI website.

  • Genome Composition Database List of species




Popular posts from this blog

Can a sorcerer learn a 5th-level spell early by creating spell slots using the Font of Magic feature?

Does disintegrating a polymorphed enemy still kill it after the 2018 errata?

A Topological Invariant for $pi_3(U(n))$