GC含量






AT対とGC対。矢印は水素結合を指している。


GC含量(GC-content)は、DNA分子中の窒素塩基のうちグアニンとシトシンの割合である[1]。また、この用語はDNA・RNAの特定の断片や、ゲノム全体に対しても用いられる。


AT対が2つの水素結合で結ばれているのに対し、GC対は3つの水素結合で結ばれている。GC含量の高いDNAは低いものよりも安定しているが、この安定性は水素結合によるものではなく、主にスタッキング相互作用によるものである[2]。遺伝物質の高い耐熱性に関わらず、高いGC含量のDNAを含む細胞は自己融解を起こし、細胞の寿命自体は短い[3]。高GC含量のDNAを持つ生物の頑健性のため、GC含量は温度適応に重要な役割を果たすと信じられてきたが、この仮説は反証された[4]。しかし同じ研究で、高温と(rRNA・tRNAや他のncRNAのような)構造RNAのGC含量との間で強い相関が示された。近年初めて行われた、遺伝子を中心とした体系的な大規模相関分析によって、特定のゲノム部位についてのみGC含量と温度の間に相関が見られることが示された[5]


PCRでは、プライマーのGC含量から相補DNAのアニーリング温度が予測される。高いGC含量を持つプライマーは、高いアニーリング温度を持つことが示唆される。




目次






  • 1 GC含量の決定


  • 2 ゲノムのGC比


  • 3 GC比と配列決定


  • 4 分類学への応用


  • 5 出典


  • 6 外部リンク





GC含量の決定


GC含量%は次のように計算される[6]


G+CA+T+G+C× 100{displaystyle {cfrac {G+C}{A+T+G+C}}times 100}{cfrac  {G+C}{A+T+G+C}}times  100

別の表現としてAT/GC比があり、次のように計算される[7]


A+TG+C{displaystyle {cfrac {A+T}{G+C}}}{cfrac  {A+T}{G+C}}

これらは様々な方法で測定可能であるが、最も単純な方法の1つに、分光測色法を用いたDNAの「融点」の測定がある。DNAによる波長260nmの吸光は、二重鎖DNAが十分に加熱されて一本鎖DNAに分離すると急激に増加する[8]。最も一般的に用いられている手法として、ATまたはGCのみに結合する蛍光色素を用いた、大量のDNAサンプルに対するフローサイトメトリーの利用がある[9]


別の自明な方法として、DNA・RNAの塩基配列が決定されると、単純計算によりGC含量を正確に算出できる。



ゲノムのGC比


ゲノム中のGC比はかなり変動がある。複雑な生物では、高GC比領域はモザイク状に点在し、アイソコアと呼ばれる"小島"状の領域を形成する[10]。これは、染色体の染色強度の違いに直接現れる[11]。アイソコアはタンパク質コード領域を多く含むため、これらの領域のGC比の決定は、遺伝子の多い領域をゲノム中から特定することに役立つ[12][13]



GC比と配列決定


ゲノム配列を俯瞰すると、非コード領域に対し、タンパク質コード領域は高いGC含量を持つことがよく見られる。コード領域の長さがGC含量に正比例することを示す証拠も得られている[14]。終止コドンがアデニンとチミンに偏っているという理由から、配列が短いほどATバイアスは高くなる[15]



分類学への応用


分類群によってGC含量が異なる理由として、進化過程における選択・突然変異バイアス・DNA修復時のバイアス等の寄与が想定されている[16]。原核生物分類学の種の定義における問題は、細菌の分類に関する様々な示唆を与え、ad hoc committee on reconciliation of approaches to bacterial systematicsは細菌の高次分類にGC比を用いることを勧告した[17]。例えば、放線菌は「高GC含量の細菌」として特徴づけられ[18]、その1種であるストレプトマイセス属のStreptomyces coelicolor A3(2)では72%である[19]。細菌以外のモデル生物では、出芽酵母では38%[20]、シロイヌナズナでは36%である[21]。コドンの性質のため、GC含量が0%や100%に近い状態となることは実質的にはあり得ないが、熱帯熱マラリア原虫では20%以下と非常に低く[22]、AT含量が多い(つまりGC含量が少ない)生物としてしばしば言及される[23]



出典





  1. ^ Definition of GC – content on CancerWeb of Newcastle University,UK


  2. ^ Yakovchuk P, Protozanova E, Frank-Kamenetskii MD (2006). “Base-stacking and base-pairing contributions into thermal stability of the DNA double helix”. Nucleic Acids Res. 34 (2): 564–74. doi:10.1093/nar/gkj454. PMC 1360284. PMID 16449200. http://nar.oxfordjournals.org/cgi/pmidlookup?view=long&pmid=16449200. 


  3. ^ Levin RE, Van Sickle C (1976). “Autolysis of high-GC isolates of Pseudomonas putrefaciens”. Antonie Van Leeuwenhoek 42 (1–2): 145–55. doi:10.1007/BF00399459. PMID 7999. 


  4. ^ Hurst LD, Merchant AR (March 2001). “High guanine-cytosine content is not an adaptation to high temperature: a comparative analysis amongst prokaryotes”. Proc. Biol. Sci. 268 (1466): 493–7. doi:10.1098/rspb.2000.1397. PMC 1088632. PMID 11296861. http://journals.royalsociety.org/openurl.asp?genre=article&issn=0962-8452&volume=268&issue=1466&spage=493. 


  5. ^ Zheng H, Wu H (December 2010). “Gene-centric association analysis for the correlation between the guanine-cytosine content levels and temperature range conditions of prokaryotic species”. BMC Bioinformatics 11: S7. doi:10.1186/1471-2105-11-S11-S7. PMC 3024870. PMID 21172057. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3024870/. 


  6. ^ Madigan,MT. and Martinko JM. (2003). Brock biology of microorganisms (10th ed.). Pearson-Prentice Hall. ISBN 84-205-3679-2. 


  7. ^ Definition of GC-ratio on Northwestern University, IL, USA


  8. ^ Wilhelm J, Pingoud A, Hahn M (May 2003). “Real-time PCR-based method for the estimation of genome sizes”. Nucleic Acids Res. 31 (10): e56. doi:10.1093/nar/gng056. PMC 156059. PMID 12736322. http://nar.oxfordjournals.org/cgi/pmidlookup?view=long&pmid=12736322. 


  9. ^ Vinogradov AE (May 1994). “Measurement by flow cytometry of genomic AT/GC ratio and genome size”. Cytometry 16 (1): 34–40. doi:10.1002/cyto.990160106. PMID 7518377. 


  10. ^ Bernardi G (January 2000). “Isochores and the evolutionary genomics of vertebrates”. Gene 241 (1): 3–17. doi:10.1016/S0378-1119(99)00485-0. PMID 10607893. http://linkinghub.elsevier.com/retrieve/pii/S0378-1119(99)00485-0. 


  11. ^ Furey TS, Haussler D (May 2003). “Integration of the cytogenetic map with the draft human genome sequence”. Hum. Mol. Genet. 12 (9): 1037–44. doi:10.1093/hmg/ddg113. PMID 12700172. http://hmg.oxfordjournals.org/cgi/pmidlookup?view=long&pmid=12700172. 


  12. ^ Sumner AT, de la Torre J, Stuppia L (August 1993). “The distribution of genes on chromosomes: a cytological approach”. J. Mol. Evol. 37 (2): 117–22. doi:10.1007/BF02407346. PMID 8411200. 


  13. ^ Aïssani B, Bernardi G (October 1991). “CpG islands, genes and isochores in the genomes of vertebrates”. Gene 106 (2): 185–95. doi:10.1016/0378-1119(91)90198-K. PMID 1937049. 


  14. ^ Pozzoli U, Menozzi G, Fumagalli M, et al (2008). “Both selective and neutral processes drive GC content evolution in the human genome”. BMC Evol. Biol. 8: 99. doi:10.1186/1471-2148-8-99. PMC 2292697. PMID 18371205. http://www.biomedcentral.com/1471-2148/8/99. 


  15. ^ Wuitschick JD, Karrer KM (1999). “Analysis of genomic G + C content, codon usage, initiator codon context and translation termination sites in Tetrahymena thermophila”. J. Eukaryot. Microbiol. 46 (3): 239–47. doi:10.1111/j.1550-7408.1999.tb05120.x. PMID 10377985. 


  16. ^ Birdsell JA (1 July 2002). “Integrating genomics, bioinformatics, and classical genetics to study the effects of recombination on genome evolution”. Mol. Biol. Evol. 19 (7): 1181–97. doi:10.1093/oxfordjournals.molbev.a004176. PMID 12082137. http://mbe.oxfordjournals.org/cgi/pmidlookup?view=long&pmid=12082137. 


  17. ^ Wayne LG, et al (1987). “Report of the ad hoc committee on reconciliation of approaches to bacterial systematic”. International journal of systematic bacteriology 37 (4): 463–4. doi:10.1099/00207713-37-4-463. 


  18. ^ Taxonomy browser on NCBI


  19. ^ Whole genome data of "Streptomyces coelicolor" A3(2) on NCBI


  20. ^ Whole genome data of Saccharomyces cerevisiae on NCBI


  21. ^ Whole genome data of Arabidopsis thaliana on NCBI


  22. ^ Whole genome data of Plasmodium falciparum on NCBI


  23. ^ Musto H, Cacciò S, Rodríguez-Maseda H, Bernardi G (1997). “Compositional constraints in the extremely GC-poor genome of Plasmodium falciparum”. Mem. Inst. Oswaldo Cruz 92 (6): 835–41. doi:10.1590/S0074-02761997000600020. PMID 9566216. http://www.scielo.br/pdf/mioc/v92n6/3431.pdf. 




外部リンク



  • Table with GC-content of all sequenced prokaryotes


  • Taxonomic browser of bacteria based on GC ratio on NCBI website.

  • Genome Composition Database List of species




Popular posts from this blog

android studio warns about leanback feature tag usage required on manifest while using Unity exported app?

SQL update select statement

'app-layout' is not a known element: how to share Component with different Modules