Sequência de Kozak

Distribuição de freqüência de bases nucleotídicas em volta do códon de início AUG (+1 a +3), representado pelo tamanho das respectivas iniciais, que  formam a sequência de Kozak

A sequência de Kozak, ingl. Kozak consensus sequence, é uma determinada sequência presente no RNA mensageiro (mRNA) de organismos eucarióticos. Ela representa um consenso entre as bases nucleotídicas encontradas mais frequentemente em volta do códon de início AUG no mRNA. A sequência de 5'-(gcc)gccRccAUGG-3' é, muitas vezes, chamada de sequência de Kozak, porém há diferenças significativas entre os diferentes grupos de eucariontes.[1] A sequência de Kozak, ou sequências semelhantes, são reconhecidas pelo ribossomo, sendo importantes para o início da Tradução no contexto da biossíntese de proteínas. Variações nessa sequência podem afetar a eficiência e a magnitude da biossíntese da proteína codificada por esse mRNA.[2]

Variações

Entre os organismos eucarióticos, encontram-se diferentes variações de sequência de Kozakː

Biota Filo Consenso sequências
Vertebrados
gccRccATGG
Mosca-da-fruta (Drosophila melanogaster) Arthropoda   cAAaATG[3]
Fermento de pão (Saccharomyces cerevisiae) Ascomycota aAaAaAATGTCt[4]
Dictyostelium discoideum Amoebozoa aaaAAAATGRna[5]
Ciliophora Ciliophora nTaAAAATGRct
Plasmodium sp. Apicomplexa taaAAAATGAan
Toxoplasma gondii Apicomplexa gncAaaATGg[6]
Trypanosomatidae Euglenozoa nnnAnnATGnC
As plantas terrestres
  AACAATGGC[7]

Referências

  1. 15. PMID 3313277. doi:10.1093/nar/15.20.8125 
  2. 308. PMID 6700727. doi:10.1038/308241a0 
  3. 15. PMID 3822832. doi:10.1093/nar/15.4.1353 
  4. 15. PMID 3554144. doi:10.1093/nar/15.8.3581 
  5. 19. PMID 2041747. doi:10.1093/nar/19.10.2715 
  6. 83. PMID 9089733. doi:10.1007/s004360050254 
  7. 6. PMID 3556162