Sequenciamento de genoma e rdemarco/FFI0760/sequenciamento.pdf · sequenciamento de DNA ... enzimas…

  • View
    212

  • Download
    0

Embed Size (px)

Transcript

  • Sequenciamento de genoma e transcriptomas

  • Durante dcadas o mtodo de Sanger foi

    praticamente a nica opo utilizada para

    sequenciamento de DNA

    Nos ltimos anos surgiram novas

    tecnologias de sequenciamento em larga

    escala que foram denominadas como

    Next-Generation Sequencing (NGS)

  • Apesar de serem apresentadas como um conjunto as

    varias tecnologias que fazem parte do NGS apresentam

    principio bem diferentes

    Em comum elas tem a paralelizao de diversos

    processos levando a analise simultnea de milhares de

    molculas :

    Sanger ~104 nucleotdeos sequenciados/corrida,

    NGS ~108-10 nucleotdeos sequenciados/corrida

    Next Generation sequencing

  • Estratgias para captura de DNA

    2 tipos principais de estratgias:

    1- Amplificao clonal: utilizao de PCR em

    emulso ou amplificao em fase solida

    2- deteco a partir de uma nica molcula:

    Imobilizao de molculas em um suporte

    solido

  • Mtodos de sequencamento

    Diferentes mtodos podem ser utilizados para o sequenciamento das molculas de DNA:

    -Terminao ciclo-reversivel

    -Sequenciamento por ligao

    -pirosequenciamento

    -Sequenciamento em tempo real

  • Terminao ciclo reversvel

    Adio de nucleotdeos bloqueados ligados a molculas florescentes

    Desbloqueio de nucleotdeo permite sucessivos ciclos

  • Sequenciamento por ligao

    Sondas ligadas a molculas fluorescentes fluorescentes reconhecem 2 bases por ciclo.

    Necessidade de diversos ciclos de ligao para sequenciar molcula

  • Pirosequenciamento

    Reao luminescente acoplada a incorporao de nucleotdeos

    Sinal fluorescente proporcional ao numero de nucleotdeos incorporados

  • Sequenciamento em tempo real

    Nucleotdeos acoplados a molculas fluorescentes ligados a quenchers, somente quando ocorre incorporao h deteco de fluorescncia

  • Por que seqenciar genomas?

    O seqenciamento de genomas o primeiro passo para obter uma descrio completa da composio molecular de cada organismo, pois todas informaes necessria para construo esto presentes no DNA genmico (Entretanto a interpretao estas informaes ainda um problema)

    Comparao de genomas de diversos indivduos permitira correlacionar caractersticas e sndromes com mutaes de determinados locus do genoma (mesmo que no tenhamos idia da funo deste locus)

    Comparaes entre genomas de espcies prximas permite o melhor entendimento dos mecanismos de evoluo de genomas

    Um melhor conhecimento do genoma permite com que manipulemos este com maior facilidade

  • Tamanho de genomas

    possvel notar que no h uma correlao direta entre tamanho do genoma

    e complexidade do organismo

  • Seqenciamento de genomas Genomas possuem grande numero de bases em seu genoma (105 a 1012) e

    ate o momento as tcnicas existentes de seqenciamento conseguem amostrar apenas algumas centenas de bases por reao.

    Deste modo, o genoma tem que ser seqenciado de forma descontinua com milhares de reaes sendo realizadas em paralelo para obteno da informao necessria

    Isto gera uma grande quantidade de seqncias derivadas do genoma que se apresentam de forma desconexa, visto que no existe nenhuma propriedade intrnseca que permite a ordenao inequvoca destas

    Deste modo um dos grandes desafio ao seqenciar genomas a montagem destas sequencias de modo que elas possam reproduzir a ordenao encontrada nos cromossomos

  • Seqenciamento de DNA por fragmentao

    Esquematizao da estratgia bsica

    de seqenciamento de genomas

    Quebra do DNA pode ser feita com

    enzimas de restrio ou via nebulizao

    Clonagem de fragmentos com tamanho

    aproximado conhecido importante

    para a posterior montagem das

    seqncias

  • Estratgias de seqenciamento de genomas

    Existem duas estratgias bsicas de

    sequenciamento de genomas :

    Seqenciamento de clones- DNA cortado em

    fragmentos grandes (utilizando enzimas de

    restrio) e clonado em BACs (Cromossomo

    Artificial de Bactria), que aceitam fragmentos

    de at ~200 mil bases

    Aps isso so selecionados clones que so

    separadamente cortados (por nebulizao) e

    sub-clonados em plamideos. Seqenciamento

    destes sub-clones permitir a reconstituio do

    clone do BAC

    Apesar te ter sido a tcnica de referencia no

    inicio de sequenciamento de genomas, no

    mais utilizada com freqncia.

  • Estratgias de seqenciamento de genomas

    Whole Genome Shotgun (WGS)- O genoma inteiro picotado em pedaos de alguns poucos milhares de pares de bases (por nebulizao) e clonado em plasmideos. So realizada clonagens de fragmentos maiores em vetores apropriados (BACs, Fosmideos, etc..) mas somente as pontas so seqenciadas.

    Seqenciamento das duas extremidade de cada clone realizada e utilizando a informao de seqncia e a estimativa de distancia entre as duas pontas do clone busca-se montar o genoma inteiro

    Aps a montagem das seqncias obteremos pedaos que so denominados contigs, no melhor cenrio cada contig deveria representar um cromossomo, mas normalmente o que ocorre a formao de mais de 1 contig por cromossomo devido a regies que apresentam problemas e que no so montadas de modo apropriado

  • Cobertura de sequenciamento

    Devido ao carter randmico de seqenciamento utilizando a tcnica de WGS necessrio seqenciar uma quantidade de bases muito maior do que o numero de bases do genoma (pelo menos 8X mais) devido a redundncia do sequenciamento

  • Problemas na montagem do DNA

    Devido ao alto numero de

    seqncias repetitivas existe uma

    alta probabilidade que duas

    seqncias no contiguas mas

    que possuam a mesma repetio

    em sua extremidade possam ser

    sobrepostas na montagem

    Par evitar isso em adio ao

    algoritmo de alinhamento de DNA

    utiliza-se a informao de

    distancia entre as seqncias das

    pontas de cada clone na

    montagem do genoma

  • Montagem do esqueleto do genoma

    Apesar de idealmente ser possvel a composio de um nico contig por cromossomo, no isso que ocorre de fato, devido a presena de sequncias repetitivas, regies no clonaveis, etc..

    Devido a isso, a analise resultar em diversos contigs por cromossomos.

    Apesar de no ser possvel sobrepor estas sequencias para obter um contig nico possvel orden-las e estimar a distancia entre elas a fim de produzir um esqueleto do cromossomo.

    As tcnicas de FISH e mapeamento por segregao so muito utilizadas para esta finalidade.

  • Mapeamento fsico de seqncias por FISH

    Um vez que obtemos os contigs

    importante a determinao da regio

    de que cromossomo esta seqncia

    localizada

    Para isso utiliza-se uma tcnica de

    hibridizao em cromossomos (FISH),

    que utiliza uma sonda que represente

    uma regio nica no genoma que

    esteja representada no contig de

    interesse, o resultado mostrar a

    regio de qual cromossomo esta

    seqncia se localiza

    Com esta informao possvel utilizar

    os contig para montar um esqueleto de

    cada cromossomo.

  • Mapeamento de sequencias por segregao

    Construdo a partir das taxas de recombinao meitica (crossing-over) de marcadores no genoma

    Centimorgan- probabilidade de 1% que dois genes se separem em evento de mitose.

  • Analise de genomas

    Uma vez que obtemos a sequncia extensiva do genoma de um organismo possvel analis-la com o intuito de obter uma maior compreenso sobre a informao contida no mesmo.

    No entanto tal analise no trivial devido a composio e organizao de genomas.

  • Complexidade de genomas

    Experimentos de cintica de

    reassociao permitem obter uma

    estimativa da complexidade de cada

    genoma

    De modo geral genomas de

    eucariotos possuem uma grande

    frao de regies repetitivas

  • Complexidade de genomas

    Experimentos utilizado pequena quantidade de molculas de mRNA permitem ver que a maior frao do que expresso pela clula provem de regies no repetitivas

    Este experimentos permitem deduzir que o DNA composto em grande parte por elementos repetitivos, mas os RNAs so transcritos principalmente de regies no-repetitivas.

  • Complexidade de genomas

    A presena destas regies repetitivas explica em parte porque o tamanho dos genomas no proporcional a complexidade do organismo visto que uma serie de organismos menos completos possuem uma alta quantidade de DNA repetitivo.

    Este DNA repetitivo no possui uma funo clara e por isso muitas vezes referido como junk DNA

  • Correlao entre o genoma e a complexidade de organismos

    possvel notar um tendncia de organismos mais complexos possurem genes com um maior numero de exons.

  • Seqenciamento de transcriptomas

    Conforme mostrado no slide anterior organismos mais complexos tendem a possuir genes com um alto numero de exons. Alm disso, o genoma destes organismos possuem uma alta quantidade de seqncias no-codificantes e portanto a predio da estrutura de genes no trivial.

    Deste modo o seqenciamento direto das molculas de mRNA pode fornecer informaes a respeito da estrutura de um gene, pois representa a molcula madura formada aps os eventos de splicing

    Alm disso, o seqenciamento de mRNA permite a amostragem direta das seqncias codificantes permitindo com que um menor volume de seqenciamento se obtenha maior informaes sobre as protenas deste organismo

  • Seqenciamento de transcriptomas

    Aps o isolamento das molculas de mRNA realizada a reao de tran