Title: An
1Análise de Estruturas de Proteínas
2Roteiro
- Introdução
- Predição de Estrutura Secundária (Parte 1)
- Apresentação do problema
- Exemplos de abordagens
- Preditor NNPSS
- Comparação e Detecção de Padrões Estruturais
(Parte 2) - Apresentação do problema
- Exemplos de abordagens
- Modelo desenvolvido
3Introdução
- Proteínas
- Metabolismo, suporte de filamentos, catálise
bioquímica, regulação do volume celular e
imunização
4Introdução
Seqüências X Estruturas
5Introdução
6Predição de Estrutura Secundária de Proteínas
7Predição de Estrutura Secundária
- Patrick J. Fleming, Haipeng Gong and George D.
Rose (2006) Secondary structure determines
protein topology. Protein Science 151828-1834.
8O Preditor NNPSS
9Extração de Características
10Comparação e Detecção de Estruturas
11Comparação e Detecção de Estruturas
12Motivos (motifs) estruturais
- Elemento estrutural tri-dimensional encontrado em
diversas moléculas. - Ex. Coiled Coil
GCN4 leucine zipper
gp41 hexamer initiates the entry of HIV into
its target cell.
13Domínios Estruturais
- Estruturas compactas
- Função
- Ação individual ou em conjunto
- Delimitação
- Bases de Dados
- 3Dee
- CATH
- Dali
- SCOP
Pyruvate kinase, a protein from three domains
14Classificação de Estruturas
15Alinhamento Estrutural
- Alinhamento de seqüências baseado em comparação
estrutural - Comparação de proteínas com baixa similaridade
entre as seqüências.
Thioredoxin Humano X Drosophila melanogaster.
16Processo de Comparação
- Escolha das características
- Elementos geométricos
- Elementos topológicos
- Propriedades físico-químicas dos aminoácidos
- Representação
- Rotação e translação
- Pouca variação diante de pequenas diferenças
17Processo de Comparação
- Representação através de um conjunto de pontos
- Coordenadas dos centros dos átomos
- Restrição da região de comparação
- Cadeias laterais
- Escalier, V. (1997). Algorithmes pour la
comparaison de structures moléculaires
tridimensionnelles. PhD thesis, Université Paris
VII.
18Processo de Comparação
- Representação através de EES
- Mais simples e compacta (15300)
- Mecanismos genéticos raramente produzem mutações
topológicas
- Dror, O., Benyamini, H., Nussinov, R., and
Wolfson, H. J. (2003). Multiple structural
alignment by secondary structures Algorithm and
applications. Protein Science, 122492-2507.
19Exemplos de Abordagens
- Arthur Lesk, 1995
- Distribuição dos elementos de estrutura
secundária (SSEs) ao longo da cadeia - Interações geométricas entre tais elementos
- Representação Matricial
- Classes de interação
?1 ?1 ?2 ?3
?1 PE KK
?1 PD
?2 PE HH
?3 HH PD HH
- Lesk, A. M. (1995). Systematic representation of
protein folding patterns. Journal of Molecular
Graphics, 13159-164.
20Exemplos de Abordagens
- Ferramenta TOPS
- Seqüência de SSEs (grafos)
- Relações entre pares de elementos
- Ignora tamanho e orientações precisas
- up e down
- Busca em bancos de dados definidos
- Michalopoulos, I., Torrance, G. M., Gilbert, D.
R., and Westhead, D. R. (2004). TOPS an enhanced
database of protein structural topology. Nucleic
Acids Research, 32.
21Exemplos de Abordagens
- Ferramenta MASS
- Dois níveis
- Elementos de estrutura secundária (SSEs)
- Tipo, distância ? 1.5Å, diferença entre ângulos ?
0.3 rad - Coordenadas atômicas dos C?
- Dror, O., Benyamini, H., Nussinov, R., and
Wolfson, H. J. (2003). Multiple structural
alignment by secondary structures Algorithm and
applications. Protein Science, 122492-2507.
22Exemplos de Abordagens
23Pontos Abordados
- Informações a serem consideradas no processo da
comparação - Comparação múltipla
24Representação Proposta
- Dados
- Obtenção de vetores através do VAST
- Acesso direto ao valor do ângulo ou dupla
codificação - Distâncias
- Tamanho dos vetores
- Flexibilidade
- Representação através de grafos
- Gibrat, J.-F., Madej, T., and Bryant, S. H.
(1996). Surprising similarities in structure
comparison. Current Opinion in Structural
Biology.
25Busca por Motivos
26Busca por Motivos
- Algoritmo do Ullmann
- Estender um mapeamento M inicialmente vazio
- Enumerar todos os possíveis isomorfismos
- Seleção de possibilidades baseada no grau dos
vértices - Teste de adjacência
27Busca por Motivos
- Adaptação do algoritmo do Ullmann
- Representação adotada para o problema
- Restrições
- Grau dos vértices, tipo, tamanho
- Relações entre pares de elementos
- Ângulo, código, distâncias
- Grau dos vértices
- Testes preliminares
- Conjunto de 20 globinas
- Reconhece a ocorrência de motivos no conjunto
- Proteínas similares têm representações similares
28Busca por Subestrutura Comum
- Busca por subgrafo maximal
- Generalização de isomorfismo de grafos
- NP-completo
- Adaptação do algoritmo de McGregor
- Representação adotada
- Comparação múltipla
29Busca por Subestrutura Comum
- Algoritmo de McGregor
- Efetuar o produto dos grafos envolvidos
- Efetuar a busca por cliques no grafo resultante
- Cliques nos grafos resultantes corresponderão a
subestruturas comuns
30Busca por Subestrutura Comum
c
d
a
b
e
f
(A)
(B)
(AXB)
31Busca por Subestrutura Comum
- Generalização para N proteínas
- Representação adotada
- Vértices similares
- Tipo, tamanho
- Arestas
- Ângulos, distâncias
32Busca por Subestrutura Comum
- Testes
- Conjunto de 20 globinas
- Tipo (não muito seletivo)
- Tamanho
- 30
- Ângulos e distâncias
- Proteínas com dois domínios em comum
- Retorna elementos pertencentes a ambos os domínios
33Busca por Subestrutura Comum
- Proteínas muito semelhantes e com número de
elementos de estrutura secundária bem acima da
média - Número de vértices considerados
- Cliques
- Grafos esparsos