Aplicação da análise de agrupamento de dados de expressão gênica temporal a dados em painel

Moysés Nascimento, Thelma Sáfadi, Fabyano Fonseca e Silva

Resumo


O objetivo deste trabalho foi determinar a melhor alternativa, entre os métodos de agrupamento hierárquico (Ward) e de otimização (Tocher), para a formação de grupos homogêneos de séries de expressão gênica, e realizar previsões quanto à expressão gênica dessas séries, a partir de pequeno número de observações temporais. Os dados utilizados referem-se à expressão de genes que atuam sobre o ciclo celular de Saccharomyces cerevisiae e corresponderam a 114 séries de expressão gênica, cada uma com dez valores de “fold-change” (medida da expressão gênica) ao longo do tempo (0, 15, 30, 45, 60, 75, 90, 105, 120 e 135 min). As estimativas dos parâmetros dos modelos autorregressivos AR(p) foram previamente ajustadas a séries individuais (de cada gene) de dados “microarray time series” e utilizadas, como variáveis, no processo de agrupamento. As previsões da expressão gênica foram feitas dentro de cada grupo formado, a partir dos ajustes no modelo AR(p) para dados em painel. O método de Ward foi o mais apropriado para a formação de grupos de genes com séries homogêneas. Uma vez obtidos esses grupos, é possível ajustar o modelo AR(2) para dados em painel e predizer a expressão gênica em um tempo futuro (135 min), a partir de um pequeno número de observações temporais (os outros nove valores de “fold-change”).


Palavras-chave


bioinformática; método de Tocher; método de Ward; microarranjo; modelo autorregressivo; série temporal

Texto completo:

PDF


Embrapa Sede, Gerência-Geral de Governança Corporativa e Informação,

Parque Estação Biológica - PqEB - Av. W3 Norte (final) Caixa Postal 040315 - Brasília, DF - Brasil - 70770-901
Fone: +55 (61) 3448-2461