Clustering de Pixels basado en el Modelo - PowerPoint PPT Presentation

About This Presentation
Title:

Clustering de Pixels basado en el Modelo

Description:

Clustering de Pixels basado en el Modelo El nivel de expresi n de un gen es proporcional a las intensidades de los pixels de un spot. Los pixels de un artefacto, por ... – PowerPoint PPT presentation

Number of Views:37
Avg rating:3.0/5.0
Slides: 7
Provided by: and7222
Category:

less

Transcript and Presenter's Notes

Title: Clustering de Pixels basado en el Modelo


1
Clustering de Pixels basado en el Modelo
  • El nivel de expresión de un gen es proporcional
    a las intensidades de los pixels de un spot.
  • Los pixels de un artefacto, por ejemplo un
    scratch, tendrán intensidades distintas a los
    del background o foreground.
  • De esto se desprende naturalente la
    clasificacion de los pixeles segun sus
    intensidades

2
Clustering de Pixels basado en el Modelo
En clustering basado en el modelo, los datos de intensidades se consideran como provenientes de una mezcla de densidades
A partir del histograma de intensidades de un spot, parece natural considerarlo como una mezcla de normales.
La funcion de verosimilitud es para los datos
3
Histograma de intensidades de un spot
4
  • Para un K fijo los valores de Si, µi y pi,
    pueden estimarse usando el algoritmo E-M
    jerárquico de clustering basado en el modelo
    (Dasgupta y Raftery, 1998).
  • El numero de K puede ser estimado usando el BIC
    (Bayes information criterion).
  • Para combinar ambas señales, se suman.
  • En la mayoría de los casos se espera que el
    número de grupos, K, sea a lo sumo 3. Por eso, el
    BIC se restringe a K menor o igual a 3.
  • K 1, no hay spot, es un blanco.
  • K 2, hay un spot y el background.
  • K 3, hay un spot, un artefacto o agujero
    interno y background.

5
Extracción del Componente Conectado Espacialmente
  • Los artefactos, por lo general, se encuentran en
    grupos pequeños inconexos. Por este motivo,
    establecer una tamaño límite de componentes
    conectados en un cluster permite identificar
    clusters formados por artefactos.
  • Para dividir a los clusters en componentes
    conectados espacialmente, se utiliza el
    procedimiento de etiquetado de los 4 componentes
    vecinos conectados (4-neighbor connected
    component labeling procedure).
  • Por defecto, sólo se conservan los componentes
    conectados con un tamaño mayor a los 100 pixels,
    que representa la sexta parte del tamaño típico
    de un spot.
  • Los clusters más brillantes y más oscuros que
    pasen el tamaño límite se clasifican como
    foreground y background, respectivamente.
  • Si sólo un cluster pasa el tamaño límite, se
    concluye que no hay spot y que esa ubicación está
    en blanco.

6
Estimación de la Intensidad
  • La estimación de la intensidad del foreground en
    el canal Cy3 es el promedio de los pixels en el
    cluster foreground. Lo mismo ocurre para el canal
    foreground Cy5, donde los mismos pixels están en
    el cluster para ambos canales.
  • Las intensidades del background para los dos
    canales se estiman de la misma manera.
  • Cuando se identifican 3 clusters, el cluster
    intermedio también se descarta, pues generalmente
    consiste en pixels sospechosos, como por ej., un
    agujero interno, un artefacto, o un borde difuso.
  • La señal estimada es Is If Ib, donde If e
    Ib son las intensidades medias del foreground y
    background, respectivamente. La señal verdad es
    siempre gt0, pero ocasionalmente, la señal
    estimada puede ser lt 0. En este caso se asume que
    la intensidad verdadera es pequeña pero positiva,
    y se setea Is como el 5to percentil de las
    señales del spot en el arreglo.
Write a Comment
User Comments (0)
About PowerShow.com