Title: Algoritmos y redes complejas
1Algoritmos y redes complejas
2Introducción
- Quién y de dónde soy?
- Modelación de redes naturales
- Extracción de propiedades
- Implicaciones algorítmicas
- Trabajo actual
- Trabajo futuro y colaboraciones
3Sra. Elisa Schaeffer
- Magister en Ciencias, Mención Computación (2000),
especialición en técnicas de implementación y
usabilidad - Después de esto, Licendiado en Ciencias, Mención
Computación (2003), especialición en informática
teórica y matemática discreta (el licendiado es
un título predoctoral en Finlandia)
4Mi universidad
- Universidad Politécnica de Helsinki, Finlandia
(ubicada en Espoo, una ciudad vecina) - Laboratorio de Informática Teórica
- http//www.tcs.hut.fi/
- Supervisado por Doctor Catedrático Pekka Orponen
- Subvencionado por la Academia Finlandesa para un
proyecto de 3 años
5En DCC
- Mi visita perdura desde el 28 de febrero hasta el
16 de diciembre de 2005 - Tengo una beca de buena voluntad de la Fundación
Rotaria para estudiar en Chile - Soy supervisado por Ricardo Baeza-Yates (cuando
vuelva) y Carlos Hurtado - Oficina 329
- E-mail sschaeff_at_dcc.uchile.cl
6Teoría de grafos
- Un grafo G está compuesto de un conjunto de N
vértices (nodos) V y un conjunto de M aristas
(conexiones) E
- Por lo general cada arista conecta exactamente
dos vértices distintos - Las aristas se puede definir sin o con dirección
- Dos vértices conectados por una arista se llaman
vecinos
7Modelos de redes uniformes
- En los años 1950 y 1960, se propusieron los
modelos uniformes de Gilbert y Erdös Rényi - La cantidad de vértices es fija, N, y cada arista
de las N(N-1)/2 posibles tiene la misma
probabilidad de aparecer en el grafo - Gilbert define una probabilidad p para cada
arista - ER define una candidad fija de M aristas
escogidas al azar con probabilidad uniforme
8Redes del mundo real
- Nunca se intentó construir un modelo para
aplicaciones reales los modelos sólo eran para
análisis matemática - En las redes de comunicación, por ejemplo, los
vértices no son iguales las aristas distribuyen
diferentemente entre los vértices más centrales
que los lejanos
9Redes de colaboración científica
- Los vértices representan autores de artículos
científicos - Existe una arista entre dos autores si ellos han
publicado algo juntos - (cf. los números Erdös)
10Watts StrogatzNature 1998
- Fenómeno del mundo pequeño todas las personas
en el mundo se conocen por cadenas de contactos
con más o menos seis personas (realmente basado
en una interpretación mal educada de un estudio
sociológico antiguo) - Proponen un modelo de generación de redes que
combina una topología rígida circular
predeterminada y aristas movidas al azar - Resuelta que el grafo obtiene rutas muy cortas
entre todos los vértices mientras mantiene
vecinarios densos
11La construcción de Watts y Strogatz
12Dos medidas claves
- Coeficiente de racimo (C)
- La proporción de los vecinos de un vértice que
también son vecinos entre ellos (si son todos,
forman una pandilla entre ellos), promediado
por todos los vértices - Largura de sendero promedio (L)
- La largura del sendero más corto entre dos
vértices, promediado por todos los pares de
vértices
13Redes depequeño mundo
- Watts Strogatz observaron que las redes
naturales por lo general tienen - Un coeficiente de racimo más grande que los redes
uniformes y - Una largura de sendero promedio tan baja como los
redes uniformes - Nombraron ejemplos como redes de transmisión
eléctrica, redes de neurones, redes de
comunicación.
14El efecto de la reubicación de aristas
Probabilidad de reubicación
15Distribución de grados
- El grado de un vértice es el número de vecinos
que tiene - La lista de los grados de todos los vértices se
llama la distribución de grado del grafo - También se puede representar como una
distribución probabilística en forma de una
histograma
16Distribución de gradoredes uniformes
La posición del máximo depende de la
probabilidad de conexión, pero la forma de la
distribución no cambia
Escala logarítmica para los ejes
17Distribución de gradoredes de pequeño mundo
(modelo de WS)
Un cambio de altura pero no de forma resulta
cuando se ajusta la probabilidad de reubicación
de las aristas
18Distribución de gradoredes naturales
Se puede obtener una aproximación cruda con una
linea derecha en el gráfico de escala
logarítmica.
Para muchas redes naturales, la distribución
parece muy distinta de las de estos modelos
existen vértices con un grado muy grande que se
llaman concentradores.
19Redes sin escala
- Barabási Albert 1999
- Observaron que la probabilidad Pr(k) de que un
vértice tenga grado k tiene forma k-? - Sugieron el siguente proceso de generación
- Los vértices llegan uno por uno con una
cantidad de aristas predeterminada adjunta. - Los otros extremos de las aristas se conectan en
los vértices que ya existen con probabilidad
relativa de sus grados actuales. - Se necesita un grafo seminal para empezar la
construcción
20Modelos y aplicaciones
- Hoy en día existe muchos modelos también
modelos decididos que combinan las ideas de
redes pequeño-mundo y redes sin escala, para que
éstas concuerdan con las observaciones de
distintos clases de redes naturales - Si se requieren simulaciones en grafos semejantes
de una red de mundo real, primero se miden las
propiedades de la red y despues se generan
instancias similares según un modelo que
corresponde las medidas obtenidas
21Extraccíón de propiedades
- Se necesita algoritmos eficientes para el cálculo
de las medidas de estructura - A menudo es más factible y rápida de calcular
aproximaciones - Si la red natural de que se trata es muy grande,
se necesita métodos de muestreo para analisarla - A veces la red entera no tiene importancia, pero
sólo unos vértices y sus alrededores, en cual
caso se puede utilizar métodos locales
22Algoritmos y redes naturales
- El estudio de algoritmos ha tradicionalmente
usado el modelo ER como fundamento para el
análisis de complejidad promedio cualquier
instancia se supone equiprobable - Las instancias de mundo real son muy específicas
y tienen estructuras especiales los algoritmos
no se podría diseñar y analizar tomando en cuenta
las observaciones estructurales?
23Observaciones algorítmicas
- Para variosos problemas, como la coloración de
grafos y el descubrimiento de cliques máximas, se
ha tomado cuenta que el rendimiento de algoritmos
depende mucho de las propiedades estructurales - Quizás sea posible aprovechar los conocimientos
estructurales de las instancias naturales para
dar eficacia o construir soluciones aproximadas
buenas
24Métodos de tratamiento de grafos muy grandes
- El número de vértices es tan grande que toda la
información de adyacencia no se puede procesar al
mismo tiempo - Normalmente los grafos naturales son muy
esparcidos (N ? M en vez de N ltlt M)
25Algoritmos locales
- Métodos de muestreo
- Descubrimiento de racimos
- subgrafos de alta densidad y independencia del
resto de grafo - aplicaciones en redes ad hoc
- Búsqueda rápida de rutas con largura casi optimal
26Muestreo
- La recoleción de vértices en una manera
uniforme según alguna propiedad específica, como
el grado, por ejemplo - Se necesitan métodos que no usen mucha memoria,
que no necesiten acceso a la red entera al mismo
tiempo y que sean eficientes y adaptables a
varias medidas - Proponemos una construcción para combinar dos
cadenas de Markov una que se mezcla rápidamente
y una para la elección de las muestras
27Descubrimiento de racimos
- Clasificación de redes según la estructura y la
distribución de racimos - Consultas (queries) de vértices relacionados en
un base de datos con enlaces entre documentos
similares - Ùtil para el encaminamiento jerárquico en redes
adhocs - Algoritmos locales, optimización de una función
objetivo que se basa en datos disponibles en el
candidato de racimo actual, justificación
física de funciones diferentes
28Rutas suboptimales
- No siempre es necesario usar la ruta de largo
mínima la rapidez y/o localidad de las
decisiones de encaminamiento pueden tener mucho
más valor - Búsqueda de una ruta de largo casi tan corta como
la de la ruta optimal - Utilizacíón de conocimiento sobre vecinos
secundarios (los vecinos de los vecinos) junto
con caminos aleatorios rápidos - Problemas con la presencia de concentradores en
redes naturales - El número de vecinos secundarios puede ser
demasiado grande y se puede guardar solamente
información parcial en los vértices
29Oportunidades de colaboración?
- Me interesa cualquier cosa que tiene algo que ver
con minería de datos con grafos, como la búsqueda
para subgrafos semejantes, métodos asignación de
ruta - Si alguién necesita auyda con modelación y/o
generación de redes para simulaciónes o otros
experimentos, dígame por favor - Todos mis artículos y otro material están
disponibles en mi página de web (son en inglés
más o menos todos) - http//www.tcs.hut.fi/satu/castellano.shtml
30Muchas gracias por su atención!