Sistemas de razonamiento probabilstico - PowerPoint PPT Presentation

1 / 22
About This Presentation
Title:

Sistemas de razonamiento probabilstico

Description:

... independiente de sus predecesores, en el orden de los nodos, dados sus padres. ... conjunto de variables de Query, dados los valores exactos de algunas variables ... – PowerPoint PPT presentation

Number of Views:108
Avg rating:3.0/5.0
Slides: 23
Provided by: unlu4
Category:

less

Transcript and Presenter's Notes

Title: Sistemas de razonamiento probabilstico


1
Sistemas de razonamiento probabilístico
2
Red de creencias características


La principal ventaja del razonamiento
probabilístico sobre el razo-namiento lógico es
que el primero permite tomar decisiones
racio-nales aún en los casos en que no haya
suficiente información para probar que cualquier
acción dada funcionará.
  • La red de creencias es un grafo dirigido y
    acíclico en el cual
  • Un conjunto de arcos dirigidos o flechas, conecta
    pares de nodos.
  • Un conjunto de variables representa los nodos de
    la red.
  • Cada nodo tiene una tabla de probabilidad
    condicional que cuantifica los efectos que los
    padres tienen sobre el nodo.

3
Ejemplo de Red de creencias


4
Representación de la distribución de probabilidad
conjunta


5
Distribución de probabilidad conjunta (cont.)

Probabilidad condicional por definición P(x1,
x2, ...,xn) ? P(xi? xi-1, ...,x1) 2
Comparando con la ecuación 1 vemos que la
especifica-ción es equivalente a la aseveración
general 3 P(Xi? Xi-1,..., X1)P(Xi?Padres(Xi
)) siendo Padres(Xi )?xi-1, ...,x1 La
ecuación anterior nos dice que la red de
creencias es una representación correcta del
dominio solo si cada nodo es condicionalmente
independiente de sus predecesores, en el orden de
los nodos, dados sus padres. Intuitivamente,
padres del nodo Xi debería contener todos
aquellos nodos en X1, . . ., Xi-1 que influencian
directamente a Xi.
n
i1
6
Procedimiento para la construcción de la red
  • Elegir el conjunto de variables Xi relevantes que
    describen el dominio.
  • Elegir un orden para las variables.
  • Mientras queden variables
  • a) Tomar una variable Xi y agregar un nodo a la
    red para dicha variable.
  • b) Hacer que Padres(Xi) sea un conjunto mínimo
    de nodos ya existente en la red, tal que la
    propiedad de independencia condicional 3 sea
    satisfecha.
  • c) Definir la tabla de probabilidad
    condicional para Xi.

7
Representación de tablas de probabilidad
condicional
  • Nodo determinístico su valor queda especificado
    exactamente por los valores de sus padres, sin
    incertidumbre.
  • Las relaciones con incertidumbre pueden a veces
    ser caracterizadas por las llamadas relaciones
    con ruido. El ejemplo estándar es el llamado
    OR-ruidoso que es una generalización del OR
    lógico.
  • En lógica proposicional, podíamos decir Fiebre
    es verdadero si y solo si Resfrío, Gripe o
    Malaria es verdadero. El modelo OR-ruidoso agrega
    alguna incertidumbre a este enfoque estrictamente
    lógico.
  • El modelo asume tres cosas
  • Cada causa tiene una chance independiente de
    causar el efecto.
  • Todas las causas posibles están listadas.
  • Cualquier cosa que inhibe, por ej. a Gripe, de
    causar Fiebre, es inde-pendiente de lo que inhiba
    a Resfrío de causar Fiebre. Estos inhibid. no se
    representan como nodos sino que se resumen
    comoparám.de ruido.


8
Representación de tablas de probabilidad
condicional (continuación)

9
Relaciones de independencia condicional en redes
de creencias

Separación dependiente de la dirección o
d-separación Dada una red, es posible
determinar si un conjunto de nodos X es
independiente de otro conjunto Y, dado un
conjunto de nodos evidencia E.

Si todo camino no dirigido
desde un nodo en X a un nodo en Y es
d-separado por E, luego X e Y son condicionalm.
independ., dada E. Un conjunto de nodos E
d-separa dos conjuntos de nodos X e Y si cada
camino no dirigido desde un nodo en X hasta un
nodo en Y está bloqueado dado E. Un camino está
bloqueado dado un conjunto de nodos E si hay un
nodo Z en el camino para el cual se cumple una de
las tres condiciones siguientes
1 Z
está en E y Z tiene una flecha ingresando y otra
saliendo. 2 Z está en E y tiene
ambas flechas del camino hacia afuera.
3 Ni Z ni ningún descend.de Z está en E,y ambas
flecha apuntan a Z.
10
Relaciones de independencia condicional en redes
de creencias (continuación)

Z
E
Y
X
Z
Z
Tres formas en que un camino desde X hasta Y
puede ser bloqueado, dada la evidencia E.

Ejemplo
Batería
Radio
Ignición
Nafta
Arranca
Se mueve
11
Inferencia en redes de creencias
  • La tarea básica de cualquier sistema de
    inferencia probabilístico es computar la
    distribución de probabilidad posterior de un
    conjunto de variables de Query, dados los valores
    exactos de algunas variables de evidencia
    P(Query?Evidencia), Ej. P(Hurto?JuanLlama)
  • En general, un agente toma valores para
    variables de evidencia, de sus percepciones (o de
    otro razonamiento), y pregunta sobre valores
    posibles de otras variables de modo que puede
    decidir qué acciones tomar.
  • Las redes de creencias pueden realizar cuatro
    tipos de inferencias
  • Inferencias diagnósticas (de efectos a causas)
  • Inferencias causales (de causas a efectos)
  • Inferencias intercausales (entre causas de un
    efecto común)
  • Inferencias mezcladas (combinando dos o más de
    las anteriores)

12
Posibles usos de las redes de creencias
  • Además de permitir calcular la creencia en
    variables de Query, dados los valores definidos
    para variables de evidencia, las redes de
    creencias pueden ser usadas para lo siguiente
  • Tomar decisiones basadas en probabilidades en la
    red y en las uti-lidades del agente.
  • Decidir qué variables de evidencia adicionales
    deberían ser obser-vadas para ganar información
    útil.
  • Realizar análisis de sensibilidad para entender
    qué aspectos del modelo tienen el mayor impacto
    sobre las probabilidades de las va-riables de
    Query.
  • Explicar al usuario los resultados de la
    inferencia probabilística.

13
Inferencia en redes de creencias con múltiples
conexiones
  • Hay tres clases básicas de algoritmos para
    evaluar redes de conexiones múltiples
  • Agrupamiento (clustering), métodos que
    transforman la red en un polytree equivalente
    probabilístico (pero diferente topológicamen-te),
    uniendo nodos ofensivos.
  • Condicionamiento por conjunto de corte, métodos
    que realizan la transformación dando valores
    concretos a las variables, y luego eva-luando un
    polytree para cada particularización posible.
  • Simulación estocástica, métodos que usan la red
    para generar un gran número de modelos concretos
    del dominio que son consisten-tes con la
    distribución de la red.

14
Red con conexiones múltiples con tablas de
probabilidad condicional
P(N) 0.5
Nublado
N
P(Ll)
N
P(R)
Regador
Lluvia
V
V
0.80
0.10
F
0.20
F
0.50
Pasto Húmedo
P(H)
R
Ll
V
0.99
V
V
0.90
F
V
F
0.90
F
0.00
F
15
Equivalente de la red con conexiones múltiples
usando agrupamiento (clustering)
Pasto Húmedo
16
Método de condicionamiento por conjunto de corte
Transforma la red en varios polytrees más
simples. Cada red simple tiene una o mas
variables particularizadas a un valor definido.
El conj. de variables que puede ser
particularizado se llama conjunto de corte. Nota.
Polytree red simplemente conectada, en tal red
hay como máxi-mo un camino no dirigido entre dos
nodos cualesquiera.
17
Método de simulación estocástica
Se corren simulaciones repetidas del mundo
descripto por la red de creencia, y se estima la
probabilidad en que es-tamos interesados,
contando las frecuencias con las cuales los
eventos relevantes ocurren. La mayor dificultad
con es-te método es que toma un largo tiempo
obtener probabili-dades precisas para eventos
poco probables.
18
Ingeniería del conocimiento para razonamiento con
incertidumbre
  • Decidir sobre qué hablar. Es importante decidir
    qué factores serán modelados, y cuáles serán
    resumidos por enunciados probabilísticos.
  • Decidir sobre un vocabulario de variables al
    azar.
  • Codificar conocimiento general acerca de la
    dependencia entre variables.
  • Codificar una descripción del caso particular
    específico del problema.
  • Presentar Queries al procedimiento de inferencia
    y obte-ner respuestas.

19
Otros enfoques de razonamiento con incertidumbre
  • Razonamiento por omisión (default)
  • Trata a las conclusiones como creíbles hasta
    que se haya encontra-do una razon mejor para
    creer en algo más. Exhibe no monotonici-dad
    porque el conjunto de creencias no crece
    monotónicamente a medida que se obtiene nueva
    evidencia. Estos tipos de sistemas comparten un
    cierto número de temas problemáticos
  • Cuál es el status semántico de las reglas por
    omisión? Cuál es el conjunto adecuado de reglas
    por omisión que se debe tener?
  • Qué ocurre cuando la evidencia coincide con las
    premisas de dos reglas por omisión con
    conclusiones en conflicto?
  • Algunas veces un sistema puede llevar a un
    número de conclusiones basándose en una creencia
    que es retractada más tarde. Cómo puede el
    sistema hacer un seguimiento de qué conclusiones
    necesitan ser retractadas?
  • Cómo las creencias que tienen status por
    omisión pueden ser usadas para tomar decisiones?

20
Métodos basados en reglas para el razonamiento
con incertidumbre
  • Además de la monotonicidad, los sistemas de
    razonamiento lógico tienen otras tres propiedades
    que los razonadores probabilísticos no poseen
  • Carácter local A ? B podemos concluír B dada A
    sin preocupar-nos acerca de cualquier otra regla.
  • Desapego Una vez que se ha encontrado una
    prueba lógica para una proposición B, esta puede
    ser usada sin importar cómo fue derivada.
  • Funcionalidad de la verdad En lógica,la verdad
    de sentencias com- plejas se puede computar a
    partir de la verdad de sus componentes.
  • Las propiedades antes mencionadas no son
    apropiadas para el razonamiento con incertidumbre.

21
Métodos basados en reglas para el razonamiento
con incertidumbre (continuación)
Ejemplo funcionalidad de la verdad. Los eventos
H1, H2 y T1 tienen la misma probabilidad 0.5,
entonces un sistema verdad-funcional debe asignar
la misma creencia a la dis-yunción de cualquier
par de ellos. Pero, podemos ver que la
probabilidad de la disyunción depende de los
eventos, y no de sus probabilidades
22
Teoría Dempster - Shafer
Trata la distinción entre incertidumbre e
ignorancia. En vez de computar la probabilidad de
una proposición, com-puta la probabilidad de que
la evidencia soporte la propo-sición. Una
interpretación de esta teoría es que define un
interva-lo de probabilidad en el ejemplo de RN
el intervalo para Cara es 0,1 antes del
testimonio del experto,y 0.45,0.55 después.
Write a Comment
User Comments (0)
About PowerShow.com