RAZONAMIENTO APROXIMADO EN LA INTELIGENCIA ARTIFICIAL - PowerPoint PPT Presentation

1 / 71
About This Presentation
Title:

RAZONAMIENTO APROXIMADO EN LA INTELIGENCIA ARTIFICIAL

Description:

razonamiento aproximado en la inteligencia artificial – PowerPoint PPT presentation

Number of Views:95
Avg rating:3.0/5.0
Slides: 72
Provided by: MAQ79
Category:

less

Transcript and Presenter's Notes

Title: RAZONAMIENTO APROXIMADO EN LA INTELIGENCIA ARTIFICIAL


1
RAZONAMIENTO APROXIMADO EN LA INTELIGENCIA
ARTIFICIAL
2
REALIDAD
El conocimiento que necesitamos para desarrollar
un Sistema basado en Conocimiento tiene muchas
veces las siguientes características
NO ES DEL TODO CONFIABLE
IMPRECISO
CONTRADICTORIO
INCOMPLETO
3
Causas de inexactitud
La información
Generalmente no es del todo confiable (falta de
evidencias, excepciones)
Suele ser incompleta a la hora de tomar
decisiones (faltan datos provenientes de
mediciones, análisis)
Diferentes fuentes pueden ser conflictivas,
redundantes, subsumidas
El lenguaje usado para transmitirla es
inherentemente impreciso, vago
4
REALIDAD
Las personas con esas fuentes de conocimiento,
dotadas de esas características, razonamos y
muchas veces concluímos
CAPACIDAD DE RAZONAR APROXIMADAMENTE
5
PROBLEMA
Como modelizamos estas características del
conocimiento, de modo de poder
REPRESENTARLO
UTILIZARLO
REPRESENTARLO
6
REALIDAD
La lógica clásica es un buen modelo para
formalizar cualquier razonamiento basado en
información certera (V o F)
NECESITAMOS OTROS FORMALISMOS
7
REALIDAD
El desarrollo de la IA ha incentivado el estudio
de formalismos que son alternativos o
complementarios a la lógica clásica
INVESTIGACION Y DESARROLLO DE OTROS FORMALISMOS
8
Ejemplos
Como representar en una BC ...
Si el paciente tiene el Signo1 y el Signo2
entonces el diagnóstico en el 75 de los casos es
D1 y en el 40 de los casos es D2
Y si se tiene
Un paciente que evidencia Signo1 en un 80 y
Signo2 en un 55
QUE SE PUEDE INFERIR ???
9
Ejemplos
Como representar en una BC ...
Si el paciente tiene el Signo1 y el Signo2
entonces el diagnóstico en la mayoría de los
casos es D1 y en algunos casos es D2
Y si se tiene
Un paciente que evidencia totalmente el Signo1 y
parcialmente el Signo2.
QUE SE PUEDE INFERIR ???
10
Ejemplos
Como representar en una BC ...
Si la humedad es alta, la presión es baja y
está muy nublado, entonces lloverá.
Y si se tiene
Que la humedad es del 75, la presión es 1002hp
y esta nublado.
QUE SE PUEDE INFERIR ???
11
Ejemplos
Como representar en una BC ...
Si la humedad es alta, la presión es baja y
está muy nublado, entonces lloverá.
Y si se tiene
Que la humedad es un poco alta, la presión es
baja y esta nublado.
QUE SE PUEDE INFERIR ???
12
INGENIERIA DEL CONOCIMIENTO
PROBLEMA
Tomar decisiones y realizar procesos de
razonamiento cuando el conocimiento del dominio
involucrado tiene distintas características,
puede ser
13
CONOCIMIENTO INCIERTO
  • El conocimiento se expresa mediante predicados
    precisos pero no podemos establecer el valor de
    verdad de la expresión
  • Ejemplos
  • Es posible que mañana llueva
  • Mañana llueve CF
  • Creo que el auto era rojo
  • El auto es rojo CF

14
CONOCIMIENTO INCIERTO
Cuando no podemos establecer la verdad o falsedad
de la información
Debemos evaluar la PROBABILIDAD POSIBILIDAD
NECESIDAD/PLAUSIBILIDAD GRADO DE
CERTEZA... De que la información sea verdadera
MEDIDA DE (EVENTO) VALOR /
VALORES INCERTIDUMBRE
bivaluado
15
CONOCIMIENTO IMPRECISO
  • El conocimiento cuenta con predicados o
    cuantificadores vagos (no precisos)
  • Ejemplos
  • Pedro tiene entre 20 y 25 años.
  • Juan es joven
  • Mucha gente juega al fútbol
  • El espectáculo es para gente grande.

16
CONOCIMIENTO IMPRECISO
  • Si la variable X toma valores en S
  • Proposiciones precisas
  • p X es s / s ? S
  • Proposiciones imprecisas
  • p X es r / r ? S
  • Imprecisa - no borrosa
  • Si r es un conjunto clásico
  • Imprecisa - borrosa (fuzzy)
  • Si r es un conjunto borroso (fuzzy)

17
CONOCIMIENTO INCOMPLETO
Se debe tomar decisiones a partir de información
incompleta o parcial. Esto se suele manejar a
través de supuestos o valores por
defecto. Ejemplo Si el paciente tiene S1, S2 y
S3 entonces tiene una infección a Bacterian S3 ???
18
CONOCIMIENTO NO-MONOTONO
La información recibida a partir de distintas
fuentes o en diferentes momentos es conflictiva y
cambiante. Ejemplo Si el vuelo nº 1340 sale en
forma puntual y no tiene escalas técnicas
arribará a Madrid a las 8 hs 1º Supongo no-escala
técnica y concluyo arribará a Madrid a las 8 hs
2º Aviso de escala técnica, debo revisar la
conclusión del horario de arribo.
19
RAZONAMIENTOS
TIPOS DE CONOCIMIENTO
RAZONAMIENTOS
INCIERTO
APROXIMADO
IMPRECISO
INCOMPLETO
POR DEFECTO
NO-MONOTONO
NO-MONOTONO
20
RAZONAMIENTO APROXIMADO (RA)
  • Trata como
  • REPRESENTAR
  • COMBINAR y
  • REALIZAR INFERENCIAS
  • con conocimiento impreciso y/o incierto

21
RA Esquema general en sistemas basados en
reglas de producción
  • Hipótesis
  • Si X es A entonces Y es B (?)
  • X es A
  • Conclusión
  • Y es B ???

REGLAS IMPRECISAS A y/ o B son
imprecisos REGLA INCIERTA ? Grado de certeza
REGLAS HIBRIDAS Problema complejo
22
RA Distintos modelos
  • MODELOS PROBABILISTICOS
  • MODELO EVIDENCIAL
  • MODELO POSIBILISTICO
  • Todos tratan la incertidumbre en un sistema
    de producción
  • Sólo el modelo posibilístico puede tratar la
    imprecisión.

23
MODELOS PROBABILISTICOS
24
Probabilidad - Axiomas
  • P PROP ? 0,1
  • P(V) 1 y P(F) 0
  • P(A ? B) P(A)P(B)- P(A?B)
  • Propiedad P( A) 1- P(A)

25
Probabilidad - Conceptos
  • P PROP ? 0,1
  • Probabilidad a priori o incondicional
  • P(A) o P(XS)
  • Variables aleatorias X, Y
  • Dominio x1, x2 , ..., xn exhaustivo y
    excluyente
  • Probabilidad condicional
  • P(A/B) P(X/Y) tabla valores P(X xi /Y yk)
  • P(A/B) P(A?B) / P(B)

26
Distribución de Probabilidad Conjunta
DolorD ?DolorD
Caries 0.04 0.06
?Caries 0.01 0.89
  • P(Caries ? DolorD) 0.04 0.06 0.01 0.11
  • P (Caries / DolorD)
  • P(Caries ? DolorD) / P(DolorD)
  • 0.04 / 0.040.01 0.8
  • Problema exponencial con la cantidad de variables

27
La regla de Bayes
  • P(B/A) P(A/B)P(B) / P(A)
  • Es la base de todos los sistemas de inferencia
    probabilística

28
RA Modelos probabilísticos
  • Modelo utilizado en Prospector (Duda-Hart 81)
  • Modelo utilizado en Mycin (Shortliffe-Buchanan
    75-84 )
  • Redes Bayesianas (Redes de Creencias - Pearl86)

29
PROSPECTOR (Duda et al, 1976)
Sistema experto en prospección de minerales
El sistema de RA utilizado es un modelo
probabilistico-Bayesiano con algunas
modificaciones
30
PROSPECTOR
Representación de la incertidumbre
  • Hechos probabilidades a priori
  • Reglas Grados de necesidad (LN) E ?
    H Suficiencia (LS)
  • Premisas complejas
  • P(A ?B) Min(P(A), P(B))
  • P(A?B) Max (P(A), P(B))
  • P(?A) 1-P(A)

31
PROSPECTOR
Inferencias Actualizar P(H) dada E? H
  • Odds O(H) P(H) / P(? H)
  • E es cierto O(H/E) LS O(H)
  • E es falso O(H/? E) LN O(H)
  • LS P(E/H) / P(E/ ? H)
  • LN P(? E/H) / P(? E/ ? H)
  • Son proporcionados por el experto, pero no son
    independientes (LS lt 1 ? LN gt1, )

32
PROSPECTOR
Inferencias Actualizar P(H) dada E? H y una
evidencia E
  • P(H/E) P(H/E) P(E/E) P(H/ ? E) P(? E/E)
  • Si P (E/E) P(E) ? P(H/E) P(H)
  • Esto generalmente no se da debido a que las
    probabilidades suelen ser subjetivas
    Alternativas de corrección
  • Implementa una forma de combinación paralela
  • E1? H, En? H (LSi, LNi)

33
PROSPECTOR
Modelo de RA implementado en Prospector es un
modelo ad hoc, cuasi-Bayesiano Ejemplo de
Regla IF Las rocas volcánicas en la región son
contemporáneas con el sistema intrusivo. THEN
(LS,LN) el nivel de erosión es favorable para un
depósito de cobre.
34
PROSPECTOR
  • Modelo de RA implementado en Prospector es un
    modelo ad hoc, cuasi-Bayesiano
  • Dio buenos resultados para esta aplicación,
    el SE permitió encontrar depósitos de minerales
    (molibdeno)
  • Hay teoremas que limitan el uso del modelo de
    combinación paralela planteado
  • No fue transportado a otras aplicaciones

35
MYCIN (BuchananShortliffe, 1975)
Sistema Experto en enfermedades infecciosas
Para valorar la confianza que merece H dada la
evidencia E (E ?H) utiliza factores de
certeza CF(H,E) MB(H,E) - MD(H,E)
  • MB y MD tienen su origen en relaciones
    probabilísticas
  • Si MB(H, E)gt0 entonces MD(H, E)0 y
  • si MD(H, E)gt0 entonces MB(H, E)0

36
MYCIN
CF ? -1,1 y refleja un equilibrio entre las
evidencias a favor y en contra
  • Premisas complejas
  • CF (E1?E2) Min (CF(E1), CF(E1))
  • CF (E1? E2) Max(CF(E1), CF(E1))

37
MYCIN
C1
Combinación paralela E1 H
E2
C ?
C2
  • Premisas complejas
  • Si C1 y C2 ? 0 C C1C2 - C1C2
  • Si C1.C2 lt 0 C C1C2/ 1 min?C1,C2?
  • Si C1 y C2 lt 0 C C1C2C1C2

38
MYCIN
Propagación de los CFs C1 C2 E1
E2 H C??
  • Si C1 ? 0 C C1C2
  • Si C1lt 0 C - C1 CF(H, ?E2)
  • 0 si no se conoce
    CF(H,?E2))

39
MYCIN
  • EL MODELO DE RAZONAMIENTO APROXIMADO PARA MANEJO
    DE LA INCERTIDUMBRE, BASADO EN LOS CFs, UTILIZADO
    EN MYCIN
  • Si bien tiene poco fundamento teórico
  • Alguna base en teoría de probabilidades
  • Regla de combinación de Dempster-Shafer
  • Ha sido muy utilizado en el desarrollo de SE e
    implementado en algunos Shells

40
REDES BAYESIANAS
41
RA Redes Bayesianas
  • Para representar la dependencia que existe entre
    determinadas variables, en aplicaciones
    complejas, se utiliza una estructura de datos
    conocida como
  • Red Bayesiana, Red de creencias,
  • Red Probabilística o Red causal.
  • Esta estructura sirve para especificar de manera
    concisa la distribución de probabilidad conjunta.

42
RA Redes Bayesianas
  • REDES DE RELACIONES PROBABILISTICAS ENTRE
    PROPOSICIONES (variables aleatorias) RELACIONADAS
    SEMANTICAMENTE (relaciones causales)

REDES BAYESIANAS NODOS PROPOSICIONES
(variable o conjunto de variables) ARCOS RE
LACIONES CAUSALES (X ejerce influencia
directa sobre Y) PESO DE ARCOS
PROBABILIDAD CONDICIONAL (Tabla de
Probabilidad Condicional)
43
RA Redes Bayesianas
  • Hay que establecer
  • Topología de la red
  • A los expertos les resulta fácil determinar
    las dependencias entre conceptos
  • Probabilidades condicionales
  • Tarea más compleja (datos estadísticos,
    subjetivos, utilizar otras técnicas)

44
RA Redes Bayesianas
  • Topología de la red
  • Podría considerarse como una base de
    conocimientos abstractos, válida en una gran
    cantidad de escenarios diversos,
  • Representa la estructura general de los procesos
    causales del dominio

45
RA Redes Bayesianas
  • La incertidumbre inherente a los distintos
    enlaces (relaciones causales) representan las
    situaciones no representadas explícitamente.
  • Las probabilidades resumen un conjunto de
    posibles circunstancias en que pueden ser
    verdaderas (falsas) las variables de un nodo.

46
RA Redes Bayesianas
  • EJEMPLO

A
C
B
E
D
Del grafo, que representa las relaciones
causales, se puede sacar la distribución
conjunta p ( A, B, C, D, E ) P (E / C) P (D /
A,C) P (C / A) P(B / A) P(A)
47
RA Redes Bayesianas
  • En general, es posible calcular cada una de las
    entradas de la distribución conjunta desde la
    infomación de la red

P(x1, , xn) ? P(xi / Padres (xi)) i 1,n
48
RA Redes Bayesianas
  • EJEMPLO (Norvig Russell / Judea Pearl)
  • Una casa tiene una alarma que se activa ante
    intento de robo, pero puede activarse ante
    temblores (el escenario es en Los Angeles).
  • Dos vecinos, Juan y María se han ofrecido a
    llamar al dueño de la casa al trabajo, si
    escuchan la alarma. Juan a veces confunde el
    sonido de la alarma con otros sonidos, pero llama
    de todos modos y María a veces no la escucha por
    otras fuentes de sonido que tiene encendida (TV,
    Música).

49
RA Redes Bayesianas
  • EJEMPLO
  • Objetivo Realizar distintas de inferencias
  • Con la evidencia de quien ha llamado
  • y quien no

Cual es la Probabilidad de robo???? P(R/J,M)
50
RA Redes Bayesianas
  • EJEMPLO

TOPOLOGIA DE LA RED
51
RA Redes Bayesianas
  • EJEMPLO

Hay que especificar la tabla de probabilidad
condicional de cada nodo.
Para el nodo Alarma
ROBO TEMBLOR P(ALARMA/ R,T) V F P(ALARMA/ R,T) V F
V V 0.950 0.050
V F 0.950 0.050
F V 0.290 0.710
F F 0.001 0.999
52
EJEMPLO
P(R)
0.001
P(T)
0.002
R T P(A/ R,T)
V V 0.950
V F 0.950
F V 0.290
F F 0.001
A P(M)
V 0.70
F 0.01
A P(J)
V 0.90
F 0.05
53
RA Redes Bayesianas
  • EJEMPLO (Judea Pearl)

Como ejemplo podemos calcular la probabilidad del
evento de que suene la alarma, sin que se haya
producido robo ni temblor, habiendo llamado Juan
solamente
P(J ? ?M ? A ? ?R ??T ) P(J/A) P(?M/A) P(A/ ?R
??T) P(?R) P(?T)
  • Si la Red Bayesiana es una representación de la
    probabilidad conjunta, sirve para responder
    consultas del dominio P(R / J ? ?M ) ???

54
RA Redes Bayesianas
  • INDEPENDENCIA Se hace explícita mediante la
    separación de grafos.
  • SE CONSTRUYE INCREMENTALMENTE por el experto
    agregando objetos y relaciones.
  • Los arcos no deben considerarse estáticos,
    representan restricciones sobre la certeza de los
    nodos que unen
  • p (A / B) cuantifica la certeza de B ? A
  • si lo que se conoce es una evidencia e de que
    B es cierto p (A/B,e)


55
RA Redes Bayesianas
  • Inferencias Belief revision
  • Consiste en encontrar la asignación global que
    maximice cierta probabilidad
  • Puede usarse para tareas explicatorias/diagnóstico
  • Básicamente a partir de cierta evidencia, nuestra
    tarea es encontrar un conjunto de hipótesis que
    constituyan la mejor explicación de las
    evidencias
  • (razonamiento abductivo)
  • Encontrar asignaciones a los nodos N1...Nj /
    (P(E / N1,,Nj)) sea máxima.


56
RA Redes Bayesianas
  • Inferencias Belief updating
  • Consiste en determinar la mejor instanciación de
    una variable, dada una evidencia.
  • Es la actualización de probabilidades de un nodo
    dadas un conjunto de evidencias
  • (P(Ni/E1,,En))
  • Ejemplo determinar la probabilidad de robo
    sabiendo que Juan llama y María llama.
  • P(R/J,M)


57
MODELOS PROBABILISTICOS
  • Problema de las asignaciones de probabilidad
    (estadísticas o evaluaciones subjetivas?)
  • Mycin y Prospector son modelos mas bien ad hoc,
    con limitaciones, pero que funcionaron muy bien
    en esos dominios
  • Las Redes Bayesianas son modelos más cercanos a
    un modelo probabilístico puro y permite la
    representación explícitas de las dependencias del
    dominio en la red.

58
MODELO EVIDENCIAL
59
RA MODELO EVIDENCIAL
  • Dempster (67) y Shafer (76)
  • Esta teoría puede considerarse una extensión de
    la teoría de probabilidad
  • Asume que no todos los resultados de una
    experiencia dada pueden ser observados de una
    forma precisa.
  • No impone a la distribución de probabilidad que
    se refiera únicamente a eventos elementales.

60
RA MODELO EVIDENCIAL
  • No impone a la distribución de probabilidad que
    se refiera únicamente a eventos elementales.
  • Los elementos de los cuales se tiene alguna
    información (focales) pueden superponerse y no
    recubrir X

INFORMACION IMPRECISA E INCOMPLETA
61
RA MODELO EVIDENCIAL
  • Formalización
  • Frame de discernimiento (discerrnment)
  • X el conjunto de todos los valores de x
  • Asignación básica de probabilidad
  • m P(X) ? 0,1 donde
  • m(? ) 0
  • ? m(A) 1
  • A ?P(X)

62
RA MODELO EVIDENCIAL
  • Formalización
  • X p1, p2 , p3 , p4 frame of discernment
  • A A1 , A2 , A3 , A4
  • A1 p1 A2 p2 A3 p3 ? p4
  • A4 p? p2 ? p3 ? p4
  • m P(X) ? 0,1 donde
  • ? m(A) 1
  • A ?P(X)

63
RA MODELO EVIDENCIAL
  • Ejemplo color de ojos
  • X M , A , V , G frame of discernment
  • A A1 , A2 , A3 , A4
  • A1 M , A2 A , A3 V ? G
  • A4 M ? A ? V ? G
  • m(M) 0.6
  • m(A) 0.2
  • m(V ? G) 0.1
  • m(M ? A ? V ? G ) 0.1

64
RA MODELO EVIDENCIAL
  • Formalización
  • Credibilidad
  • Cr (A) ? m(B)
  • B ?A
  • Plausibilidad
  • Pl (A) 1 Cr(?A)
  • Pl (A) ? m(B)
  • B ? A ? ?
  • Prob(A) Cr (A), Pl (A)

65
RA MODELO EVIDENCIAL
  • Ejemplo
  • Credibilidad de A? V? G
  • Cr (A? V? G ) 0.20.1 0.3
  • Plausibilidad
  • Pl (A? V? G ) 0.20.10.1 0.4
  • Prob(A? V? G ) 0.3,0.4

66
RA MODELO EVIDENCIAL
  • Propiedades
  • Cr (A) ? Pl(A)
  • Cr (A) Cr (? A) ? 1
  • Pl (A) Pl (? A) ? 1
  • Cr (A) 0 ? Cr (? A)1
  • Cr (? A) 1 ? Cr (A) 0

67
RA MODELO EVIDENCIAL
  • Observaciones
  • Representación de Ignorancia
  • m(X) 1 y m(A)0 ?A ? X
  • Cr(A)0 y Pl(A)1
  • Si A1 ? A2 ? ... ? An
  • Cr(Ai and Aj) Min ( Cr(Ai), Cr(Aj) )
  • Pl (AiorAj) Max ( Pl(Ai), Pl(Aj) )
  • Medidas de necesidad y posibilidad (Zadeh)

68
RA MODELO EVIDENCIAL
  • Observaciones
  • Si los An forman una partición de X y si los
    eventos son elementales
  • (Los conjuntos focales están acomodados)
  • Cr(A) Pl(A) P(A) probabilidad
  • El modelo es una extensión
  • de la teoría de probabilidad

69
RA MODELO EVIDENCIAL
  • Regla de combinación de Dempster
  • Sean m1 y m2 asignaciones básicas del mismo
    frame X.
  • Obtenemos m12
  • m12 (?) 0
  • m(A) ? m1 (B) m2 (C)
  • B ? CA
  • Se normaliza
  • m12 (A) m(A) / ? m1 (B) m2 (C)
  • B ? C??

70
RA MODELO EVIDENCIAL
  • Regla de combinación de Dempster
  • Fórmula utilizada por Mycin para combinar dos
    reglas, considerando A,X como focales
  • Los resultados son válidos si
  • ? m1 (B) m2 (C) es próximo a 1
  • B ? C??
  • Resalta los items de concordancia entre distintas
    fuentes, pero da poca información del conflicto

71
RA MODELO EVIDENCIAL
  • Limitaciones
  • Las combinaciones lógicas (? ? ?) no están
    resueltas para el caso más general.
  • Hay algunos intentos de resolver el procesos de
    las inferencias en un caso general (Modus Ponens
    en Modelo Evidencial)
  • La combinación paralela se puede resolver con la
    regla de Dempster si las fuentes de información
    no son muy distintas.
Write a Comment
User Comments (0)
About PowerShow.com