A Theory of Action for MultiAgent Planning - PowerPoint PPT Presentation

1 / 11
About This Presentation
Title:

A Theory of Action for MultiAgent Planning

Description:

Si los Agentes inteligentes son para actuar racionalmente, necesitan poder ... una clase de evento (vista intuitiva) eso resulta de la actividad de algunos agentes ... – PowerPoint PPT presentation

Number of Views:34
Avg rating:3.0/5.0
Slides: 12
Provided by: serv213
Category:

less

Transcript and Presenter's Notes

Title: A Theory of Action for MultiAgent Planning


1
A Theory of Action for MultiAgent Planning
  • Michael Georgeff

2
Contenido
  • Introducción
  • Modelo de proceso y acciones
  • Definición formal
  • Composición de Acciones
  • Libre de interferencia
  • Razonamiento general sobre acciones
  • Conclusiones

3
Introducción
  • Si los Agentes inteligentes son para actuar
    racionalmente, necesitan poder razonar sobre los
    efectos de sus acciones.
  • Si el ambiente es dinámico o incluye otros
    agentes necesitan razonar sobre la interacción
    entre sus acciones y eventos en el ambiente y
    deben poder sinconizar sus actividades para
    realizar sus objetivos
  • Para razonar sobre los efectos de acciones
    concurrentes, se necesita conocer como las
    acciones son ejecutadas, no solo sus efectos
    finales.

4
Modelo de proceso y de acciones
  • Una transición atómica es una relación sobre el
    conjunto de estados del mundo.
  • Una acción es una clase de evento (vista
    intuitiva) eso resulta de la actividad de algunos
    agentes
  • realizando una acción, un agente fuerza alguna
    secuencia de transiciones atómicas en el mundo.
    Por cada acción se corresponderá a alguna
    estructura interna que especifique como y bajo
    que condiciones estas transiciones atómicas
    debes ser hechas.
  • Podremos especificar la clase de comportamiento
    posible y observable de un agente cuando realiza
    una acción por medio de un dispositivo llamado
    .

process model
5
Modelo de proceso
  • Consiste de un número de estado interno llamados
    control points
  • Asociados con cada puntos de control esta un
    correctness condition (condición de exactitud).
    Especifica los estados aceptables del mundo en
    ese punto de control.
  • La manera en la que el dispositivo realiza una
    acción es descripta por una función parcial,
    llamada la función del process control (control
    de proceso)

6
Definición formal
  • Un modelo de proceso es una seven-upla A
    ltS,F,C,d,P,ci,cfgt donde
  • S es un conjunto de estados del mundo
  • F SxS es un conjunto de transiciones atómicas
  • C conjunto de los puntos de control
  • d CxF -gt C es una función de control de
    procesos
  • P C-gt2S subconjunto asociado de S con cada
    puntos de control los valores de esta función
    son llamados corretness conditions
  • ci pertenece a C , es el punto de control
    final
  • cf pertenece a C , es el punto de control final

7
Definición formal (continuación)
  • En general, d es la función parcial. Si dado
    que un puntos de control c y transiciones
    atómicas tr, ltc,trgt esta en el dominio de
    d,decimos que tr es aplicable a c.
  • Visto intuitivamente, si esta en el puntos
    de control c1 y el mundo esta en un estado s1,
    satisface la condición de exactitud P(c1), el
    dispositivo puede pasar a puntos de control c2 y
    el mundo a estado s2. Siempre y cuando exista una
    transición atómica aplicable a tr entre el estado
    s1 y s2 y d (c1,tr)c2. Alternativamente, el
    dispositivo puede permanecer en el punto de
    control c1 y algunas transiciones o eventos
    ocurren en el mundo (quizás resultado de la
    acción de algunos otros agentes). En cualquier
    caso, para que la ejecución tenga éxito, (no
    falle) el nuevo estado del mundo necesita
    satisfacer la condición de exactitud para c2,
    i.e., s2 necesita ser un elemento de P(c2).

8
Composición de Acciones
  • La motivación detrás del modelo presentado
    aquí, es el operador de parallel composition
    (composición paralela). Definida como
  • A1 ltS,F1,C1,d 1,P1, ci1 ,cf1gt y A2
    ltS,F2,C2,d 2,P2, ci2 ,cf2gt son dos modelos de
    proceso para la acción a1 y a2
    respectivamente. Definimos a un modelo de proceso
    representando la composición paralela de A1 y A2
    denotada como A1 A2 para ser el modelo de
    proceso ltS,F,C,d,P, ci ,cfgt donde
  • F F1U F2
  • CC1xC2
  • Para todo c1e C1, c2 e C2 y tr en F1, d ((c1,
    c2),tr) (d 1 (c1, tr), c2)
  • Para todo c1 e C1, c2 e C2 y tr en F2, d ((c1,
    c2),tr) (c1, d 2 (c2,tr))
  • Para todo c1 e C1, c2e C2 , P ((c1,
    c2)r)P(c1) P(c2)
  • ci lt ci1,ci2gt
  • cf lt cf1,cf2gt

U
9
Libre de interferencia
  • Un conjunto de modelos de procesos
    A1,......,An se dice ser libre de interferencia
    si para cada modelo de proceso Ai cumple
  • Para todos los puntos de control c en
    Ai y todas las transiciones tr aplicables a c y
    para todo j , j distinto i, tr en c no interfiere
    con Aj.
  • Luego si un conjunto de acciones es
    libre de interferencia, ninguna puede fallar
    debido a la interferencia con las demás, por
    supuesto cualquiera puede fallar como resultado
    de la interacción con el ambiente.
  • Para determinar libertad de
    interferencia es suficiente con representar el
    funcionamiento de un dispositivo por
  • Un conjunto de condiciones de exactitud o
    correctitud y
  • Un conjunto de transiciones atómicas restringidas
    a las condiciones de correctitud de el nodo del
    que parten.

10
Razonamiento general sobre acciones
  • En la combinación con la lógica temporal la
    teoría propuesta de acción provee una base
    semántica para el razonamiento con sentido común
    y un entendimiento en lenguaje natural.
  • Determinar la libertad de interferencia
  • Los modelo de proceso también son apropiados para
    representar la mayoría de las construcciones de
    programación, incluyendo secuenciamiento,
    elecciones no determinísticas e iteraciones.

11
Conclusiones
  • Han sido presentada una teoría naciente de acción
    apropiada para el razonamiento sobre la
    interacción en multi agente.
  • Esta teoría provee una semántica para sentencias
    de acción en un lenguaje natural y de
    programación.
  • La teoría esta basada sobre un dispositivo
    llamado modelo de proceso, es usado para
    representar el comportamiento observable de un
    agente en le ejecución de una acción.
  • Este modelo puede ser usado para razonar sobre
    planes multi-agentes y programas concurrentes.
  • En particular, el operador de composición
    paralela fue definido y se derivaron las
    condiciones para determinar la libre
    interferencia para acciones concurrentes.
  • El uso de modelos de procesos como
    interpretación de lógicas temporales apropiadas
    para el razonamiento sobre planes y programas.
Write a Comment
User Comments (0)
About PowerShow.com