Apprentissage - PowerPoint PPT Presentation

About This Presentation
Title:

Apprentissage

Description:

Les perceptions [d'un agent] ne devraient pas seulement lui servir choisir ses actions mais aussi am liorer ses capacit s agir ' [Russell & Norvig] ... – PowerPoint PPT presentation

Number of Views:140
Avg rating:3.0/5.0
Slides: 28
Provided by: lor95
Category:

less

Transcript and Presenter's Notes

Title: Apprentissage


1
Apprentissage
  • Jean-François Bérubé
  • Dans le cadre du cours IFT 6802
  • Université de Montréal
  • DIRO, 2 Avril 2003

2
Introduction Pourquoi ?
  • Approche classique de la conception dun agent
  •  Lintelligence  de lagent est entièrement
    introduite par le programmeur.
  • MAIS
  • Le programmeur ne connaît pas toujours
    parfaitement lenvironnement de lagent.
  • Dans un tel cas, lapprentissage peut être la
    seule façon pour un agent dacquérir les
    compétences dont il a besoin.
  • Nest-ce pas là une réelle forme dautonomie et
    par le fait même dintelligence?

3
Introduction Comment ?
  • Apprendre pour un humain facile!
  • Pour une machine difficile!!!
  • On aura besoin dalgorithmes précis et parfois
    complexes
  • Lapprentissage est un vaste domaine qui
    chevauche linformatique, les statistiques et les
    domaines précis des applications

4
Plan de la présentation
  • Lapprentissage aperçu général
  • Modèle général dun agent qui apprend
  • Présentation de quelques techniques
    dapprentissage
  • Lapprentissage dans les systèmes multi-agents
  • De lapprentissage mono-agent à multi-agents
  • Quapprend un agent dans les SMA ?
  • Caractéristiques multi-agents des apprentissages
  • Conclusion

5
Objectifs de lapprentissage
  • Acquisition dune connaissance explicite par un
    système informatique 
  • Construction de nouvelles connaissances ou
    amélioration de connaissances déjà existantes
    inférence 
  •  Les perceptions dun agent ne devraient pas
    seulement lui servir à choisir ses actions mais
    aussi à améliorer ses capacités à agir 
    Russell Norvig
  • Objectif améliorer les performances du système

6
Modèle dun agent qui apprend
Standard de performance
E n v i r o n n e m e n t
Senseurs
Unité de critique
feedback
changements
Module de performance
Module dapprentissage
connaissances
objectifs dapprentissage
Générateur de problèmes
Actions
Agent
Source Russell Norvig
7
Les formes dapprentissage
  • Supervisé
  • Un exemple de  la bonne solution  est donné
    pendant une phase dentraînement
  • Utilisé pour la classification, les régressions,
    estimation de probabilités conditionnelles
  • Par renforcement
  • Le système na pas accès à des exemples il a
    cependant un feedback sur ses actions
  • Utilisé pour le contrôle des robots

8
Apprentissage supervisé
- Exemple intuitif -
Une image profil dun cas
Anne
Exemple test
Jean
(
, ?)
Maude
Qui est-ce?
Eric
Paul
Ensemble des exemples dentraînement
(visage, identité)
Source Yoshua Bengio
9
Apprentissage supervisé - Exemple intuitif (plus
proche voisin) -
Choisir lexemple dapprentissage dont le
 profil  (image) est le plus proche de celui
de lexemple test
identité Paul
plus proche voisin
Source Yoshua Bengio
10
Apprentissage supervisé
- Deux phases -
  • La phase dentraînement
  • On présente des exemples au système
  • Lagent  apprend  à partir des exemples
  • La phase dapplication (ou dutilisation)
  • Nouvelles situations jamais vues auparavant
  • On demande à lagent de généraliser ce quil a
    appris (faire un transfert)

11
Apprentissage supervisé -
Généralisation -
  • Idée mémoriser les paires (perception,action)
    pour ensuite sen servir afin dinduire laction
    à exécuter devant une situation nouvelle
  • On veut éviter que lagent apprenne par cÅ“ur
  • Quil ne puisse que résoudre des problèmes quil
    a déjà vus
  • On veut un apprentissage qui lui permette de
    généraliser
  • Il doit savoir faire ressortir lessence des
    exemples quil apprend

12
Apprentissage supervisé -
Généralisation -
  • Principe de la généralisation par induction
  • Situation inconnue Induction de h, une
    approximation (maximisation de la vraisemblance)
    de la fonction f permettant dassocier une
    perception à une action
  • Évaluer h(nouvelle situation) action
  • Feedback mise-à-jour de la base de
    connaissances (ou dexemples)

13
Apprentissage supervisé -
Généralisation -
Pointillé la meilleure réponse possible
étant donnée lentrée (mais inconnue de
lapprenant)
Chaque point un exemple
Sortie valeur à prédire
Entrée profil du cas
Source Yoshua Bengio
14
Apprentissage supervisé -
Généralisation -
On apprend par cœur mais ça ne généralise pas
bien de nouveaux cas. Erreur faible sur les
exemples dapprentissage mais élevée en test.
Source Yoshua Bengio
15
Apprentissage supervisé -
Généralisation -
On a choisi un modèle trop simple (linéaire)
erreur élevée en apprentissage ET en test
Source Yoshua Bengio
16
Apprentissage supervisé -
Généralisation -
Le modèle est suffisamment flexible pour capturer
la forme courbe
Source Yoshua Bengio
17
Apprentissage supervisé
- Arbres de décision -
  • Un arbre de décision permet de représenter un
    ensemble de fonctions booléennes associées à une
    activité de prise de décision
  • Input situation décrite par un ensemble de
    propriétés
  • Output une décision (oui/non) relative à cette
    situation
  • Principe

Propriétés dune situation Décision à prendre
Décision (oui/non)
18
Apprentissage supervisé
- Arbres de décision -
Clients
Vais-je attendre ???
Aucun
Beaucoup
Peu
Non
Oui
Temps dattente
lt10
gt60
30-60
10-30
Non
Oui
Jai faim
Aller ailleurs
Oui
Non
Oui
Non
Oui
Jai réservé
Aller ailleurs
Ven ou sam
Oui
Oui
Non
Oui
Non
Non
Oui
Non
Oui
Bar
Oui
Il pleut
Non
Oui
Non
Oui
Non
Oui
Oui
Non
?r Clients(r,Beaucoup) ? Temps dattente(r,10-30)
? Jai faim(r,Non) ? Jattends(r)
Source Russell Norvig
19
Apprentissage supervisé -
Apprendre des arbres de décision -
  • Ensemble dentraînement
  • Série dexemples dans lesquels toutes les
    propriétés dune situation sont connues
  • Comment apprendre un arbre ?
  • Un exemple gt un chemin dans larbre
  • Arbres trop gros
  • Quoi faire dans des situations inconnues ?
  • Trouver larbre minimal est incalculable
  • Des heuristiques permettent un compromis entre la
    taille de larbre et la difficulté de calcul

20
Apprentissage supervisé -
Apprendre des arbres de décision -
  • Les heuristiques dapprentissage
  • Classifier les exemples en considérant dabord
    les variables les plus importantes celles qui
    permettent dobtenir une décision le plus
    rapidement
  • On continue dintroduire des variables permettant
    dobtenir une décision à partir des conséquences
    de sa variable parent
  • Les exemples impertinents sont éliminés

21
Apprentissage supervisé
- Application des arbres de décision -
  • Entraînement dun simulateur de vol
  • Professeurs 3 pilotes expérimentés
  •  Enseignement  chacun répète 30 fois un vol
    prédéterminé
  • 90000 exemples sont créés
  • Les exemples sont décrits par 20 variables
  • Résultats
  • Lélève dépasse ses maîtres!!

22
Apprentissage supervisé
- Réseaux de neurones -
  • Réseau composé de nÅ“uds reliés entre eux par des
    arcs auxquels des poids sont associés

Exemples
23
Apprentissage par renforcement
  • Apprentissage à laide dexemples
  • Professeur gt exemples
  • Modèle de lenvironnement gt faire des
    prédictions
  • Fonction dutilité gt évaluer les actions
  • Mais si on a rien de tout ça ???
  • Utiliser les feedback reçus
  • Aux échecs gagner constitue une récompense
  • Au ping pong chaque point devient une
    récompense

Reinforcement learning
24
Apprentissage par renforcement
Principe
Action
Agent
Perceptions
Évaluation
Environnement
Positif?
Il faut apprendre les meilleurs actions à poser
et la façon dévaluer les perceptions
25
Apprentissage par renforcement
- Applications -
  • Joueur déchecs (Samuel 1959-1967)
  • Utilisation dune fonction linéaire permettant
    dévaluer les différentes positions
  • Les poids dans cette fonction sont appris par
    reinforcement learning
  • Les décisions du joueur virtuel finissait par
    sapprocher de celles des bons joueurs
  • Robots
  • Utilisation dans les SMA

26
Résumé
  • Lagent apprend en observant
  • leffet de ses actions
  • Apprentissage par renforcement
  • une série dexemples (supervisé)
  • Induction darbres de décision
  • Réseaux de neurones

27
Références
  • Bengio, Yoshua. Présentation sur les algorithmes
    dapprentissage, www.iro.umontreal.ca/bengioy
  • Russell, S. et Norvig, P. Artificial Intelligence
    A Modern Approach, Prentice-Hall, 1995, 932
    pages.
Write a Comment
User Comments (0)
About PowerShow.com