Title: Introduction
1Introduction à lIntelligence Artificielle
- 2007 Khaled Hadj Hamou, Samuel Bassetto
2LI.A. ça nest pas
- Ingénieur Adjoint
- MATRIX
- I.A.
- Les temps modernes
3LI.A cest plutôt
- Démarche cognitive assistée par ordinateur
- Donner à une machine des moyens habituellement
réservées à des êtres vivants perception,
raisonnement, décision, apprentissage, action
http//www.symbio.jst.go.jp/PINO/OpenPINO/open_pin
o.html
4historique
- Antiquitié à 1954, une émergence des machines
intelligentes - 1954 congrès à Darmouth, USA, Mc Carthy, Minsky,
Shannon, Newell, Simon gt programmes doués
dintelligence - Quelques noms célèbres
- Babbage (machine à calculer, 1842)?
- Turing (machine universelle, 1936)... (apple)?
- Wiener ( cybernétique, 1943)?
- McCulloch Pitt, Sutton, Barto, Haton,
5Des applications de lI.A.
- Démonstration de théorèmes
- Traitement Automatique du Langage Naturel
- Traitement Automatique de la Parole
- Interprétation dimages vision
- Robotique
- Jeux
- Systèmes daide à la décision (SE, SbC,
classification, discrimination)?
6Plan
- Quelques outils
- SE
- RN
- DL
- SMA
- SàBdCas
- SàBdContraintes
- Introduction
- Le raisonnement
- Lapprentissage
7Introduction
- 4 processus de définition dun système
intelligent - Search résolution de problèmes recherche
dune solution dans un espace de solutions - Pattern Matching reconnaissance de formes
- Inferencing or reasoning raisonnement
- Knowledge representation représentation des
connaissances
8Introduction
Acquisition des données
Apprentissage
Représentation des connaissances
inférence
Processus de traitement symbolique
Reconnaissance visuelle
Reconnaissance vocale
Reconnaissance de formes
Résolution de pbs
Explications
IHM
9Introduction
- Deux approches aux développements
- Réaliser un esprit
- I.A. symbolique, systèmes à bases de
connaissances - Modéliser le vivant
- I.A. connexionniste
- Mc Culloch Pitt
- Rosenblatt
10Plan
- Quelques outils
- SE
- RN
- DL
- SMA
- SàBdCas
- SàBdContraintes
- Introduction
- Le raisonnement
- Lapprentissage
11Le raisonnement
- La résolution de problèmes
- P Initial, Opérateurs, Buts
- Méthodes dexploration des arbres
En largeur
En profondeur
12Le raisonnement
- Pb larbre peut être un peu grand ?
- 1KAn pour la résolution dun problème déchec
- Nécessiter dadopter des Stratégies de parcours
de larbre - Pb nécessité de formaliser COMPLETEMENT le pb
(temps non négligeable) - Classe de problèmes formalisables et difficiles
pour lhomme (ex les lois, le diagnostique
médical, automobile)
13Le raisonnement
O ?
But
I
A
B
C
C
B
A
14Le raisonnement
- 1 voie 4 pas
- 2 voie 3 pas
- long si on passe passe en revue toutes les
combinaisons dempilage et dépilage
C
B
A
B
C
11
21
C
A
A
B
12
22
B
A
C
A
B
C
13
A
23
14
A
B
B
C
C
15Le raisonnement
- Raisonnement itératif
- À partir de I
- Branche (i)
- Appliquer les opérations x fois gt B est atteint
? Sinon, on remonte à I et on passe à la branche
(i1) -
- Utilisation de connaissances dexperts sur
larborescence ? méthodes heuristiques
16Le raisonnement
- Représentation des connaissances
- Connaissance est qualifiée (superficielle,
profonde, spécifique, incertaine, précise,
complète, incomplète) - Heuristique confiance accordée à une
connaissance
CONFIANCE
? K ?
17Le raisonnement
- Les formules logiques
- Logique des propositions une proposition
syntaxiquement vraie ou fausse - Ex VIN(Bordeaux) VRAI VIN(Clio)FAUX
- Vin() ? Prédicat Bordeaux, Clio ? Argument
Assertion
Assertion
18Le raisonnement
- Les formules logiques
- Les prédicats peuvent avoirs plusieurs arguments
Modèle(Couleur, Voiture) - Liens entre les prédicats
- Négation
- Et
- Ou v
- Implication gt
- Equivalence ?
- Une formule bien formée permet de représenter un
fragment de connaissance
19Le raisonnement
- Insuffisance des formules des propositions
- Représenter que toutes les voitures ont un moyen
de propulsion (on ne va pas énumérer chaque
voiture) - Logique des prédicats du 1er ordre
(quantification des variables) - Même opérateurs que la logique des propositions
- Ajout dune quantification des variables par les
opérateurs ? (quelque soit) et ? (il existe) - Ex ?y Q(y) signifie Quelque soit y du domaine,
Q(y) est Vrai.
20Le raisonnement
- Modus Ponens
- P et PgtQ, permet de dériver Q
- Modus Tollens
- Q et PgtQ, permet de dériver P
- Formule de Skolem toute formule bien posée peut
être transformée en un ensemble de clauses
(écriture de la formule par des disjonctions) - Ex
- (?x) (ENSGI(x) gt Classepreparatoires(x) v
CPP(x)) - ?
- (?x) ( ENSGI(x) v Classepreparatoire(x) v
CPP(x)) - P
- P NIL
21Le raisonnement
- Les limitations des raisonnements logiques du 1er
ordre - Nécessité de formaliser complètement le pb.
- Pas dappréciations nuancées
- Existances dautres logiques
- Multivaluées (Valeur de vérité gt 2)
- Modales (modalités dimplication (possible, peut
être)) - Floue
- Non monotones (une assertion vraie à un instant,
ne le sera plus à linstant suivant) - De description (description de concepts)
22Le raisonnement
- Les réseaux sémantiques
- Permet de décrire des concepts, faire des liens
(relations entre les concepts et les individus) - Raisonner sur des réseaux sémantiques ? Modéliser
le pb par un réseau - Pb trouver le mécanisme de mise en
correspondance structurelle
23Le raisonnement
24Le raisonnement
- Une règle de production
- parcelle de connaissance
- SI prémisses ALORS conclusion (coefficient)
- Si les prémisses sont vrais alors, la règle
sapplique et la conclusion est vrai - Base des systèmes experts
-
25Le raisonnement
- Les systèmes à base de règle
Base de faits
Moteur dInférence
Base de règles
26Le raisonnement
- Le raisonnement chaînage avant
- Guidé par les données, il envisage les règles
dans le sens conditions gtconclusions - Détection des règles dont la partie prémisses
est vérifiée par la base de faits - Sélection dune règle parmi les candidats
(résolution de conflits ? choix dune branche de
larbre) - Application de la règle, les prémisses
disparaîssent de la base de faits et les
conclusions viennent lenrichir
27Le raisonnement
- Le raisonnement chaînage arrière
- Raisonnement guidé par un but, il utilise les
règles dans le sens conclusions-gtconditions
réduction du problème - Détection des règles qui concluent sur le but
recherché - Sélection de la règle à envisager
- Application de cette règle et à considérer les
prémisses comme de nouveaux sous buts à
atteindres. Sils sont déjà présent dans la BF,
le travail est fait, sinon, ils sont empilés dans
la pile des buts
28Plan
- Quelques outils
- SE
- RN
- DL
- SMA
- SàBdCas
- SàBdContraintes
- Introduction
- Le raisonnement
- Lapprentissage
29Apprentissage
- Lapprentissage et la mémoire
- La mémoire processus de stokage et
dexploitation dune connaissance antérieurement
acquise - Processus de mémorisation en 4 étapes
- Information
- Acquisition
- Stockage
- Exploitation
30Apprentissage
- Les différents types de mémoires
Faits (sémantique)
Savoir Quoi
Mémoire déclarative
Evènements (épisodique)
Aptitudes procédurales
mémoire
Conditionnement
Mémoire non déclarative
Savoir Comment
Apprentissage non associatif
Apprentissage perceptif
31Apprentissage
- Les différents types de mémoires
- A chaque mémoire, son mode dapprentissage
- Ex
- Apport des neurosciences gt Classification et
caractérisation des mémoires - Chez lhomme, lempan mnésique est de 10E5 signes
! (gt la mémoire visuelle nexiste pas !) - Etat actuel de la science, rien ne dit quil ny
a pas dautres types de mémoires
32Apprentissage
- Laccès aux mémoires
- Par adresse/ contenu
- Accès séquentiel/parallèle
- Représentation statique/dynamique
- Représentation localisée/distribuée
33Apprentissage
- Lapprentissage statistique
- Classification
- Discrimination
- Catégorisation
- Régression
- Différents types dapprentissage
- Supervisé
- Non supervisé
- Par renforcement (semi-supervisé)?
34Apprentissage
- La notion dagent un agent est une entité qui
perçoit son environnement à travers des capteurs
et qui agit sur son environnement par des
effecteurs. (capteurs et effecteurs peuvent être
logiciels) - Les perceptions servent à agir mais également à
apprendre - Lagent apprend une correspondance entre les
perceptions et les actions en évaluant et
maximisant ses performances (renforcement)
fournie par lenvironnement - Il peut y avoir un décalage entre laction et le
signal de lenvironnement
35Apprentissage
- Passer de D à F en suivant les actions Droite,
Gauche, Haut, Bas, en utilisant les perceptions
x,y,recomp où recomp0 si (x,y)(xf,yf),sinon
recomp-1, si (x,y) mur gt recomp -10 -
D
F
36Apprentissage
- Lapprentissage par renforcement, un modèle
dagent
Environnement
action
Etat
récompense
Agent
37Apprentissage
- Lapprentissage par renforcement
- S ensemble des états
- A ensemble des actions
38Apprentissage
- Lapprentissage par renforcement
- Hypothèse de markov la probabilité de passer de
létat s à létat s par laction a dépend
seulement de s et de a, pas des états précédents.
39Apprentissage
- Lapprentissage par renforcement
- Fonction objectif à maximiser, ? ds 0,1,
fonction de rabais, pour tenir compte des
récompenses passées et orienter le cheminement.
40Apprentissage
- Lapprentissage par renforcement - cas
stationnaire
41Apprentissage
- Lapprentissage par renforcement
- Fonction de valeur dun état s sous une politique
p, lobjectif est de trouver p qui maximise cette
fonction
42Apprentissage
- Lapprentissage par renforcement
- Fonction de valeur dune action a, dun état s
sous une politique p, lobjectif est de trouver p
qui maximise cette fonction
43Apprentissage
- Lapprentissage par renforcement
- Conflit principal exploration vs exploitation
dun résultat (différent de lapprentissage
supervisé où la récompense est immédiate) - Notations
- S ensemble fini détats
- A ensemble fini dactions
- ? est la politique qui associé à un état, une
action à réaliser, elle est probabiliste
Notations
Action a effectuer quand lagent est à s
Espérance des récompenses cumulées
44Apprentissage
- Lapprentissage par renforcement
- Equation de Bellman pour lapprentissage
45Apprentissage
- Problème quelle action a mener à un instant t ?
Moyenne réelle de la récompense consécutive à a
Valeur estimée de Q(a) à linstant t
46Apprentissage
- Problème quelle action a mener à un instant t ?
- Greedy response gt action choisie /
- Méthode excluant lexploration des actions
possibles, or la somme des optimums nest pas
forcément loptimum des actions
47Apprentissage
- Problème quelle action a mener à un instant t ?
- e-Greedy response gt action choisie /
- e-gt0 méthode greedy, e-gt1 exploration pure
48Apprentissage
- Problème quelle action a mener à un instant t ?
- Greedy response gt action choisie /
- e-Greedy response
Moyenne réelle de la récompense consécutive à a
Valeur estimée de Q(a) à linstant t
49Apprentissage
- Classification mise en évidence des relations
entre des objets et entre des objets et leurs
paramètres. - Discrimination processus de classement,
recherche de séparations entre des classes
existantes. - Notion de distances, de similarités.
- Objectif produire une partition homogène de
lensemble des objets
50Plan
- Quelques outils
- SE
- RN
- DL
- SMA
- SàBdCas
- SàBdContraintes
- Introduction
- Le raisonnement
- Lapprentissage
51Les outils techniques
- Les réseaux de neurones
- Du neurone biologique au neurone formel
52Les outils techniques
- Les réseaux de neurones
- Du neurone biologique au neurone formel
dendrite
axone
Seuillage
Sommation
53Les outils techniques
- Les réseaux de neurones
- Du neurone biologique au neurone formel
e1
Si
Ei
en
54Les outils techniques
- Les réseaux de neurones
- Les connexions entre les neurones sont de tous
types - La plus utilisée, la structure en couches.
1
2
3
4
5
6
7
8
9
0
55Les outils techniques
- Les réseaux de neurones
- Pour réaliser cette analyse, il faut discriminer
les populations 0, de 1, de 2,de 9
1
2
3
4
5
6
7
8
9
0
56Les outils techniques
- Les réseaux de neurones
- Structuration des réseaux
- Pondération des réseaux
- Apprentissage
- Supervisé
- Non supervisé
- Orienté
57Les outils techniques
- Les réseaux de neurones
- Apprentissage règle de Hebb
- Wij(t1)Wij(t)kSiSj
- La modification du poids est proportionnelle aux
activités pré et post synaptiques - Si et Sj activation des neurones i et j
- Wij poids de la connexion entre les neurones i
j
58Les outils techniques
- Les réseaux de neurones
- Le perceptron réseau à 1 couche
Apprentissage supervisé, on réinjecte
lerreur Wij(t1)Wij(t)k(Di-Si)ej ?Wijk(Di-Si
)ej erreur On ne prend en compte que lerreur
post synaptique
e1
N1
S1,D1
N2
S2,D2
N3
S3,D3
S4,D4
N4
e7
59Les outils techniques
- Les réseaux de neurones
- Limite du perceptron il ne sait faire que de la
discrimination de pb linéairement séparables.
x1
w1
S1 si x1w1x2w2-Ngt0 S0 si x1w1x2w2-Nlt0
N
S
w2
x2
x2
S1
Trouver w1 et w2 ? trouver léquation de
lhyperplan séparant le problème ! ?
S0
x1
60Les outils techniques
- Les réseaux de neurones
- Lidée est de décomposer la non linéarité en un
succession de pb linéaires et de rajouter 1
couche !
D1 x1w1x2w2-N0 D2 x1w1x2w2-N0
H2
x2
Oui
w1
1
N
w1
w2
1,5
x1
x2
N
Non
1
H1
w2
61Les outils techniques
- Les réseaux de neurones
- Pb dans un réseau multicouches, déterminer le
poids des couches intermédiaires de sorte à
minimiser lerreur de sortie, cependant, on ne
connaît pas lerreur ! - Solution rétropropager lerreur à chaque niveau
- Algorithme de descente du gradient
62Les outils techniques
- Les réseaux de neurones
- Objectif atteindre à la sortie
- On diminue de manière incrémentale cette
fonction - On retrouve la loi dapprentissage du perceptron
63Les outils techniques
- Les réseaux de neurones
- Objectif propager lerreur pour modifier les
poids sur la couche cachée i - On fait passer lerreur post-synaptique en erreur
présynaptique - Il faut ensuite répartir cette erreur
présynaptiques aux différentes branches
64Les outils techniques
- Les réseaux de neurones
- Fonction de transfert filtre
sortie
Entrée
65Les outils techniques
- Les réseaux de neurones
- On positionne les neurones dans les plages
dentrées tels quils réagissent à leur position - Réseaux sauto-organisants
- Les neurones sajoutent là où il y a le moins
dactivation
66Dautres outils techniques
- Les systèmes à base de cas
- Les systèmes à base de contraintes
- Les systèmes multi agents
- Les systèmes logiques de description
- Les systèmes experts
67Des applications (1/5)
- Oui, il y en a! -) ex, sur loptimisation des
opérations de ctrls vs opérations de production.
68Une application (2/5)
- Influences possibles sur une machine de
production
Influence des opérations précédentes
Conception des gammes opératoires
Architecture produit
Dérive de la machine de production
C
C
C
C
C
C
Lot produit
Conception de la gamme de contrôle
Dérive de la machine de métrologie
69Une application (3/5)
- Source dinformation pour lanalyse en temps réel
et prise de décision
GMAO
Rebus
Alarmes
SPC
MES
FDC
Qualité prod
Régulation
Qualité mesures
C
C
C
C
C
C
Lot produit
70Une application (4/5)
- Scénario le lot est mesuré mauvais
- Léquipement précédent est arrêté mais est ce
que cette décision est juste ? vue la quantité
dinfluences possibles ?
C
C
C
C
C
C
Lot produit
71Une application (5/5)
- Pour traiter cette question, une négiciation
sengage entre des agents lots des agents
équipements (qui vérifient leurs états) et qui se
mettent en défaut ou pas
C
C
C
C
C
C
Lot produit
72Très (trop) courte bibliographie
- Jean-Paul Haton, Marie Christine Haton,
Lintelligence Artificielle, Que sais-je ?,
N2444, PUF, 1993, ISBN 2130455123 - Sutton Barton, Reinforcement learning, an
introduction, Cambridge, MA, 1998 - Jacques Ferber, MultiAgents, vers une
intelligence collective, Ed InterEditions,
Collection iia, 1995
73Lapprentissage par rétropropagation du gradian
Slides bonus
74Les outils techniques
- Les réseaux de neurones
- Objectif propager lerreur pour modifier les
poids
alors
notons
75Les outils techniques
- Les réseaux de neurones
- Objectif propager lerreur pour modifier les
poids - Sur la dernière couche
76Les outils techniques
- Les réseaux de neurones
- Objectif propager lerreur pour modifier les
poids sur la couche cachée i
fi dépend de fj, de la couche supérieure On
descend bien lerreur dune couche