Pr - PowerPoint PPT Presentation

1 / 35
About This Presentation
Title:

Pr

Description:

Le seul moyen de de faire une m thode instructive et naturelle, ... Georges Leclerc de Buffon, naturaliste et crivain, Histoire naturelle,1749. ... – PowerPoint PPT presentation

Number of Views:35
Avg rating:3.0/5.0
Slides: 36
Provided by: franois72
Category:
Tags: buffon

less

Transcript and Presenter's Notes

Title: Pr


1
Introduction aux classes empiétantes
François Brucker
Brest (Breizh)
francois.brucker_at_enst-bretagne.fr
2
Définition générale de la classification
Le seul moyen de de faire une méthode instructive
et naturelle, cest de mettre ensemble les choses
qui se ressemblent et de séparer celles qui
diffèrent les unes des autres. Georges Leclerc de
Buffon, naturaliste et écrivain, Histoire
naturelle,1749.
2 grands types de critères
  • globaux (au niveau des classes)
  • locaux (au niveau des objets)

3
Une définition dune classe
Ensemble X dobjets
On associe à R un graphe GR(X,E)
C est une classe de X ? C est une clique
maximale de GR
4
Une classification de (X,R)
5
Classification particulière
Critère global
Critère local
Partition
Relation déquivalence
  • réflexive
  • symétrique
  • transitive

x R y et y R z ? x R z
A ??B ? A,B,?
6
non empiétance ? transitivité
ami
Classe B
Classe A
moi
ami
7
On regarde par rapport à 2 éléments
Relation 2-transitive (Jardine et Sibson, 1971)
8
Se généralise à 3, 4, ..., n éléments.
z
x
y
Relation n-transitive (Jardine et Sibson, 1971)
9
Les classes formées par ces modèles relationnels
10
Une définition dune classe
Ensemble X dobjets
d(x,y)d(y,x) d(x,y) ? 0 d(x,x)0
telle que
Propre si d(x,y)0 ? xy
On associe à chaque d(x,y)a un graphe Ga(X,Ea)
C est une classe de X ? C est une clique
maximale dun Ga
11
Classification particulière
Ultramétrique U
u(x,y) maxu(x,z),u(z,y)
Arbre hiérarchique
A ??B ? A,B,?
12
Le cas des hybrides
13
(No Transcript)
14
Réticulogramme
15
Distance additive darbre
Ce nest pas à proprement parler un système de
classes
16
Autre problème où lempiétance est nécessaire
la sériation
Le problème est ici de classer des objets par
ordre chronologique, les objets étant décrit par
une dissimilarité.
Une classification est alors la donnée dun ordre
compatible avec la dissimilarité
17
Lien entre sériation et classes
À la différence du modèle arboré, le problème de
sériation est lié à un modèle de classe
particulier les hypergraphes dintervalles
Les classes dune dissimilarité d sont un
hypergraphe dintervalle Si et seulement si il
existe un ordre tel que toute classe de d soit
un intervalle de cet ordre.
18
Lien entre dissimilarités et classes
Il existe des bijections entre dissimilarités et
classes
Les modèles de classe associés aux modèles de
distance correspondent à des visions
classificatoires différentes
  • ultramétriques Û hiérarchies (Jardine, Jardine
    et Sibson, 1967, Johnson, 1967,

  • Benzecri, 1973)
  • dissimilarités fortement de Robinson Û
    pseudo-hiérarchies indicées (Durand, 1989)
  • quasi-ultramétriques Û quasi-hiérarchies
    indicées (Diatta et Fichet, 1994)

Dans ce cas, classifier cest
transformer une dissimilarité quelconque en une
dissimilarité dun type particulier.
19
Les k-ultramétriques (Jardine et Sibson, 1971)
Définition
d est une dissimilarité k-ultramétrique sur X ssi

Pour tout S Í X, Sk, a,b Î X
d(a,b) maxd(x,y) x Î S È a,b, y Î S
ie. Sur k2 points, les deux plus grandes
dissimilarités sont égales
Intérêt rendre compte des relations de
k-transitivités
20
Les pyramides (Diday, 1984 Fichet, 1984)
Définition
d est une dissimilarité fortement de Robinson sur
X ssi
  • Il existe un ordre q sur X
  • pour tout x q y q z d(x,z) ³ maxd(x,y),d(y,z)
  • pour tout x q y q z
  • pour tout z q t d(x,z)d(y,z) Þ d(x,t)d(y,t)
  • pour tout t q x d(x,z)d(x,y) Þ d(y,t)d(z,t)

Intérêt problèmes de sériation
21
Les quasi-ultramétriques (Diatta et Fichet, 1994)
Définition
d est une dissimilarité quasi-ultramétrique ssi
pour tout x,y,z,t Í X max d(x,z), d(z,y)
d(x,y) Þ d(z,t) max d(t,x), d(t,y),
d(x,y)
Intérêt (1/2) lintersection de 3 classes est
toujours lintersection de 2
dentres elles
22
Les quasi-ultramétriques Intérêt (2/2)
  1. Les 2-boules sont exactement les cliques
    maximales (calculabilité)
  1. Lintersection de 2 cliques maximales est une
    clique maximale (stabilité)

23
Relation entre les différents modèles
pyramides
ultra- métrique
quasi- ultramétrique
3-ultramétrique faible
(etc.)
distance darbre
24
Visualisation des classes
Problème visualisation des classes dune
dissimilarité.
  • Modèles  classiques 
  • Quasi-ultramétrique ?

1
4
dendrogrammes
  • ultramétrique
  • pyramides

2
5
3
6
25
Classes sur un chemin
x
y
z
t
26
Classes sur un circuit
27
Classes sur un arbre
28
Visualisation 3D
29
Exemple distance de mutation
Nombre de positions dans la protéine cytochrome-c
où deux espèces ont deux acides aminés différents
(Fitch et Margoliash, 1967)
30
Ultramétrique sous dominante
31
(No Transcript)
32
(No Transcript)
33
(No Transcript)
34
(No Transcript)
35
(No Transcript)
Write a Comment
User Comments (0)
About PowerShow.com