Title: Identification des lectrons non isols dans Atlas
1Identification des électrons non isolés dans
Atlas
Olivier Ali Stage de Licence École Normale
Supérieure de Cachan Laboratoire de Physique
Nucléaire et de Hautes Énergies, Paris,
IN2P3-CNRS et Universités Paris 6 et Paris 7
1) Le
problème de la masse des particules élémentaires
2) Identification des électrons
dans l'expérience Atlas 3)
Travail personnel 4)
Conclusion
2La masse des particules élémentaires
- Modèle Standard de la Physique des Particules
- 12 particules élémentaires
- 4 interactions
- La masse des particules élémentaires
- comment les particules acquièrent une masse ?
- pourquoi sont elles différentes ?? mécanisme de
Higgs donne la masse aux particules via
l'existence d'une nouvelle particule le
boson de Higgs - Large Hadron Collider (CERN, Genève)
- collisionneur proton-proton de 27 kmde
circonférence va fonctionner à partir de 2007 - Energie ?10 (14 TeV) et collisions ?100 (toutes
les 25 ns) / collisionneurs actuels ?
espoir de créer des bosons de Higgs !
3L'expérience Atlas au CERN en 2007
- Le détecteur
- point d'interaction collisions p-p
- trajectographe
- traces chargées
- capacité a identifier des électrons
- calorimètres
- arrêt des particules, mesure du dépôt d'énergie
et identification e,photon,pions
- Atlas (Air Toroïdal Lhc Apparatus System)
- 1800 chercheurs et ingénieurs, 30 pays
- construction/utilisation 20 ans
- coût 300 millions d'euros
- 7000 tonnes
- 44 m de longueur
- 25 m de hauteur
- 20 m de diamètre
4Détection des électrons dans Atlas
- Données simulées du boson de Higgs H?bb
- b?e dans 11 des cas, important d'identifier
l'électron - Algorithme d'identification développé au LPNHE
- a chaque trace du détecteur interne associe une
gerbe électromagnétique
ensemble de neuf variables décrivant la trace et
la forme de la gerbe permet de séparer
les traces de pions (bruit de fond ) et les
traces d'électrons (signal)
Fraction d'énergie dans les parties du
calorimètre avant
arrière
Largeur
- impulsion- hits de haute energie du à des
électrons
5Étude des distributions des variables
- Mise en route du stage initiation aux
outils graphiques et d'analyse (Fortran) - Fonction de densité de probabilité
- probabilité d'être un électron ou un pion
- conservation des densités de probabilité ?
- Moyen
- corps des histogrammes d'une part
- les valeurs singulières d'autre part? plus de 24
sous-classes pour chaque trace - Résultats obtenus
- a permis de trouver des bugs dans
lesinitialisations des variables dans le
programme de reconstruction d'Atlas - découpage proposé est basé sur l'association
d'une trace et d'un amas et non pas sur un
découpage purement technique? reste 14
sous-classes pour chaque trace
Fraction d'énergie déposée dans la partie
avant du calorimetre
Pions
Électrons
6Quantifier le pouvoir séparateur des variables
- Pour chacune des variables on calcule sa
séparation avec Xpion (Xelec) la densité
de probabilité associée à l'hypothèse pion
(électron) - Résultats obtenus
- séparations entre 0.6 et 0.04
- les variables les plus discriminantes sont
celles provenant du trajectographe et celles
combinant les deux détecteurs - l'asymétrie de la gerbe lts2gt0.04et n'apporte
rien aux performances ? cette variable sera
abandonnée !!!
Sans asymetrie
Avec asymetrie
7Amelioration des outils statistiques
- L'algorithme construit une fonction
discriminante pour chaque trace en faisant le
produit sur les 9 variables des densités de
probabilité X - XPA ?X(électrons)/(?X(pions)?X(
électrons)) - en coupant sur XPA efficacité d'identification
des électrons et réjection des pions - cette fonction tend vers 0 pour les pions et
vers 1 pour les électrons - ? XPA ne prend pas en compte les
corrélations entre les variables ! - ? implique présence de bruit de fond sous
le signal
Signal e
Pions
XPA
8Corrélations entre les variables
- Matrice de corrélation
- pour chaque couple de variable on a construit un
histogramme 2D - on calcule le coefficient de corrélation ?
correspondant - Résultats obtenus
- les corrélations restent faibles (lt40)
- les variables du trajectographe ne sont pas
corrélées avec celles du calorimètre - certaines variables montrent une même
corrélation pour les électrons et les pions - certaines variables montrent de grande
corrélations pour les électrons mais pas pour
les pions? malgré des corrélations globalement
faibles peut-on améliorer les
performances de l'algorithme en les prenant
en compte ?
Asymetrie vs largeur de la gerbe
?(elec) 30 ?(pion) 40
E dans partie avant vs E/p
?(elec) -20 ?(pion) 0
9Méthode de Fisher (1)
- Principe de la méthode
- XPA combine des projections 1D de chaque variable
- Fisher détermine un axe de projection à N
dimensions tel que la séparation des N variables
x soit maximale sur cet axe .... - calcul des moyennes de chaque variable pour les
distributions électrons et pions - somme des matrices de covariance pour les
électrons et les pions - variable de Fisher XFI ? f? x? à la place de
XPA - calcul des coefficients de Fisher
- inversion de cette matrice (9?9)
10Méthode de Fisher (2)
- Résultats obtenus
- Fisher produit des performances moins bonnes s'il
n'y a pas de corrélations - c'est compris mais n'était pas attendu au début
du stage ! - utilisation plus difficile que prévu
- pour un ensemble de 3 variables corrélées
représentant le développement latéral de la
gerbe dans la partie avant du calorimètre - performances similaires a celles obtenues avec
le rapport de vraisemblance - permet de remplacer ces 3 variables par une seule
- combinaison de cette variable unique avec les6
autresvariables impliquera sans doute d'avoir
XPA avec moins de bruit de fond sous le signal
Rapport de vraissemblance
Fisher
11Conclusion
- Résultats obtenus
- Étude des distributions des variables
discriminantes a permis de trouver des erreurs
dans le programme d'identification - la variable de séparation
- développement d'une méthode permettant de
comparer le pouvoir discriminant des variables
utilisées par l'algorithme - l'une des variables (asymétrie) sera abandonnée
- corrélations entre les variables
- première fois que ces coefficients sont calculés
- utilisation de la méthode de Fisher est moins
prometteuse qu'espérée au début du stage mais
permet de réduire le nombre de variables - Stage en physique des particules dans Atlas
- découverte des problèmes et des enjeux majeurs de
la physique des particules actuels (recherche du
boson de Higgs) - outils graphiques et d'analyses utilises
couramment - travail en collaboration au sein d'une équipe de
recherche - analyse statistique sur des lots de données
simulées - approche originale pour optimiser un algorithme
d'identification d'électrons
12Les variables discriminantes
pi
Fraction de E dans le 3e sampling
Fraction de E dans le 1er sampling
e
Largeur de la gerbe
Isolation de la gerbe
Différence entre la position de la gerbe et du
point d'impact
Et(calo)/pt
de coups de rayonnement de transition
Paramètre d'impact transverse
13Fisher validation de la methode (1)
- Generation de 10000 evenements de signal et bruit
de fond - gaussiennes Gx(-1,1) et Gy(0.5,2) pour le signal
- gaussiennes Gx(-5,3) et Gy(2,2.5) pour le bruit
de fond - correlation X-Y nulles ou 0.9 pour le signal et
-0.7 pour le bruit de fond
Bruit de fond sous le signal du aux correlations
Vraissemblance
Fisher
14Fisher validation de la methode (2)
- Resultats obtenus sans
correlation avec
correlation Fisher
Fisher
Vraissemblance
VraissemblanceLe Fisher ne peut etre
applique s'il n'y a pas de correlationLe Fisher
donne des performances au moins aussi bonnes que
le rapport de vraissemblance remplace 2
variables correlees par une seule