Title: LA STATISTIQUE
1LA STATISTIQUE
- SON HISTOIRE
- ET SES APPLICATIONS
2LA STATISTIQUEQUELLE EST CETTE DISCIPLINEÂ ?
- Petit Robert
- Etude méthodique des faits sociaux par des
procédés numériques (classements, dénombrements,
inventaires chiffrés, recensements) destinée Ã
renseigner et à aider les gouvernements. - Ensemble de techniques dinterprétation
mathématique appliquées à des phénomènes pour
lesquels une étude exhaustive de tous les
facteurs est impossible, Ã cause de leur grand
nombre et de leur complexité.
3LA STATISTIQUE
- BIBLIOGRAPHIE
- J. J. DROESBEKE et P. TASSI, Histoire de la
statistique, Que sais-je ? n2527, PUF, 1997. - Faut-il se fier aux statistiques ? Tangente, n77
(octobre - novembre 2000). - G. BRONNER, Coïncidences, Vuibert, 2007.
4  Statistique  du latin statisticum
(ce qui se rapporte Ã
lEtat)
- Gottfried Achenwall (1746)Â
- premier
enseignement de la statistique (Allemagne) - En fait, origine plus ancienneÂ
- mot déjà utilisé dans un texte administratif de
Colbert - (vers 1666)
5- Chefs dEtatsÂ
- connaître leur puissance population,
richesses, - potentiel militaire
- ? idée de recensement
- Premiers recensementsÂ
- Sumériens 5000 à 2000 av J.-C.
- Egyptiens recensements systématiques de la
population -
- Etats forts avec un système administratif
fort
6- Au début,
- la statistique a consisté à observer des faits
- ? Statistique descriptive
- XIVe siècle début des enregistrements des
actes civils - (naissances, mariages, décès)
7(No Transcript)
8Nombre de morts dans les hôpitaux militaires
britanniques (guerre de Crimée)Florence
Nightingale (1820-1910) gris maladies
évitables brun blessures mortelles rose
autres causes
9- XVIIe siècle Probabilités ? estimations,
prévisions - Extrapolation à partir dune partie de la
population - (W. Petty estimation de la population
londonienne, 1686) - Juger daprès un échantillon
- (problème de la représentativité)
- ? Statistique inférentielle
10- XXe siècle développement des sondages
(U.S.A.) - 1885 création de lInstitut International
de la Statistique (IIS) - 1895 1925 débat sur la représentativité
(IIS) - A. Kiaer (Norvège)  une partie pour le toutÂ
- ? réactions violentes
- Après 1925  Comment tirer léchantillon ?Â
11- Date cruciale 3 novembre 1936
- Election présidentielle américaine
- F. Roosevelt versus G. Landon
- Magazine Literary Digest 2000 000 personnes
(téléphone) - ? Landon
- G. Gallup 3
000 personnes - ? Roosevelt
- Principe de la validité dun sondage accepté
12(No Transcript)
13- La statistique fait partie de la culture
- ANGLO-SAXONNE
- Culture probabiliste indispensable
- Enorme retard en France
14- CausesÂ
- Statistique parent pauvre des probabilités et
des mathématiques - Forte imprégnation cartésienne
- Lincertain est antipédagogique
(déstabilisant ) - Nette préférence pour lenseignement de
certitudes - - Association obligatoire avec une autre
discipline (bio., gestion,...) - (lapproche pluridisciplinaire est encore mal
acceptée)
15 Conséquences Bon sens statistique
insuffisamment développé La présentation de
données statistiques un exercice
 difficile Un chiffre ne peut être
quexact , exempt de toute indétermination
? Risque de manipuler
lopinion
16- ExemplesÂ
- moyenne, médiane
- cote de popularité des hommes politiques
- classement des hôpitaux, des lycées
- rapports dexperts
17Connaître, cest mesurer
(Brunschvicg)
- La statistique nous dit
- Comment effectuer les mesures
- Comment extraire linformation des mesures
18INFORMATION Principale matière première du XXIe
siècle Sa production et son exploitation
statisticiens
19LA VARIABILITE
- En général, dans une population, la variabilité
est un critère de qualité , voire une nécessité
(pour la survie) - Exception lindustrie
- Le statisticien doit savoirÂ
- - appréhender
- - analyser
- -  gérer la variabilité
- La variabilité est une entrave à linférence
statistique
Qualité ? de la variabilité
20Population
Echantillon ( x1 , x2 , ...., xn )
moyenne ? variance ?2 proportion ?
Moyenne x variance s2 proportion
x/n
tirage
inconnues
Inférence statistique
21LA STATISTIQUE DESCRIPTIVELA STATISTIQUE
INFERENTIELLE
- Série statistique univariée
- Série statistique bivariée
- La modélisation
- Les plans dexpériences
- Les sondages
- Lestimation
- Les tests statistiques
- Les séries chronologiques
- Lanalyse des données
- ? Le data mining
22LA MODELISATION
- En général, une observation dépend
- dun grand nombre de facteurs
- cause multifactorielle
- les effets des facteurs ne sont pas simplement
additifs - (présence dinteractions)
23LA MODELISATION (suite)
- ?? Le statisticien va tenterÂ
- didentifier les facteurs prépondérants
- évaluer leur importance relative
- expliciter le lien de ces facteurs  causauxÂ
- avec le caractère étudié, à laide dun
- modèle mathématique
24- ExempleÂ
- variable expliquée prix dune voiture
- variables explicatives cylindrée, puissance,
vitesse, largeur, longueur, poids
prix 1775 103,8 puissance 9,8 poids
(CV DIN)
(kg)
25Exemple biométrie foetale Log10 EPF 1,6961
0,02253 PC 0,01645 PA 0,06439 LF (Weiner et
al., 1985) EPF estimation poids fœtal (en
g) PC périmètre crânien (mm) PA périmètre
abdominal (mm) LF longueur fémur (mm)
26Statisticiens Interlocuteurs privilégiés
des décideurs dans tous les secteurs
dactivité ( politique, économique,
scientifique, industriel ) et à tous les
niveaux (collecte de données, conception des
systèmes dinformation, contrôle de la
production, analyse et restitution des données,
etc.)
27Diversification des métiers de la statistique
Discipline transversale par excellence
28DOMAINES D UTILISATION DE LA STATISTIQUE
- STATISTIQUES OFFICIELLES (I.N.S.E.E.)
- PRESSE MEDIAS
- BANQUES ASSURANCES
- SCIENCES DE LA VIE
- ENVIRONNEMENT ( Foresterie, pêche )
- SANTE
- SCIENCES HUMAINES
- ENTREPRISES INDUSTRIE ( RD, contrôle de
qualité, études de marché, management ) - FINANCE
- RECHERCHE FONDAMENTALE ET APPLIQUEE
- etc
29 30 BANQUES
- Probabilité quun client rembourse son crédit ?
- Cette probabilité peut être exprimée en
fonction - - du montant moyen de son compte courant
- - de la durée du crédit
- - du montant du crédit
- - du sexe
- - de la situation familiale
- etc
31 ASSURANCES (calcul des primes)
- Assurance décès
- - Taux dintérêt
- - Tables de mortalité
- - Frais de gestion
- Assurance-auto
- Tarif unique ou différencié ?
32 Le risque dépend de nombreux facteursÂ
Assuré - Age - Sexe - Profession -
Résidence - Expérience, etc
Véhicule - Modèle - Puissance, etc
33 Etude du  risque ou coût (actuariat)
par des méthodes de régression
 juste tarif mieux résister à la
concurrence problèmes de déontologie et déthique
34SCIENCES DE LENVIRONNEMENT
- Surveillance dun milieu (qualité dune eau,)
- Estimation de leffectif dune population
- Toxicologie de lenvironnement, analyse du risque
- Epidémiologie environnementale
- Prévision des effets du réchauffement climatique
- Phénomènes extrêmes (vagues, cyclones, )
- Prévision des épisodes de pollution (ozone)
- etc.
35Estimation du nombre de jours/an avec des
températures gt 35CPériode 2090-2099
(Météo-France, 2007)
36SANTE BIOLOGIE
- Biométrie
- Imagerie médicale
- Génétique (trouver les gènes  coupables )
- Epidémiologie
- Statistique de la preuve en sciences forensiques
- Diagnostic médical (aide au diagnostic)
- Essais cliniques
- etc.
37Comparaison de deux traitements contre le
VIH(Essai Trianon-ANRS81, INSERM U738)
38PharmacocinétiqueConcentration de théophylline
(médicament contre lasthme) chez 12 individus
pendant 24 heures (IUT de Paris, département STID)
39LES ESSAIS CLINIQUES
- Comparaison de plusieurs traitements
- Essais cliniques randomisés en
double-aveugle - Abstraction des aspects
psychologiques - médecin et
malade - Introduction du hasard dans lexpérience médicale
40 Exemple un nouveau médicament a-t-il des
effets secondaires ?
Nausées
Oui
Non
Traitement
15
35
Placebo
4
46
41 Exemple un nouveau médicament a-t-il des
effets secondaires ?
- Effectifs observés - Effectifs Théoriques
Nausées
Oui
Non
Traitement
15 9,5
35 40,5
Placebo
4 9,5
46 40,5
?2 7,86 ? Probabilité
critique 1
42 Les risques derreur
Décision du statisticien
Pas deffets secondaires
Effets secondaires
Situation réelle
Pas deffets secondaires
Décision erronée Perte dun bon médicament
Décision Correcte
Décision erronée Promotion dun mauvais médicament
Décision Correcte
Effets secondaires
43- Poème de 429 mots découvert en 1985
- Question Shakespeare en est-il lauteur ?
- ?? Le vocabulaire du poème sécarte-t-il de
façon statistiquement significative du
vocabulaire shakespearien connu ? - Méthode basée sur létude comparativeÂ
- - de la fréquence des répétitions
- et
- - de l étendue du vocabulaire
- ? échantillons successifs de 429 mots dans
lœuvre complète
44- Lœuvre complète comprend 31 534 mots
distincts sur un total de 884 647 mots, - répartis de la manière suivanteÂ
- 14 376 mots apparaissent une fois
- 4 343 mots deux fois
- 2 292 mots trois fois
- etc
- 846 mots apparaissent plus de cent fois.
- La structure des répétitions est comparée à celle
des Å“uvres de Marlowe, Ben Jonson
45- Lhypothèse  Shakespeare est lauteur du
sonnet - est remplacée par
- lhypothèse  La structure des répétitions est
comparable à celle - de lÅ“uvre de ShakespeareÂ
- Conclusion le sonnet a bien été écrit par
Shakespeare - la probabilité derreur est faible
46DEBOUCHES
- Banques
- Sociétés de placement collectif
- Compagnies dassurance
- Services de marketing
- Sociétés de sondage
- Environnement
- Industrie pharmaceutique, santé
(biostatistique) - Industrie agroalimentaire
- Services de contrôle de la qualité de la
production - (automobile, eau, etc.)
- ...
47 à méditer
- Le hasard est la somme de nos ignorances
- (Laplace)
- Le hasard, cet hôte indésirable de la pensée
humaine - (Gérard Bronner)