Docsity
Docsity

Prepare for your exams
Prepare for your exams

Study with the several resources on Docsity


Earn points to download
Earn points to download

Earn points by helping other students or get them with a premium plan


Guidelines and tips
Guidelines and tips

Cours sur la probabilité et la statistique, Lecture notes of Probability and Statistics

Le livre contient le cours sur la probabilité avec les exercices d'application à l'appui et des exercices

Typology: Lecture notes

2022/2023

Available from 04/17/2024

liber-brewena
liber-brewena 🇹🇬

1 document

Partial preview of the text

Download Cours sur la probabilité et la statistique and more Lecture notes Probability and Statistics in PDF only on Docsity! I. C. G ERALDO MTH160 Calcul de probabilités et statistique Support de cours et exercices de travaux dirigés Issa Cherif GERALDO Département de Mathématiques, Faculté des Sciences, Université de Lomé Mars 2023 2 MTH160 : Cours et exercices (I. C. GERALDO) I. C. G ERALDO Table des matières 5 7 Séries statistiques à une variable 73 7.1 Description d’une série statistique à une variable . . . . . . . . . . . . . . . . . 73 7.1.1 Description d’une série quantitative . . . . . . . . . . . . . . . . . . . . 73 7.1.2 Description d’une série qualitative . . . . . . . . . . . . . . . . . . . . . 76 7.2 Représentations graphiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 7.2.1 Variables quantitatives discrètes : diagramme en bâtons et polygone des effectifs/fréquences . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 7.2.2 Variables quantitatives continues . . . . . . . . . . . . . . . . . . . . . . 77 7.2.3 Variables qualitatives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 7.3 Caractéristiques numériques d’une distribution . . . . . . . . . . . . . . . . . 81 7.3.1 Les caractéristiques de position . . . . . . . . . . . . . . . . . . . . . . . 82 7.3.2 Les caractéristiques de dispersion . . . . . . . . . . . . . . . . . . . . . 87 7.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 8 Séries statistiques à deux variables 93 8.1 Généralités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 8.2 Caractéristiques numériques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 8.2.1 Cas des données non groupées . . . . . . . . . . . . . . . . . . . . . . . 95 8.2.2 Cas des tableaux de contingence (données groupées) . . . . . . . . . . 96 8.3 Représentation graphique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 8.4 Ajustement linéaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 8.4.1 Notion d’ajustement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 8.4.2 Méthode des moindres carrés ordinaires (MCO) . . . . . . . . . . . . . 99 8.4.3 Qualité de l’ajustement par MCO . . . . . . . . . . . . . . . . . . . . . . 101 8.5 Exemples d’application de l’ajustement linéaire à l’ajustement non linéaire . . 103 8.5.1 Ajustement par une fonction puissance . . . . . . . . . . . . . . . . . . 103 8.5.2 Ajustement par une fonction exponentielle . . . . . . . . . . . . . . . . 103 8.5.3 Ajustement par une fonction logistique . . . . . . . . . . . . . . . . . . 103 8.6 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 III Annexe 107 A Table de la f.r. et des quantiles de la loi N (0, 1) 109 B Annexe pour les exercices du chapitre 8 111 Références bibliographiques 113 6 MTH160 : Cours et exercices (I. C. GERALDO) I. C. G ERALDO Première partie Calcul de probabilités 7 10 MTH160 : Cours et exercices (I. C. GERALDO) A B FIGURE 1.1 – Exemple de représentation de deux ensembles A et B à l’aide des diagrammes de Venn Définition 1.2 • On dit qu’une ensemble Ω est fini s’il est vide ou s’il peut être mis en relation avec un ensemble de numéros de la forme {1, . . . , n} (n ∈ N∗) de sorte qu’à chaque élément de E corresponde un unique numéro et qu’à chaque numéro corresponde un unique élément de Ω. • Dans ce cas, le nombre n est appelé le cardinal de Ω noté Card(Ω) avec la convention Card(∅) = 0. • Un ensemble non fini est dit infini. Exemple 1.3 L’ensemble des lettres minuscules Ω = {a, b, c, d} est fini de cardinal 4 alors que l’ensemble N des entiers naturels et l’ensemble R des nombres réels sont des ensembles infinis. Définition 1.4 Soit Ω un ensemble. Un ensemble A est un sous-ensemble (ou une partie) de Ω si tout élément de A est nécessairement élément de Ω. On note A ⊂ Ω. L’ensemble des parties de Ω est noté P(Ω). En d’autres termes, A ∈ P(Ω) si et seulement si A ⊂ Ω. Par convention, l’ensemble vide ∅ est inclus dans tous les ensembles. Exemple 1.5 Si Ω = {a, b} alors P(Ω) = { ∅, {a}, {b}, {a, b} } . 1.1.2 Opérations sur les ensembles finis et calcul de cardinaux Définition 1.6 Soient Ω un ensemble et A, B deux parties de Ω. 1) L’intersection de A et B, notée A ∩ B, est l’ensemble des éléments appartenant à A et à B. 2) Les ensembles A et B sont dits disjoints s’ils n’ont aucun élément en commun c’est-à-dire si A ∩ B = ∅. 3) La réunion (ou l’union) de A et B, notée A ∪ B, est l’ensemble des éléments appartenant à A ou à B ou en d’autres termes, l’ensemble des éléments appartenant à l’un au moins des deux ensembles. I. C. G ERALDO Chapitre 1. Ensembles finis et Analyse combinatoire 11 4) Le complémentaire de A dans Ω, noté A, est l’ensemble des éléments de Ω n’appartenant pas à A. 5) La différence de A et B, notée A \ B, est l’ensemble des éléments appartenant à A et n’ap- partenant pas à B. A \ B = A ∩ B. 6) La différence symétrique de A et B, notée A∆B, est l’ensemble des éléments appartenant à une et une seule des deux parties A et B (c’est-à-dire que A∆B contient les éléments de A n’appartenant pas à B et les éléments de B n’appartenant pas à A). A∆B = (A ∪ B) \ (A ∩ B) = (A ∩ B) ∪ (B ∩ A). Illustrons les différentes définitions à l’aide d’un diagramme d’Euler-Venn. A BA ∩ B FIGURE 1.2 – Représentation de A ∩ B pour deux ensembles A et B A B A ∪ B (en gris) FIGURE 1.3 – Représentation de A ∪ B pour deux ensembles A et B E AA FIGURE 1.4 – Représentation du complémentaire Remarque 1.7 On peut étendre les notions d’intersection et de réunion à une famille consti- tuée de plus de deux ensembles. Soient A1, A2, . . . , An des ensembles. 12 MTH160 : Cours et exercices (I. C. GERALDO) A BA \ B FIGURE 1.5 – Représentation de la différence de deux ensembles A BA \ B B \ A FIGURE 1.6 – Représentation de la différence symétrique de deux ensembles 1) La réunion de A1, A2, . . . , An notée A1 ∪ A2 ∪ · · · ∪ An ou encore n⋃ i=1 Ai est l’ensemble des éléments appartenant à l’un au moins des Ai. 2) L’intersection de A1, A2, . . . , An notée A1 ∩ A2 ∩ · · · ∩ An ou encore n⋂ i=1 Ai est l’ensemble des éléments appartenant à tous les Ai. Le théorème suivant donne une propriété très utile dans la manipulation des ensembles. Théorème 1.8 (Lois de De Morgan 3) Soient Ω un ensemble et A, B deux parties de Ω. Alors : A ∪ B = A ∩ B et A ∩ B = A ∪ B. (1.1) Donnons à présent quelques règles de calcul des cardinaux d’ensembles obtenus suite à des opérations sur des ensembles finis de cardinaux connus. Théorème 1.9 Soit Ω un ensemble fini et soient A et B des parties de Ω. 1) Si A et B sont disjoints, Card(A ∪ B) = Card(A) + Card(B). 2) Pour A et B quelconques, Card(A ∪ B) = Card(A) + Card(B)− Card(A ∩ B). 3) Card(A) = Card(Ω)− Card(A). 4) Card(A \ B) = Card(A)− Card(A ∩ B). 5) Card(A∆B) = Card(A \ B) + Card(B \ A). I. C. G ERALDO Chapitre 1. Ensembles finis et Analyse combinatoire 15 1.2.2 Principe multiplicatif Il permet de compter le nombre de résultats d’une expérience pouvant se décomposer en k étapes successives (k ∈ N∗), la i−ème étape ayant ni choix possibles (i = 1, . . . , k). Pour la première étape, il y a n1 choix possibles, et pour chaque choix de l’étape 1, il y a n2 choix possibles pour l’étape 2, et ainsi de suite. Le nombre total de résultats possibles de l’expérience globale est donc n = k ∏ i=1 ni = n1 × n2 × · · · × nk. Application 1.20 Une assemblée élit son bureau composé d’un président, d’un trésorier et d’un secrétaire. Le cumul de poste étant interdit, combien de bureaux peut-on former : 1) avec huit candidats (en supposant que chaque candidat est éligible à tous les postes) ? 2) sachant qu’il y a deux candidats pour le poste de président, trois pour le poste de tréso- rier et trois pour le poste de secrétaire? 1.2.3 Principe d’addition Il permet de compter le nombre de dispositions lorsque l’on raisonne par cas. Proposition 1.21 (Principe d’addition) Soient n un entier naturel tel que n ⩾ 2 et A1, A2, . . ., An des ensembles finis deux à deux disjoints c’est-à-dire que pour tous i, j ∈ {1, . . . , n}, on a Ai ∩ Aj = ∅ dès que i ̸= j. Alors, on a l’égalité Card(A1 ∪ A2 ∪ · · · An) = Card(A1) + Card(A2) + · · ·+ Card(An) que l’on peut réécrire plus simplement Card ( n⋃ i=1 Ai ) = n ∑ i=1 Card(Ai). Application 1.22 Soit Ω = {A, B, C, D, E}. Combien de mots de 3 lettres constitués unique- ment de consonnes ou uniquement de voyelles peut-on former avec les lettres de Ω ? 1.2.4 Arrangements avec répétition Proposition 1.23 Soit Ω un ensemble de cardinal n et soit p ∈ N. Le nombre d’arrangements avec répétition de p éléments parmi n est n × n × · · · × n︸ ︷︷ ︸ p fois = np. Application 1.24 Soit Ω = {1, 2, 3, 4, 5}. Combien de nombres de trois chiffres peut-on for- mer avec les éléments de Ω ? 16 MTH160 : Cours et exercices (I. C. GERALDO) 1.2.5 Arrangements sans répétition - Permutations Proposition 1.25 Le nombre d’arrangements sans répétition de p éléments parmi n (p ⩽ n) est Ap n = n × (n − 1)× · · · × (n − p + 1)︸ ︷︷ ︸ p facteurs . (1.3) Application 1.26 Une compétition réunit 16 équipes. Un podium est un triplet (x1, x2, x3) avec x1, x2 et x3 désignant respectivement le vainqueur, le finaliste malheureux et l’équipe classée troisième. Combien y a-t-il de podiums possibles? Définition 1.27 (Permutation) Lorsque p = n, un arrangement de p éléments parmi n est appelé une permutation. Une permutation de n éléments distincts est donc un réarrangement ordonné, sans répétition de ces n éléments. Exemple 1.28 Les permutations possibles de trois éléments A, B et C sont ABC, ACB, BAC, BCA, CAB et CBA. Proposition 1.29 Soit n ∈ N∗. Le nombre de permutations possibles de n éléments distincts vaut : An n = n × (n − 1)× · · · × 1︸ ︷︷ ︸ n facteurs et est noté n! (lire « factorielle n »). Par convention, 0! = 1. Application 1.30 De combien de façons peut-on faire asseoir 5 personnes dans une rangée de 5 chaises? 1.2.6 Combinaisons sans répétition 1.2.6.1 Définition et exemple Proposition 1.31 Soit Ω un ensemble de cardinal n et soit p un entier naturel non nul tel que p ⩽ n. Le nombre de combinaisons sans répétition de p éléments parmi n (ou le nombre de parties de Ω contenant p éléments) est Cp n = n! p!(n − p)! . Exemple 1.32 Soit Ω = {a, b, c, d} un ensemble à 4 éléments. Le nombre de parties de Ω contenant 2 éléments est aussi le nombre de combinaisons sans répétition de 2 éléments parmi 4. Il vaut C2 4 = 4! 2!2! = 6. I. C. G ERALDO Chapitre 1. Ensembles finis et Analyse combinatoire 17 Si on essaie de compter les parties de E ayant 2 éléments, on obtient : {a, b}, {a, c}, {a, d}, {b, c}, {b, d} et {c, d}. Elles sont bien au nombre de 6. Application 1.33 On demande de pronostiquer les deux finalistes de la CM. Combien y a-t-il de possibilités? 1.2.6.2 Propriétés Proposition 1.34 Soient n et p deux entiers naturels tels que p ⩽ n. On a : (1) C0 n = 1, (2) C1 n = n, (3) Cn n = 1, (4) Cp n = Cn−p n . Théorème 1.35 (Formule du binôme de Newton) Soient n ∈ N et x, y ∈ R. On a : (x + y)n = n ∑ k=0 Ck nxkyn−k = n ∑ k=0 Ck nxn−kyk. (1.4) 1.2.6.3 Cardinal de l’ensemble des parties Proposition 1.36 Soit Ω un ensemble fini tel que Card(Ω) = n. Le nombre total de parties de Ω est : Card(P(Ω)) = 2n. Preuve : Le nombre total de parties de Ω est le nombre de parties à 0 élément + le nombre de parties à 1 élément + le nombre de parties à 2 éléments + · · · + le nombre de parties à n éléments. Ainsi : Card(P(Ω)) = C0 n + C1 n + · · ·+ Cn n = n ∑ k=0 Ck n = n ∑ k=0 Ck n(1) k(1)n−k = (1 + 1)n d’après la formule du binôme de Newton = 2n. □ Exemple 1.37 Si Ω = {a, b, c} alors P(Ω) a 23 = 8 parties. On peut les énumérer : • l’ensemble vide : ∅, • 3 singletons : {a}, {b}, {c}, • 3 paires : {a, b}, {a, c}, {b, c}, • Ω tout entier : {a, b, c}. 20 MTH160 : Cours et exercices (I. C. GERALDO) Exercice 1.5 Quatre personnes se présentent à un entretien après lequel le recruteur a la possibilité soit de ne choisir personne, soit d’en choisir une, deux, trois ou quatre. Quel est le nombre total de possibilités? Exercice 1.6 Le tiercé est une forme de pari qui consiste à donner les trois premiers che- vaux ayant franchi la ligne d’arrivée. Quinze (15) chevaux sont au départ d’un grand prix. Combien y a-t-il de tiercés possibles : 1) au total ? 2) dans lesquels les 3 chevaux de tête sont prédits dans l’ordre? 3) dans lesquels les 3 chevaux de tête sont prédits dans l’ordre ou le désordre? 4) dans lesquels les 3 chevaux de tête sont prédits dans le désordre? Exercice 1.7 Lors d’un recrutement pour 4 postes identiques, 6 femmes et 8 hommes se présentent. Combien de recrutements distincts sont possibles 1) au total ? 2) sachant que l’on embauche 2 hommes et 2 femmes? Exercice 1.8 Un facteur dispose de p enveloppes à répartir dans n boîtes aux lettres. On suppose qu’une boîte peut contenir plusieurs enveloppes. De combien de façons peut se faire cette répartition : 1) si les enveloppes sont distinctes? 2) si les enveloppes sont identiques? Exercice 1.9 Une multinationale décide de lancer un dentifrice pour chien. Le nom de ce nouveau produit doit comporter 3 lettres de l’alphabet. Déterminer les nombres : 1) N1 de noms que l’on peut fabriquer 2) N2 de noms contenant trois lettres distinctes 3) N3 de mots commençant et finissant par une consonne 4) N4 de mots contenant au moins une voyelle 5) N5 de mots contenant deux consonnes et une voyelle. Exercice 1.10 1) Montrer que le nombre de façons de répartir n personnes en trois groupes de n1, n2 et n3 personnes respectivement tels que n1 + n2 + n3 = n est égal à n! n1!n2!n3! . 2) Dans un commissariat, huit (08) agents de police sont répartis aléatoirement de telle sorte qu’il y ait 3 agents de patrouille, 2 agents de garde au commissariat et 3 agents de réserve. Quel est le nombre total de répartitions possibles? I. C. G ERALDO CHAPITRE 2 PHÉNOMÈNES ALÉATOIRES ET MODÈLE PROBABILISTE Résumé – Ce chapitre introduit la notion de probabilité et présente le concept classique d’équiprobabilité lié à un ensemble fini. L’objectif de ce chapitre est de savoir calculer des probabilités dans un cadre d’équiprobabilité sur un ensemble fini. Sommaire 2.1 Notion d’expérience aléatoire . . . . . . . . . . . . . . . . . . . . . . . . . . 21 2.2 Evénements . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 2.2.1 Notion d’événement . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 2.2.2 Langage des événements . . . . . . . . . . . . . . . . . . . . . . . . 23 2.3 Espaces probabilisés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 2.3.1 Définition de la probabilité . . . . . . . . . . . . . . . . . . . . . . . 24 2.3.2 Propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 2.4 Notion d’équiprobabilité ou de probabilité uniforme . . . . . . . . . . . 26 2.5 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 2.1 NOTION D’EXPÉRIENCE ALÉATOIRE Les phénomènes dans lesquels apparaît souvent l’effet du hasard sont d’un grand inté- rêt dans plusieurs domaines très différents. A titre d’exemples, on peut citer les jeux de ha- sard, les banques et la finance (arrivée des clients à un guichet, évaluation des capacités d’un individu pris au hasard à rembourser un crédit avant de le lui octroyer, gestion de porte- feuille par les compagnies boursières), la biologie (où le hasard est omniprésent et considéré comme source de la diversité biologique des individus et de la variabilité des caractères), la médecine (où on évalue les « chances » de succès de divers traitements), l’électronique (durée de vie des composantes électroniques), l’informatique (théorie des graphes, filtrage de spams, théorie des files d’attente et des réseaux), l’assurance (évaluation des risques de sinistres, primes payées par les assurés), etc. . . Définition 2.1 • Une expérience aléatoire est une expérience dont il est impossible de prévoir le résul- tat, c’est-à-dire, qui répétée dans des conditions identiques, peut donner des résultats différents. 21 22 MTH160 : Cours et exercices (I. C. GERALDO) • L’ensemble des résultats possibles, souvent noté Ω, est appelé univers des possibles (ou tout simplement univers) ou encore espace fondamental. Exemple 2.2 Voici quelques exemples d’expériences aléatoires et les univers qu’on peut leur associer : TABLE 2.1 – Exemples d’expériences aléatoires et d’univers associés Expérience Univers des possibles Jet d’un dé à six faces Ω = {1, 2, 3, 4, 6} Jet de deux dés Ω = {1, . . . , 6}2 = {(i, j) ∈ N2 | 1 ⩽ i, j ⩽ 6} Lancer d’une pièce Ω = {pile, face} Durée de fonctionnement d’un ap- pareil Ω = R+ Bien que le résultat précis d’une expérience aléatoire soit imprévisible, l’observation et l’intuition amènent à penser que ces phénomènes obéissent à certaines lois. La théorie des probabilités vise à fournir un modèle mathématique pour décrire ces phénomènes. Un modèle associé à une expérience aléatoire contient trois objets mathématiques essentiels : • l’espace fondamental Ω, • une classe A de sous-ensembles de Ω appelés événements, • une probabilité P sur l’espace (Ω,A), c’est-à-dire l’affectation d’un poids à chaque événement traduisant la « chance » de réalisation dudit événement. 2.2 EVÉNEMENTS 2.2.1 Notion d’événement La théorie des probabilités utilise le langage des ensembles pour modéliser une expé- rience aléatoire. Dans toute la suite, nous considérerons une expérience aléatoire d’univers Ω. Définition 2.3 • Un événement A est une propriété dont on peut dire si elle est vraie ou non, une fois l’expérience accomplie. On dira que l’événement A est réalisé ou non suivant que la propriété est vraie ou fausse une fois l’expérience accomplie. • Un événement A est aussi identifié à l’ensemble, encore noté A, de tous les éléments de Ω pour lesquels ladite propriété est vraie. Si A est l’ensemble associé à un événe- ment et si le résultat de l’expérience ω ∈ A alors ledit événement est dit réalisé. I. C. G ERALDO Chapitre 2. Phénomènes aléatoires et modèle probabiliste 25 1) Ω ∈ A ; 2) si A ∈ A alors A ∈ A (stabilité par passage au complémentaire) ; 3) si (Ai)i∈N est une suite d’événements de A, alors ∞⋃ i=1 Ai ∈ A (stabilité par l’union dé- nombrable). Le couple (Ω,A) est alors appelé espace probabilisable. Exemple 2.12 Pour tout ensemble Ω, 1) la famille P(Ω) des parties de Ω, est une tribu ; 2) la famille {∅, Ω} est une tribu appelée tribu triviale sur Ω. Remarque 2.13 Dans les exemples et exercices donnés dans la suite du cours, et sauf men- tion contraire, nous supposerons A = P(Ω). Définition 2.14 (Probabilité) On appelle probabilité sur un espace probabilisable (Ω,A), toute application P définie de A dans [0, 1] telle que : 1) P(Ω) = 1 ; 2) pour toute suite (Ai)i∈N d’événements deux à deux incompatibles : P ( ∞⋃ i=0 Ai ) = ∞ ∑ i=0 P(Ai). (σ − additivité de P) Le triplet (Ω,A, P) est appelé espace probabilisé ou espace de probabilité. Le nombre P(A) s’appelle la probabilité de l’événement A. On emploie souvent, dans certaines situations, l’expression loi de probabilité au lieu de probabilité. 2.3.2 Propriétés Théorème 2.15 Soit (Ω,A, P) un espace probabilisé. Les propriétés suivantes sont satisfaites : 1) Pour tout A ∈ A, on a : P(A) ∈ [0, 1]. 2) P(∅) = 0. 3) Pour tous événements A1, . . . , An deux à deux incompatibles, on a : P ( n⋃ i=1 Ai ) = n ∑ i=1 P(Ai). En particulier, pour deux événements incompatibles A et B, on a : P(A ∪ B) = P(A) + P(B). 26 MTH160 : Cours et exercices (I. C. GERALDO) 4) Si A et B sont des événements quelconques, on a P(A ∪ B) = P(A) + P(B)− P(A ∩ B). (2.1) 5) Pour tout A ∈ A, on a : P(A) = 1 − P(A). 6) Pour deux événements A et B, P(A \ B) = P(A)− P(A ∩ B) (2.2) P(A∆B) = P(A \ B) + P(B \ B). (2.3) 7) Si A, B ∈ A et si A ⊂ B, alors P(A) ⩽ P(B). 2.4 NOTION D’ÉQUIPROBABILITÉ OU DE PROBABILITÉ UNIFORME La théorie des probabilités ne dit pas quelle loi de probabilité mettre sur un ensemble Ω parmi toutes les nombreuses lois possibles. Nous présentons ici l’équiprobabilité ou proba- bilité uniforme mais évidemment il existe bien d’autres façons de définir une loi de proba- bilité, chacune ayant des avantages et des limites. Quelque soit la loi choisie, il faut garder à l’esprit qu’un modèle probabiliste n’est qu’une représentation de la réalité et ses hypo- thèses doivent être mises à l’épreuve des faits. Lorsque Ω est fini et si les conditions de l’expérience le permettent, on considère a priori que les événements élémentaires ont la même probabilité : on parle d’équiprobabilité ou de probabilité uniforme. Définition 2.16 Soit Ω = {ω1, . . . , ωn} un univers fini. L’équiprobabilité ou probabilité uni- forme sur Ω est définie par : P({ωi}) = 1 n , ∀i = 1, . . . , n. (2.4) Exemple 2.17 Si l’expérience aléatoire consiste à jeter un dé parfait (non truqué) à six faces numérotées de 1 à 6, on peut supposer que toutes les faces ont la même probabilité d’appa- raître qui égale à 1/6. Le calcul des probabilités n’est donc plus qu’une affaire de dénombrement, d’où la cé- lèbre formule suivante. Proposition 2.18 Soient n ∈ N∗, Ω = {ω1, . . . , ωn} un univers fini et (Ω,A, P) un espace pro- babilisé. Si P représente l’équiprobabilité (ou probabilité uniforme) sur Ω, alors pour tout événement A ∈ A, P(A) = Card(A) Card(Ω) = Nombre de cas favorables à A Nombre de cas possibles . (2.5) I. C. G ERALDO Chapitre 2. Phénomènes aléatoires et modèle probabiliste 27 Application 2.19 Dans une urne contenant dix boules indiscernables au toucher numéro- tées de 0 à 9, on tire successivement trois boules avec remise et on relève dans l’ordre les trois chiffres obtenus. Décrire le triplet (Ω,A, P) associé à cette expérience et calculer la probabilité de chacun des évènements suivants : 1) A : « Les trois chiffres obtenus sont identiques ». 2) B : « Les trois chiffres obtenus sont deux à deux distincts ». 3) C : « On n’obtient pas le chiffre 4 ». 4) D : « On obtient le chiffre 4 au moins une fois ». 5) E : « Le second chiffre est pair ». 6) F : « Les deux premiers chiffres sont pairs ». 7) G : « L’un des deux premiers chiffres au moins est pair ». 30 MTH160 : Cours et exercices (I. C. GERALDO) I. C. G ERALDO CHAPITRE 3 PROBABILITÉ CONDITIONNELLE ET INDÉPENDANCE Résumé – Ce chapitre présente les concepts de probabilité conditionnelle et d’indépen- dance. Deux importantes formules, le théorème des probabilités totales et la formule de Bayes, y sont présentées. L’objectif est de savoir calculer des probabilités dans un contexte de probabilités conditionnelles. Sommaire 3.1 Introduction et définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 3.2 Notion d’indépendance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 3.2.1 Indépendance de deux événements . . . . . . . . . . . . . . . . . . 32 3.2.2 Propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 3.2.3 Incompatibilité et indépendance . . . . . . . . . . . . . . . . . . . . 33 3.2.4 Indépendance mutuelle . . . . . . . . . . . . . . . . . . . . . . . . . 33 3.3 Formules importantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 3.3.1 Théorème des probabilités totales . . . . . . . . . . . . . . . . . . . 34 3.3.2 Formule de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 3.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 3.1 INTRODUCTION ET DÉFINITION Soit (Ω,A, P) l’espace probabilisé associé à une expérience aléatoire. Nous avons vu dans le chapitre précédent que la probabilité d’un événement A ∈ A pouvait être consi- dérée comme une quantification a priori (c’est-à-dire avant la réalisation de l’expérience) des « chances » de réalisation de A. Si l’on dispose d’une information supplémentaire sur la réalisation d’un autre événement B, il est logique de penser que cette nouvelle informa- tion pourrait modifier les « chances » de voir A se réaliser. Illustrons cela à l’aide l’exemple suivant : Exemple 3.1 Dans un groupe de 100 personnes, il y a 40 femmes dont 10 sont au chômage et 60 hommes dont 10 sont chômage. 1) Si on tire une personne au hasard dans la population, la probabilité qu’elle soit au chô- mage est p1 = 20 100 = 0.2 31 32 MTH160 : Cours et exercices (I. C. GERALDO) car il y a au total 20 personnes (10 hommes et 10 femmes) au chômage. 2) Maintenant, si on suppose que la personne tirée est une femme, la probabilité qu’elle soit au chômage est p2 = 10 40 = 0.25. La notion de probabilité conditionnelle abordée dans ce chapitre va permettre, dans une certaine mesure, de rendre compte de l’information apportée par la réalisation d’un événement donné sur la réalisation (éventuelle) d’un autre événement. Théorème – Définition 3.2 Soient (Ω,A, P) un espace probabilisé et B un événement de proba- bilité P(B) > 0. Alors la fonction d’ensembles P(·|B), définie pour tout événement A ∈ A par P(A|B) = P(A ∩ B) P(B) (3.1) est une probabilité sur (Ω,A). On l’appelle probabilité conditionnelle sachant B. Application 3.3 On lance deux fois un dé parfaitement équilibré dont les faces sont numé- rotées de 1 à 6. Quelle est la probabilité d’obtenir la face 6 au premier lancer sachant que la somme des chiffres obtenus vaut 8? ▶▶▶ Réponse : On pourra munir l’univers Ω de l’équiprobabilité et considérer les événe- ments A : « Obtenir la face 6 au premier lancer » et B : « la somme des chiffres obtenus vaut 8 ». On pourra alors vérifier que P(A|B) = 1/5. Remarque 3.4 La probabilité conditionnelle étant avant tout une probabilité, elle vérifie donc les propriétés données par la Proposition 2.15 (page 25). 3.2 NOTION D’INDÉPENDANCE 3.2.1 Indépendance de deux événements Définition 3.5 Soit (Ω,A, P) un espace probabilisé. Deux événements A et B sont indépen- dants pour la probabilité P s’ils vérifient la propriété : P(A ∩ B) = P(A)P(B). (3.2) Application 3.6 On lance deux fois de suite un dé parfaitement équilibré et on note les deux chiffres obtenus. On considère les événements A : « le premier chiffre est pair » et B : « le second chiffre est supérieur ou égal à 5 ». Vérifier que les événements A et B sont indépendants. I. C. G ERALDO Chapitre 3. Probabilité conditionnelle et indépendance 35 3.3.2 Formule de Bayes On conserve les notations de la sous-section précédente. Considérons une des causes susceptibles de réaliser l’événement A, la cause Bk par exemple. On suppose l’événement A réalisé et on cherche à déterminer la probabilité que la cause Bk ait provoqué la réalisation de A c’est-à-dire P(Bk|A). Pour tout k ∈ {1, . . . , n}, on a : P(Bk|A) = P(Bk ∩ A) P(A) = P(A ∩ Bk) P(A) = P(A|Bk)P(Bk) P(A) . En utilisant la formule (3.4), on obtient le théorème suivant qui porte le nom de formule de Bayes 1. Théorème 3.15 (Formule de Bayes) Soient (Ω,A, P) un espace probabilisé, A un événement et B1, . . . , Bn un système complet d’événements tel que P(Bi) > 0 pour chaque i = 1, . . . , n. Si P(A) > 0, alors on a : ∀k ∈ {1, . . . , n}, P(Bk|A) = P(A|Bk)P(Bk) ∑n i=1 P(A|Bi)P(Bi) . (3.5) Exemple 3.16 Lorsque le système complet est constitué d’un événement B et son contraire B tous deux de probabilité non nulle, la formule (3.5) se simplifie en : P(B|A) = P(A|B)P(B) P(A|B)P(B) + P(A|B)P(B) . Application 3.17 Dans une usine trois machines M1, M2, M3 fabriquent des boulons de même type. La machine M1 sort en moyenne 0.3 % de boulons défectueux, M2 0.8 % et M3 1 %. On mélange 1000 boulons dans une caisse, 500 provenant de M1, 350 de M2 et 150 de M3. On tire un boulon au hasard dans la caisse et on constate qu’il est défectueux. On souhaite répondre à la question suivante : « quelle est la probabilité qu’il ait été fabriqué par la machine M1 ? ». On considère les événements Mi : « le boulon tiré provient de la machine i » (i = 1, 2, 3) et D : « le boulon tiré est défectueux ». 1) Traduire les hypothèses de l’énoncé en termes de probabilités et de probabilités condi- tionnelles. 2) Répondre alors à la question posée par l’énoncé. ▶▶▶ Réponse : On pourra utiliser la formule (3.5) et vérifier que la réponse finale est 0.26. 1. Thomas Bayes ((1701 ou 1702) - 1761), mathématicien et pasteur britannique 36 MTH160 : Cours et exercices (I. C. GERALDO) 3.4 EXERCICES Exercice 3.1 Parmi les vols quittant une ville V1 pour une ville V2, 89.5% partent à l’heure (événement D) et arrivent à destination à l’heure (événement A), 3.5% partent à l’heure et arrivent en retard, 1.5% partent en retard et arrivent à l’heure, et 5.5% partent en retard et arrivent en retard. 1) Traduire les données de l’énoncé et expliquer pourquoi elles sont cohérentes. 2) Quelle est la probabilité (a) qu’un vol parte à l’heure? (b) qu’un vol arrive en retard? (c) qu’un vol arrive à l’heure sachant qu’il est parti à l’heure? (d) qu’un vol arrivé en retard soit parti en retard? Exercice 3.2 On considère une communauté où chaque membre a un ordinateur sur lequel est installé un seul système d’exploitation. On suppose que 30% des membres utilisent Ma- cintosh, 50% utilisent Windows et 20% utilisent Linux. Au cours d’une opération sur Inter- net, un virus informatique s’attaque à tous les PC. On apprend que ledit virus a infecté 65% des utilisateurs de Mac, 82% des utilisateurs de Windows et 50% des utilisateurs de Linux. On choisit une personne au hasard et on considère les événements M : « la personne pos- sède Macintosh », W : « la personne possède Windows », L : « la personne possède Linux », I : « le PC de la personne est infectée par le virus ». 1) Traduire les hypothèses de l’énoncé. 2) On apprend que le système de la personne choisie a été infecté par un virus. Quelle est la probabilité qu’elle soit un utilisateur de Windows? Exercice 3.3 Dans une association, deux bénévoles A et B collent des timbres sur des en- veloppes. Le travail est réparti entre les deux bénévoles de telle sorte que A traite 40% des enveloppes et B 60%. Sous l’effet de la fatigue, A omet de mettre un timbre dans 3% des cas et B dans 2% des cas. On choisit une enveloppe au hasard. 1) Calculer la probabilité qu’elle ne porte pas de timbre. 2) Sachant qu’elle ne porte pas de timbre, calculer la probabilité qu’elle ait été traitée par A. Exercice 3.4 On considère une population composée de 48% d’hommes et de 52% de femmes. La probabilité qu’un homme soit daltonien est 0.05, la probabilité qu’une femme soit dal- tonienne est 0.0025. On choisit une personne au hasard dans la population. Quelle est la probabilité qu’elle soit daltonienne? Exercice 3.5 Soient A et B deux événements tels que P(A) = 1/5 et P(A ∪ B) = 1/2. Calculer P(B) dans chacun des cas suivants : 1) A et B sont incompatibles. 2) A et B sont indépendants. I. C. G ERALDO Chapitre 3. Probabilité conditionnelle et indépendance 37 Exercice 3.6 On jette deux dés parfaitement équilibrés dont les faces sont numérotées de 1 à 6. Soit A l’événement « la somme des chiffres indiqués est impaire » et soit B l’événement « l’un des dés indique le chiffre 1 ». Les événements A et B sont-ils indépendants? Exercice 3.7 On dispose de deux urnes contenant des boules indiscernables au toucher. L’urne 1 contient trois boules blanches et une boule noire. L’urne 2 contient une boule blanche et deux boules noires. On lance un dé non truqué. Si le dé donne un numéro in- férieur ou égal à 2, on tire une boule dans l’urne 1. Sinon on tire une boule dans l’urne 2. On considère les événements B : « la boule tirée est blanche » et Ui : « la boule est tirée dans l’urne i », i ∈ {1, 2}. 1) Calculer les probabilités P(U1), P(U2), P(B|U1) et P(B|U2). 2) Calculer la probabilité de tirer une boule blanche. 3) On suppose que la boule tirée est blanche. Calculer le probabilité qu’elle provienne de l’urne 1? Exercice 3.8 Vous contactez deux amis A et B afin de former un groupe de travail de ma- thématiques. La probabilité que l’ami A accepte est de 0.2 et celle que l’ami B accepte est de 0.6. De plus, sachant que l’ami A a accepté, l’ami B acceptera avec une probabilité de 0.7. Calculer la probabilité que : 1) vos deux amis acceptent ; 2) l’ami A accepte sachant que B a accepté ; 3) seul l’ami A accepte ; 4) l’un au moins de vos deux amis accepte ; 5) aucun de vos deux amis n’accepte. Exercice 3.9 Un test médical pour une maladie M donne deux résultats possibles : + et −. Les probabilités sont données par : P(+ ∩ M) = 0.009, P(+ ∩ M) = 0.099, P(− ∩ M) = 0.001 et P(−∩ M) = 0.891. 1) Calculer P(M), P(M), P(+|M), P(−|M), P(+|M) et P(−|M). Les interpréter. 2) Quelle est la probabilité d’avoir la maladie sachant que le test est positif ? Ce test vous semble-t-il fiable? Exercice 3.10 Trois personnes A, B et C tirent sur un oiseau. On suppose que les tirs sont indépendants les uns des autres et que les probabilités de succès sont respectivement 70%, 50% et 90%. Calculer la probabilité que l’oiseau soit touché 1) en calculant d’abord la probabilité de l’événement contraire ; 2) en utilisant l’expression de P(A ∪ B ∪ C). Exercice 3.11 Pour se rendre à l’université, un étudiant a le choix entre 4 itinéraires : A, B, C et D. La probabilité qu’il a de choisir l’itinéraire A (resp. B, C) est 1 3 (resp. 1 4 , 1 12 ). La pro- babilité d’arriver en retard en empruntant A (resp. B, C) est 1 20 (resp. 1 10 , 1 5 ). En empruntant D, il n’est jamais en retard. Calculer la probabilité pour que : 40 MTH160 : Cours et exercices (I. C. GERALDO) qui correspond à l’événement « on obtient 2 fois Pile ». Voici maintenant la définition générale d’une variable aléatoire. Définition 4.2 Soient (Ω,A) et (E, E) deux espaces probabilisables. • Une variable aléatoire (v.a.) X à valeurs dans E est une application de Ω dans E telle que pour tout A ∈ E , l’on a X−1(A) ∈ A, où l’ensemble X−1(A) = {ω ∈ Ω | X(ω) ∈ A} est l’image inverse de A par l’application X. • Lorsque E = R, on parle de v.a. réelle (v.a.r.) et lorsque E = Rn, on parle de vecteur aléatoire. Théorème – Définition 4.3 Soit X une v.a. réelle définie sur un espace probabilisé (Ω,A, P) à valeurs dans un espace probabilisable (E, E). Alors, l’application PX définie par : PX : E −→ [0, 1], A 7−→ PX(A) = P(X−1(A)) (4.1) définit une probabilité sur (E, E). Pour tous A ⊂ X(Ω) et x ∈ X(Ω), on note : P(X ∈ A) = P(X−1(A)) = P ({ω ∈ Ω | X(ω) ∈ A}) P(X = x) = P(X−1({x})) = P ({ω ∈ Ω | X(ω) = x}) . Application 4.4 On reprend l’exemple 4.1. Calculer P(X = 2) et P(X > 2). 4.2 VARIABLES ALÉATOIRES DISCRÈTES ET CONTINUES 4.2.1 Variables aléatoires discrètes Définition 4.5 Une variable aléatoire définie sur un espace probabilisé (Ω,A, P) est dite discrète si l’ensemble des valeurs prises par X, noté X(Ω), est fini ou dénombrable (en bijec- tion avec N). Exemple 4.6 Comme exemples de v.a. discrètes on peut citer : le nombre de fois que "Pile" apparaît dans 5 lancers d’une pièce (X(Ω) = {0, 1, 2, 3, 4, 5}), le nombre de lancers néces- saires pour obtenir "Face" pour la première fois (X(Ω) = N∗), le nombre d’accidents surve- nant dans une zone donnée (X(Ω) = N), etc. . . Définition 4.7 On appelle loi de probabilité de la v.a. discrète X, la donnée des probabilités P(X = xk) pour toutes les valeurs xk ∈ X(Ω) prises par X. I. C. G ERALDO Chapitre 4. Généralités sur les variables aléatoires 41 Remarque 4.8 La loi de probabilité d’une v.a. discrète X à valeurs dans {x1, x2, . . .} est bien définie si et seulement elle vérifie les deux relations :    ∀k ⩾ 1, P(X = xk) ⩾ 0 ∑ k⩾1 P(X = xk) = 1. (4.2) Définition 4.9 On appelle fonction de répartition (f.r.) de la v.a. discrète X, la fonction définie de R dans [0, 1] par : FX(x) = P(X ⩽ x). (4.3) Proposition 4.10 La fonction de répartition F d’une v.a.r. X vérifie les propriétés suivantes : 1) ∀x ∈ R, 0 ⩽ F(x) ⩽ 1. 2) F est une fonction croissante (au sens large), continue à droite en tout point x ∈ R. 3) lim x→−∞ F(x) = 0 et lim x→+∞ F(x) = 1. Remarque 4.11 1) L’ensemble de définition de la f.r. est R et non X(Ω). 2) En particulier, pour une v.a. discrète, la fonction de répartition est une fonction en escalier, constante par morceaux et continue à droite. La proposition suivante est très utile pour calculer la fonction de répartition d’une v.a. discrète. Proposition 4.12 Soit X une variable aléatoire discrète prenant un ensemble fini de valeurs {x1, . . . , xn} avec probabilités respectives p1, . . ., pn telles que n ∑ i=1 pi = 1. La fonction de répartition de X est obtenue par la formule : F(x) =    0 si x < x1 p1 si x1 ⩽ x < x2 p1 + p2 si x2 ⩽ x < x3 ... ... ... i ∑ j=1 pj si xi ⩽ x < xi+1 ... ... ... n−1 ∑ j=1 pj si xn−1 ⩽ x < xn 1 si x ⩾ xn. (4.4) 42 MTH160 : Cours et exercices (I. C. GERALDO) Application 4.13 On lance trois fois une pièce parfaitement équilibrée et on désigne par X le nombre de fois que "Pile" apparaît. Déterminer la loi de probabilité et la f.r. de X. 4.2.2 Variables aléatoires continues Définition 4.14 Une v.a. X est dite absolument continue (ou à densité) s’il existe une fonction f définie sur R, positive, continue sauf peut-être en un nombre fini de points, telle que ∫ +∞ −∞ f (x) dx = 1 (4.5) et pour tout intervalle B ⊂ R, on a : P(X ∈ B) = ∫ B f (x) dx. (4.6) La fonction f est appelée la densité de la loi de X. Exemple 4.15 Comme exemples de v.a. continues on peut citer : la durée de vie d’un té- léphone portable (X(Ω) = R∗ +), le temps passé dans une file d’attente devant un guichet (X(Ω) = R∗ +), le poids d’un individu (X(Ω) = R∗ +), la température (X(Ω) = R), etc. . . Proposition 4.16 Soit X une v.a. continue de densité f . Alors : 1) La f.r. de X est définie par : ∀x ∈ R, F(x) = ∫ x −∞ f (t) dt. (4.7) 2) La densité de probabilité est la dérivée de la f.r. c’est-à-dire F′(x) = f (x) en tout point x où f est continue. 3) Pour tous réels a et b tels que a ⩽ b, on a : P(a < X ⩽ b) = F(b)− F(a) = ∫ b a f (x) dx. (4.8) 4) La probabilité d’un point est toujours nulle : ∀x ∈ R, P(X = x) = 0. Définition 4.17 (Quantiles) Soit X une v.a. à densité dont la fonction de répartition est no- tée F. Pour tout α ∈ ]0, 1[, on appelle quantile d’ordre α, le réel qα tel que F(qα) = α ou encore P(X ⩽ qα) = α. (4.9) La fonction quantile est l’inverse de la fonction de répartition. I. C. G ERALDO Chapitre 4. Généralités sur les variables aléatoires 45 1) Var(X) ⩾ 0. 2) Si a et b sont des constantes alors Var(aX + b) = a2Var(X). Remarque 4.27 La variance peut-être utilisée comme un indicateur de dispersion. Plus elle est élevée, plus les valeurs sont dispersées autour de la valeur moyenne. Application 4.28 Reprendre les exemples 4.13 et 4.18 et calculer E(X) et Var(X). 46 MTH160 : Cours et exercices (I. C. GERALDO) 4.4 EXERCICES Exercice 4.1 On lance simultanément deux dés bien équilibrés dont les faces sont numéro- tées de 1 à 6. On note X la valeur absolue de la différence des nombres portés sur les faces supérieures. 1) Quelle est la loi de probabilité de X ? 2) Calculer E(X) et Var(X). Exercice 4.2 On lance simultanément deux dés bien équilibrés dont les faces sont numéro- tées de 1 à 6. On note X le maximum des numéros obtenus. Déterminer la loi de probabilité de X. Exercice 4.3 Une urne contient 3 jetons blancs (1 carré et 2 ronds) et 4 jetons noirs (3 carrés et 1 rond). On tire au hasard et simultanément 3 jetons de l’urne. On appelle X la v.a.r égale au nombre de jetons blancs obtenus lors d’un tirage. Loi de X et E(X) ? Exercice 4.4 Dans un rayon de magasin, il y a deux produits A et B (par exemple une table et une chaise). La probabilité pour qu’un client achète le produit A est 0.3. La probabilité pour qu’il achète le produit B quand il a acheté le produit A est 0.8 et la probabilité qu’il achète le produit B quand il n’a pas acheté le produit A est 0.1. Les produits A et B sont respectivement vendus à 10 000 F et 4 000 F. La dépense du client est une v.a. X. Déterminer la loi de X puis calculer E(X) et Var(X). Exercice 4.5 Soit X une variable aléatoire (v.a.) dont la loi de probabilité est donnée par le tableau suivant : xi −2 −1 1 2 3 P(X = xi) 0.6 α 0.1 0.05 0.05 1) Déterminer la valeur de α. 2) Calculez l’espérance mathématique, la variance et l’écart-type de cette distribution. 3) Soit Y = 2X − 1. Déterminer la loi de Y puis calculer son espérance et sa variance par deux méthodes différentes. Exercice 4.6 Soit X une v.a.r prenant les valeurs −4, −2, 0, 2 et 4 avec les mêmes probabi- lités. Déterminer la loi de |X| et ses caractéristiques numériques (espérance mathématique, variance et écart-type). Exercice 4.7 On considère un dé cubique truqué dont les faces sont numérotés de 1 à 6 et on note X la variable aléatoire donnée par le numéro de la face supérieure du dé. On suppose que le dé est truqué de sorte que la probabilité d’obtenir une face est proportionnelle au numéro inscrit sur cette face c’est-à-dire qu’il existe un réel a tel que P(X = k) = ka pour tout k ∈ {1, . . . , 6}. 1) Déterminer la loi de X et calculer son espérance mathématique. I. C. G ERALDO Chapitre 4. Généralités sur les variables aléatoires 47 2) On pose Y = 1/X. Déterminer la loi de Y et calculer son espérance mathématique. Com- parer E(1/X) et 1/E(X). Que pouvez-vous en conclure? Exercice 4.8 Dans une loterie, il y a 100 billets de 500 F et 2 lots : l’un de 5 000 F et l’autre de 10 000 F. Les numéros des deux billets gagnants sont tirés au sort indépendamment l’un de l’autre (le même billet peut donc gagner les deux lots). La somme d’argent gagnée (ou perdue) par une personne qui achète un seul billet est une v.a. X. On représentera les pertes par des nombres négatifs : par exemple si la personne ne gagne aucun lot, elle perd 500 F, on aura alors X = −500. Déterminer la loi de X et calculer E(X). Exercice 4.9 Une urne contient une boule qui porte le numéro 0, deux qui portent le numéro 1, trois qui portent le numéro 2 et quatre qui portent le numéro 3. On extrait simultanément deux boules de cette urne et on désigne par X la somme des numéros obtenus. 1) Déterminer la loi de X. 2) Calculer son espérance et sa variance. Exercice 4.10 Soit f la fonction de R vers R définie pour tout x ∈ R par : f (x) = { kx si x ∈ [0, 3] 0 sinon. 1) Déterminer k pour que f soit la densité de probabilité d’une variable aléatoire X. 2) Déterminer la fonction de répartition de X. 3) Calculer P(X > 1), P(X < 2) et P(1 < X < 2). 4) Calculer l’espérance et la variance de X. 5) Déterminer le quantile d’ordre 0.25 de la loi de X. Exercice 4.11 Soit f la fonction définie sur R par f (x) = { Kx(1 − x) si 0 ⩽ x ⩽ 1 0 sinon 1) Déterminer K pour que f soit une densité de probabilité. 2) Soit X la v.a.r. dont la densité de probabilité est f . Calculer E(X) et Var(X). 3) Déterminer la fonction de répartition F(x) de X. 4) Calculer : P(X ⩽ 1 2 ) et P( 1 4 ⩽ X ⩽ 1 2 ). 50 MTH160 : Cours et exercices (I. C. GERALDO) Définition 5.1 Soit n ∈ N∗. Une variable aléatoire X suit une loi uniforme discrète sur [[1, n]] si X prend ses valeurs dans l’ensemble [[1, n]] = {1, . . . , n} et si ∀k ∈ {1, . . . , n}, P(X = k) = 1 n . (5.1) L’espérance mathématique et la variance sont données par la proposition suivante : Proposition 5.2 Si X suit une loi uniforme discrète sur [1, n], alors E(X) = n + 1 2 et Var(X) = n2 − 1 12 . (5.2) Remarque 5.3 La loi uniforme discrète intervient dans de nombreux domaines comme les jeux de pile ou face ou les jeux de dés (avec une pièce ou un dé parfaitement équilibré(e)), les jeux de cartes, etc. . . 5.1.2 Loi de Bernoulli Définition 5.4 Soit p ∈ [0, 1]. Une variable aléatoire X suit une loi de Bernoulli de para- mètre p et on note X ⇝ B(1, p) si la v.a. X ne peut prendre que deux valeurs 1 et 0 avec probabilités respectives p et q = 1 − p c’est-à-dire X(Ω) = {0, 1} et P(X = 1) = p etP(X = 0) = q = 1 − p. (5.3) L’espérance mathématique et la variance sont données par la proposition suivante. Proposition 5.5 Si X ⇝ B(1, p), alors E(X) = p et Var(X) = p(1 − p) = pq. (5.4) Remarque 5.6 La loi de Bernoulli B(1, p) est souvent utilisée pour modéliser une épreuve de Bernoulli c’est-à-dire une expérience aléatoire dont le résultat ne peut prendre que deux valeurs appelées, par convention, succès et échec. Dans ce cas, la v.a. X associée prend la valeur 1 pour le succès et la valeur 0 pour l’échec avec probabilités respectives p et q = 1− p. 5.1.3 Loi binomiale Considérons une expérience aléatoire n’ayant que deux résultats possibles : le succès (avec probabilité p ∈ [0, 1]) et l’échec (avec probabilité q = 1− p). Répétons cette expérience n fois de façon indépendante et désignons par X le nombre de succès obtenus au cours des n répétitions de l’expérience. Il est clair que la v.a. X prend ses valeurs dans l’ensemble X(Ω) = {0, 1, . . . , n}. Par définition, la v.a. X suit une loi binomiale de paramètres n et p ∈ [0, 1], notée B(n, p) et on a : ∀k ∈ {0, 1, . . . , n}, P(X = k) = Ck n pk(1 − p)n−k (5.5) I. C. G ERALDO Chapitre 5. Lois discrètes et continues usuelles 51 où Ck n = n! k!(n − k)! . La quantité P(X = k) représente la probabilité d’obtenir k succès au cours des n répétitions. Application 5.7 Vous avez un devoir de Mathématiques à rendre et vous contactez 10 de vos amis les plus sincères pour vous aider. Chacun, indépendamment des autres a une probabilité de 0.2 d’accepter de vous aider. A la fin de tous vos 10 coups de fil, la v.a. X du nombre total d’amis qui acceptent vous aider suit une loi binomiale B(10, 0.2). Quel est la probabilité que vous : 1) ne trouviez aucun ami pour vous aider? 2) trouviez au moins un ami pour vous aider? ▶▶▶ Réponse : On pourra vérifier que le premier résultat cherché est 0.107. Le second s’en déduit aisément à l’aide des opérations sur les événements. L’espérance mathématique et la variance sont données par la proposition suivante : Proposition 5.8 Si X ⇝ B(n, p), alors E(X) = np et Var(X) = np(1 − p) = npq. (5.6) 5.1.4 Loi géométrique Considérons une expérience aléatoire n’ayant que deux résultats possibles : le succès (avec probabilité p ∈ [0, 1]) et l’échec (avec probabilité q = 1 − p). Répétons cette expé- rience plusieurs fois de façon indépendante et désignons par X le nombre de répétitions nécessaires pour obtenir le premier succès. Il est évident que la v.a. X prend ses valeurs dans l’ensemble X(Ω) = N∗. Par définition, la v.a. X suit une loi géométrique de paramètre p ∈ [0, 1], notée G(p) et on a : ∀k ∈ N∗, P(X = k) = (1 − p)k−1 p. (5.7) Cette quantité représente la probabilité d’obtenir k − 1 échecs avant d’obtenir le succès à la kème répétition. L’espérance mathématique et la variance sont données par la proposition suivante : Proposition 5.9 Si X suit une loi G(p), alors E(X) = 1 p et Var(X) = 1 − p p2 . (5.8) 52 MTH160 : Cours et exercices (I. C. GERALDO) 5.1.5 Loi de Poisson Définition 5.10 La loi de Poisson de paramètre λ > 0, notée P(λ), est la loi d’une v.a. discrète prenant ses valeurs dans N avec les probabilités : ∀k ∈ N, P(X = k) = e−λλk k! . (5.9) L’espérance mathématique et la variance sont données par la proposition suivante : Proposition 5.11 Si X⇝ P(λ), alors E(X) = Var(X) = λ. (5.10) Remarque 5.12 La loi de Poisson est utilisée pour décrire les « événements rares » comme le nombre d’appels reçus par un standard téléphonique pendant une période donnée, le nombre de suicides par an dans un pays donné, le nombre de pièces défectueuses dans une livraison importante (la production étant de bonne qualité), le nombre d’accidents dans un atelier, etc. . .. 5.1.6 Loi hypergéométrique On considère une population de N individus dont M vérifient une certaine propriété. On choisit n individus au hasard dans cette population et on s’intéresse au nombre X d’indi- vidus dans l’échantillon vérifiant la propriété. La probabilité d’avoir exactement k individus vérifiant la propriété est : P(X = k) = Ck MCn−k N−M Cn N . (5.11) Les valeurs extrêmes de k sont : kmin = max(0, n − N + M) et kmax = min(n, M). La variable aléatoire X ainsi définie suit une loi hypergéométrique dépendant de trois para- mètres N, n et p notée H(N, n, p), où p = M/N désigne la proportion d’individus vérifiant la propriété dans la population entière. L’espérance mathématique et la variance sont données par la proposition suivante : Proposition 5.13 Si X suit une loi hypergéométrique H(N, n, p), alors E(X) = np et Var(X) = N − n N − 1 np(1 − p). (5.12) I. C. G ERALDO Chapitre 5. Lois discrètes et continues usuelles 55 5.2.3 Loi normale N (m, σ) 5.2.3.1 Définition et propriétés Définition 5.22 Une v.a.r. X, prenant ses valeurs dans R, suit la loi normale (ou loi de Gauss) de paramètres m ∈ R et σ > 0, notée N (m, σ), si sa densité de probabilité est donnée par : f (x) = 1 σ √ 2π e− (x−m)2 2σ2 . (5.20) Définition 5.23 La loi N (0, 1) est appelée loi normale centrée réduite ou loi normale stan- dard. Sa densité (voir Figure 5.3) est souvent notée φ : φ(x) = 1√ 2π e−x2/2. (5.21) x φ(x) −3 −2 −1 0 1 2 3−z z Φ(−z) = P(X ⩽ −z) = 1 − Φ(z) Φ(−z) FIGURE 5.3 – Densité de la loi N (0, 1). La zone coloriée correspond à Φ(−z). Remarque 5.24 La courbe représentant la densité de probabilité d’une variable normale (ou gaussienne) N (m, σ) a un axe de symétrie vertical pour x = m et du fait de sa forme, elle est souvent appelée « courbe en cloche ». L’espérance mathématique et la variance sont données par la proposition suivante : Proposition 5.25 Si X⇝ N (m, σ), alors E(X) = m et Var(X) = σ2. 5.2.3.2 Fonction de répartition de la loi N (m, σ) Définition 5.26 La fonction de répartition (f.r.) de la loi N (m, σ) est définie par : F(x) = P(X ⩽ x) = 1 σ √ 2π ∫ x −∞ e− (t−m)2 2σ2 dt 56 MTH160 : Cours et exercices (I. C. GERALDO) pour tout x ∈ R. En particulier, la f.r. de la loi N (0, 1), généralement notée Φ, est définie par Φ(z) = 1√ 2π ∫ z −∞ e− t2 2 dt. pour tout z ∈ R. La f.r. de la loi N (m, σ) n’a pas d’expression analytique exacte. Pour contourner ce pro- blème, on utilise la proposition suivante qui montre que les valeurs de la f.r. d’une loi nor- male quelconque peuvent être obtenues à partir de celles de la loi normale centrée réduite. Proposition 5.27 Soit X une v.a. suivant la loi N (m, σ). Alors, la v.a. Z définie par Z = X − m σ (5.22) et appelée variable centrée réduite associée à X, suit la loi N (0, 1). Cette propriété permet de ramener tous les calculs liés à la fonction de répartition d’une loi normale quelconque à celle de la loi normale centrée réduite. En effet, supposons que X suive une loi normale N (m, σ) et que nous voulions calculer F(x) = P(X < x). Soit Z = X − m σ la variable centrée réduite associée à X. On a : P(X < x) = P ( X − m σ < x − m σ ) = P ( Z < x − m σ ) = Φ ( x − m σ ) . (5.23) Il ne reste donc plus qu’à savoir calculer la f.r. de la loi N (0, 1). Dans ce cas, on ne dispose pas de formule analytique exacte et l’on a plutôt recours à une table statistique (voir page 110). 5.2.3.3 Fonction de répartition de la loi N (0, 1) La table de la fonction de répartition de la loi N (0, 1) est donnée dans l’annexe A (voir page 110). Exemple 5.28 Pour lire Φ(1.96), on fait la décomposition 1.96 = 1.90 + 0.06. On repère, dans la première colonne, la ligne où se trouve 1.90 et, dans la première ligne, la colonne où se trouve 0.06 puis on lit la valeur se trouvant à l’intersection de la ligne correspondant à 1.90 et de la colonne correspondant à 0.06. On trouve Φ(1.96) = 0.975. On peut remarquer que seules les valeurs Φ(z) = P(X < z) avec u positif y figurent. On montre que la fonction de répartition de la loi N (0, 1) vérifie la proposition suivante. Proposition 5.29 La f.r. de la loi N (0, 1) vérifie la propriété suivante : ∀z ∈ R, Φ(−z) = 1 − Φ(z) (5.24) et en particulier Φ(0) = 1/2. I. C. G ERALDO Chapitre 5. Lois discrètes et continues usuelles 57 En résumé, • pour z ⩾ 0, la valeur de Φ(z) est donnée par la table. • pour z < 0, on a −z > 0 et Φ(z) = 1 − Φ(−z). 5.2.3.4 Calcul de P(a < X < b) pour la loi N (0, 1) Pour tous a et b ∈ R tels que a < b, on a : P(X < b) = Φ(b) (5.25) P(X > a) = 1 − Φ(a) (5.26) P(a < X < b) = Φ(b)− Φ(a). (5.27) 5.2.3.5 Calcul de P(a < X < b) pour la loi N (m, σ) Pour une v.a. X⇝ N (m, σ), on sait que Z = X − m σ ⇝ N (0, 1). Pour tous a et b ∈ R tels que a ⩽ b, on a : P(X < b) = P ( X − m σ < b − m σ ) = P ( Z < b − m σ ) = Φ ( b − m σ ) , P(X > a) = P ( X − m σ > a − m σ ) = P ( Z > a − m σ ) = 1 − Φ ( a − m σ ) et P(a < X < b) = P ( a − m σ < X − m σ < b − m σ ) = P ( a − m σ < Z < b − m σ ) = Φ ( b − m σ ) − Φ ( a − m σ ) . Exemple 5.30 Soit X une variable suivant la loi normale N (3, 2). Calculons les probabilités suivantes : P(X < 4), P(X < −1), P(X > 1), P(−3 < X < 4). On sait que Z = X − 3 2 ⇝ N (0, 1). 60 MTH160 : Cours et exercices (I. C. GERALDO) 5.3.3 Approximation de la loi binomiale par une loi normale Lorsque n → +∞, on peut approximer la loi binomiale B(n, p) par la loi normale N (np, √ npq) où q = 1 − p. En pratique, les deux conditions généralement requises sont np > 5 et n(1 − p) > 5. Comme il s’agit de l’approximation d’une loi discrète par une loi continue, on procède à ce que l’on appelle correction de continuité de la façon suivante : Si X ∼ B(n, p) et si k ∈ {1, . . . , n} alors P(X = k) ≃ P(k − 0.5 < X < k + 0.5) ≃ P ( k − 0.5 − np√ npq < Z < k + 0.5 − np√ npq ) ≃ Φ ( k + 0.5 − np√ npq ) − Φ ( k − 0.5 − np√ npq ) (5.28) où Z est la v.a. centrée réduite de loi N (0, 1) associée à X et Φ la fonction de répartition de la loi N (0, 1) ; de même, P(a ⩽ X ⩽ b) ≃ P(a − 0.5 ⩽ X ⩽ b + 0.5) ≃ P ( a − 0.5 − np√ npq ⩽ U ⩽ b + 0.5 − np√ npq ) ≃ Φ ( b + 0.5 − np√ npq ) − Φ ( a − 0.5 − np√ npq ) . (5.29) Si on n’appliquait pas la correction de continuité, on trouverait systématiquement P(X = k) = 0 puisque la loi normale est une loi continue. Exemple 5.34 Pour X ∼ B(100, 0.3), np = 30 et nq = 70, la valeur exacte de P(X = 30) est P(X = 30) = C30 1000.3300.770 ≈ 0.08678. La formule d’approximation avec une loi N (np, √ npq) = N (30, √ 21) donne le résultat : P(X = 30) ≈ Φ ( 30 + 0.5 − 30√ 21 ) − Φ ( 30 − 0.5 − 30√ 21 ) ≈ 0.08688. L’erreur d’approximation est très faible. 5.3.4 Approximation de la loi de Poisson par une loi normale Lorsque λ → +∞, on peut approximer la loi de Poisson P(λ) par la loi normale N (λ, √ λ). En pratique, cette approximation est satisfaisante dès que λ > 18. Ici aussi, comme il s’agit d’une approximation d’une loi discrète par une loi continue, il faudra appliquer la correc- tion de continuité. I. C. G ERALDO Chapitre 5. Lois discrètes et continues usuelles 61 5.4 EXERCICES Exercice 5.1 Vous vous livrez chaque matin (du lundi au vendredi inclus) au petit jeu sui- vant : ayant jeté une pièce de monnaie, vous vous rendez en cours si le résultat obtenu est « face » ; dans le cas contraire, vous restez au lit. Soit X le nombre de jours où vous avez « gagné » le droit au repos. 1) Quelle est la loi de X ? Justifiez votre réponse. 2) Calculer E(X) et Var(X). Exercice 5.2 On jette 10 pièces de monnaies truquées de telle sorte que pour chacune d’elles, la probabilité d’obtenir "pile" soit 0.3. Soit X la v.a. égale au nombre de "piles" obtenus au cours de ce lancer. 1) Loi de X, E(X) et Var(X) ? 2) Probabilité d’obtenir 3 "piles"? moins de 3 "piles"? 3) Probabilité que l’on ait obtenu plus de 3 piles sachant que l’on a obtenu au plus 5 "piles"? Exercice 5.3 On considère deux types d’avions A et B ayant respectivement 4 et 2 moteurs. Les moteurs sont supposés indépendants les uns des autres, et ils ont une même probabilité p (0 < p < 1) de tomber en panne. Chaque avion arrive à destination si moins de la moitié de ses moteurs tombe en panne (c’est-à-dire que l’avion A arrive à destination si au plus un des moteurs tombe en panne et l’avion B arrive à destination si aucun des moteurs ne tombe en panne). Soient X et Y respectivement le nombre de moteurs tombant en panne pour A et B. 1) Quelles sont les lois respectives de X et Y ? 2) Déterminer en fonction de p les probabilités pA (resp. pB) pour que l’avion A (resp. B) arrive à destination. 3) Quel avion choisirez-vous? (on discutera en fonction de la valeur de p). Exercice 5.4 Le nombre d’ordinateurs vendus chaque jour dans un magasin spécialisé suit une loi de Poisson de paramètre 4. Calculer la probabilité que dans une journée : 1) on ne vende aucun ordinateur, 2) on vende 4 ordinateurs, 3) on vende au moins un ordinateur, 4) on vende au plus 3 ordinateurs, 5) le nombre d’ordinateurs vendus est compris entre 2 et 6. Exercice 5.5 Soit X une v.a. de loi exponentielle E(λ) avec λ > 0. 1) Rappeler l’expression de la fonction de répartition de X. 2) Vérifier que P(X > h + t|X > h) = P(X > t). On dit que la loi exponentielle est « sans mémoire ». 62 MTH160 : Cours et exercices (I. C. GERALDO) 3) On suppose que la durée de vie d’une clé USB suit une loi exponentielle de paramètre λ = 1/24. L’unité de temps est le mois. Quelle est la probabilité que : (a) la clé USB fonctionne au moins 8 mois? (b) la clé fonctionne encore 4 mois ou plus sachant qu’elle fonctionne toujours au bout de 8 mois? Exercice 5.6 1) Quelle est la probabilité d’obtenir un double (deux mêmes nombres) lorsqu’on lance une fois une paire de dés? 2) On lance de façon répétée une paire de dés jusqu’à la première obtention d’un double. Soit X la variable aléatoire égale au nombre de lancers ainsi réalisés. Donner les valeurs de P(X = 1), P(X = 2) et plus généralement P(X = k) où k ⩾ 1 est un entier quel- conque. Comment s’appelle la loi de X ? 3) Soit n ⩾ 1 un nombre entier naturel. Calculer la probabilité de n’obtenir aucun double lors des n premiers lancers. En déduire P(X > n). 4) Pour k > n, vérifier que P(X = k|X > n) = P(X = k− n). En donner une interprétation. Exercice 5.7 Soit X une v.a. suivant la loi normale centrée réduite. Calculer P(−2 < X < −1), P(|X| < 3), P(X < 2|X > 1.65). Exercice 5.8 Soit X une v.a.r suivant la loi N (8, 4). Calculer P(X < 7.5), P(X > 8.5), P(6.5 < X < 10) et P(X > 6 | X > 5). Exercice 5.9 On suppose que la taille X des hommes suit une loi normale d’espérance 1.75 m et d’écart-type 0.07 m. On mesure la taille chez un individu. 1) Calculer la probabilité que sa taille soit (a) inférieure à 1.54 m (b) supérieure à 1.85 m (c) comprise entre 1.54 m et 1.85 m. 2) On mesure la taille chez 2000 individus. On assimile la situation à un tirage avec remise et on désigne par X le nombre d’individus dont la taille est supérieure à 1.85 m. (a) Quelle est la loi de X ? (b) Donner le nombre moyen d’individus dont la taille est supérieure à 1.85m. Exercice 5.10 Dans un pays dont la population est composée de femmes à 55%, la taille (en mètres) des adultes de sexe masculin (resp. féminin) est distribuée selon une loi normale de moyenne 1.78 (resp. 1.72) et d’écart-type 0.14 (resp. 0.1). 1) Quelle proportion des femmes mesure moins de 1.76m? 2) Quelle proportion des hommes mesure moins de 1.76m? 3) Quelle est la probabilité pour qu’une personne choisie au hasard mesure moins de 1.76m? 4) Parmi les personnes mesurant moins de 1.76m, quelle est la proportion de femmes? I. C. G ERALDO Deuxième partie Statistique descriptive 65 I. C. G ERALDO CHAPITRE 6 CONCEPTS FONDAMENTAUX DE LA STATISTIQUE Résumé – Dans ce chapitre, nous rappelons les concepts fondamentaux de la statistique. Sommaire 6.1 Définition et champs d’application de la statistique . . . . . . . . . . . . 67 6.2 Vocabulaire de la statistique . . . . . . . . . . . . . . . . . . . . . . . . . . 67 6.2.1 Population, individus et échantillon . . . . . . . . . . . . . . . . . . 67 6.2.2 Caractères ou variables statistiques . . . . . . . . . . . . . . . . . . 69 6.2.3 Série statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 6.3 Statistique descriptive et statistique inférentielle . . . . . . . . . . . . . . 72 6.1 DÉFINITION ET CHAMPS D’APPLICATION DE LA STATISTIQUE Le mot « statistique » a plusieurs sens. Il peut désigner un ensemble de données (par exemple, les statistiques du chômage au Togo) ou encore l’ensemble des méthodes de col- lecte, de traitement, d’analyse, d’interprétation et de présentation (diffusion) des données afin de les rendre accessibles. Le mot « statistique » est aussi parfois utilisé pour désigner un paramètre numérique calculé à partir des données. Les champs d’application de la statistique sont très nombreux. Partout où il y a des données, l’on a besoin de la statistique. La science statistique intervient à toutes les étapes, de la collecte des données jusqu’à leur analyse, leur interprétation et leur diffusion. La sta- tistique intervient aussi bien dans les sciences expérimentales (physique, chimie, biologie, etc. . .) qu’en informatique, en économie et en gestion, en médecine, en sociologie ou en psychologie. La statistique est souvent à la base de décisions importantes, les décideurs ne regardant pas les données mais plutôt les informations qui en sont extraites. Le statisticien doit donc s’imposer une démarche rigoureuse tout en ne perdant pas de vue l’objectivité. 6.2 VOCABULAIRE DE LA STATISTIQUE 6.2.1 Population, individus et échantillon Définition 6.1 67 70 MTH160 : Cours et exercices (I. C. GERALDO) des modalités telles que 0-4 ans, 5-9 ans, 10-17 ans, etc. On distingue deux types de variables quantitatives : les variables discrètes et les variables continues. Une variable quantitative X est dite discrète si l’ensemble de ses modalités est au plus dénombrable, c’est-à-dire si ses valeurs peuvent être énumérées sous la forme d’une liste de chiffres x1, x2, . . .. Parmi les exemples de variables quantitatives discrètes, on peut citer : le nombre d’enfants d’une famille, la répartition des étudiants togolais étudiant à l’étranger dans les pays de l’UEMOA en 2022-2023, le nombre d’accidents mensuels sur les routes to- golaises en 2022, etc. . .. Une variable quantitative est dite continue si ces modalités ne sont pas au plus dénom- brables c’est-à-dire qu’on ne peut pas les numéroter ou si ses modalités sont regroupées par classes (intervalles de R). Une telle variable peut prendre toutes la valeurs dans un (plu- sieurs) intervalle(s) de R. Parmi les exemples de variables quantitatives continues, on peut citer : la taille d’une personne, le poids des individus d’une population, la durée de vie d’un composant électronique, etc. . .. Remarque 6.7 Pour une variable quantitative continue, le nombre de classes doit respecter certains critères. Le nombre de classes à retenir dépend de la précision des mesures et de la taille de la population étudiée. Il ne doit être ni trop grand (sinon le problème de départ qui concerne l’abondance des données n’est pas résolu) ni trop petit (car il y aurait perte d’informations). 6.2.2.2 Caractères qualitatifs Une variable est dit qualitative lorsque ses modalités sont des mots ou des lettres n’ex- primant pas de quantité. Une variable qualitative n’ayant que deux modalités est dite di- chotomique. On distingue deux types de variables qualitatives : les variables nominales et les va- riables ordinales. Une variable qualitative est dite nominale si ses modalités ne sont pas ordonnées. Par exemple on peut citer : le sexe, la couleur des yeux, le loisir préféré des individus d’une population, la marque de voiture, le numéro de téléphone, etc. . . Une variable qualitative est dite ordinale si ses modalités peuvent être ordonnées. Par exemple on peut citer : la mention à un examen ("Passable", "Assez-bien", "Bien", "Très- bien"), la cotation attribuée par un jury (par exemple A = "Très satisfaisant", B = "Satisfai- sant", . . .), le degré de satisfaction, etc. . . Remarque 6.8 II arrive (par exemple pour des raisons de traitement informatique) de coder les modalités d’une variable qualitative avec des valeurs numériques. Dans le cas de la variable "sexe", par exemple, on pourrait noter 0 pour la catégorie « homme » et 1 pour la catégorie « femme ». Il est important de souligner que les nombres utilisés pour de tels I. C. G ERALDO Chapitre 6. Concepts fondamentaux de la statistique 71 codages sont non-quantitatifs. Le fait d’attribuer des valeurs numériques pour représenter les diverses modalités d’une variable qualitative ne signifie pas que ces nombres possèdent des propriétés arithmétiques. Ces codes ne servent qu’à identifier les modalités de manière pratique. On n’imagine mal le calcul du sexe moyen dans une population. Application 6.9 Le recensement général de la population et de l’habitat (RGPH) du Togo en 2010 a donné les résultats suivants (voir Tableau 6.1). TABLE 6.1 – RGPH 2010 (source : http://data.gouv.tg). Région Maritime* Plateaux Centrale Kara Savanes Nombre d’hommes 1 248 354 678 191 308 443 376 111 397 996 Nombre de femmes 1 351 601 696 974 309 428 393 829 430 228 Nombre d’habitants 2 599 955 1 375 165 617 871 769 940 828 224 * Lomé - Commune inclus. Préciser la population étudiée, les individus, les caractères et leur nature. Application 6.10 Indiquer de quel type sont les variables présentées ci-dessous : (qualita- tives nominales, qualitatives ordinales, quantitatives discrètes ou quantitatives continues). (a) L’état-civil des habitants togolais. (b) La taille des étudiants de notre université. (c) Le nombre de pages d’un support de cours. (d) Le nombre de ventes d’un appareil électro-ménager. (e) Le sexe des élèves passant le BAC. (f) La nationalité des élèves d’une classe. (g) Le nombre de télévisions par ménage. (h) Le degré de qualification du personnel d’une entreprise. (i) La couleur des yeux des étudiants. (j) Le nombre de jours de pluie pendant le mois d’août. 6.2.3 Série statistique Définition 6.11 Les observations d’un ou plusieurs caractères sur toute la population forment une série statistique. Les séries statistiques les plus élémentaires sont les séries à une variable (séries statis- tiques univariées) et les séries à deux variables (séries statistiques bivariées). 72 MTH160 : Cours et exercices (I. C. GERALDO) 6.3 STATISTIQUE DESCRIPTIVE ET STATISTIQUE INFÉRENTIELLE Les méthodes statistiques peuvent être regroupées en deux grands sous-groupes : la sta- tistique descriptive et la statistique inférentielle : • la statistique descriptive s’intéresse au traitement des données pour en dégager des renseignements quantitatifs ou qualitatifs et ne s’applique que si les données ont été collectées sur la population en entier. • la statistique inférentielle (encore appelée statistique mathématique) a pour fonc- tion d’aider à extrapoler, à partir d’un échantillon tiré de la population à étudier, le comportement de la population dans son ensemble. Cette statistique utilise des mo- dèles théoriques (lois de probabilité) et nécessite la recherche d’échantillons « repré- sentatifs » (qui représentent le mieux possible la diversité de la population entière) constitués au hasard. Remarque 6.12 La statistique inférentielle dépasse le cadre de ce cours. Dans la suite de cette partie, nous nous concentrerons sur la statistique descriptive. I. C. G ERALDO Chapitre 7. Séries statistiques à une variable 75 TABLE 7.1 – Exemple de distribution statistique d’une variable Modalités x1 . . . xp Effectifs n1 . . . np TABLE 7.2 – Nombre d’enfants pour 40 couples. Nombre d’enfants xi 0 1 2 3 4 Nombre de couples ni 12 20 5 2 1 Exemple 7.4 On a relevé le nombre d’enfants de 40 couples. Les résultats obtenus sont don- nés dans le tableau 7.2. Nous pouvons compléter ce tableau avec les fréquences et les effectifs cumulés. xi 0 1 2 3 4 ni 12 20 5 2 1 nic 12 32 37 39 40 nid 40 28 8 3 1 fi (%) 30 50 12.5 5 2.5 fic (%) 30 80 92.5 97.5 100 fid (%) 100 70 20 7.5 2.5 Quelle interprétation pouvons-nous donner aux valeurs en gras? 12.5% des couples interrogés ont exactement 2 enfants, 92.5% de ces couples ont 2 enfants ou moins, 20% des couples ont 2 enfants ou plus. Exemple 7.5 On a noté l’âge (arrondi à l’année près) de 48 salariés d’une entreprise. La série statistique brute (données obtenues pendant l’enquête) est donnée ci-dessous : 43 29 57 45 50 29 37 59 46 31 46 24 33 38 49 31 62 60 52 38 43 26 41 52 60 49 52 41 38 26 37 59 57 41 29 33 33 43 46 57 46 33 46 49 57 57 46 43 Le tableau de données ci-dessous donne la distribution statistique de l’âge des 48 sa- lariés en considérant les classes d’âge [20, 30[, [30, 40[, [40, 45[, [45, 50[, [50, 55[, [55, 60[ et [60, 65[ : TABLE 7.3 – Distribution statistique de l’âge des salariés. Ci [20, 30[ [30, 35[ [35, 40[ [40, 45[ [45, 50[ [50, 55[ [55, 60[ [60, 65[ ni 6 6 5 7 10 4 7 3 Les effectifs cumulés sont donnés par : 76 MTH160 : Cours et exercices (I. C. GERALDO) Ci [20, 30[ [30, 35[ [35, 40[ [40, 45[ [45, 50[ [50, 55[ [55, 60[ [60, 65[ ni 6 6 5 7 10 4 7 3 nic 6 12 17 24 34 38 45 48 nid 48 42 36 31 24 14 10 3 Quelle interprétation pouvons-nous donner aux valeurs en gras? 24 salariés ont moins de 45 ans, 31 salariés ont 40 ans ou plus. 7.1.2 Description d’une série qualitative Pour une variable qualitative, les notions d’effectif et de fréquence restent valables en considérant les différentes modalités dudit caractère. Néanmoins, le calcul des effectifs cu- mulés et des fréquences cumulées n’a de sens que pour les variables qualitatives ordinales. Exemple 7.6 Reprenons les données du tableau 6.1 (page 71). L’effectif total de la popula- tion est n = 6 191 155. Le tableau des fréquences est le suivant : TABLE 7.4 – Tableau de fréquences associé aux données du RGPH 2010. Région Maritime* Plateaux Centrale Kara Savanes Nombre d’habitants 2 599 955 1 375 165 617 871 769 940 828 224 Fréquences 0.420 0.222 0.100 0.124 0.134 * Lomé - Commune inclus. On peut y lire notamment que la région maritime abrite à elle seule 42% de la population togolaise (en 2010). 7.2 REPRÉSENTATIONS GRAPHIQUES Elles permettent d’avoir rapidement une vue d’ensemble d’un tableau de données et de mettre en évidence certains faits essentiels. 7.2.1 Variables quantitatives discrètes : diagramme en bâtons et polygone des effectifs/fréquences Soit (xi, ni), i = 1, . . . , p une série statistique quantitative discrète et soient f1, . . . , fp les fréquences respectives de chaque modalité. Le diagramme en bâtons des effectifs (resp. des fréquences) de cette distribution statistique est constitué de p segments verticaux d’abs- cisses xi et de hauteur ni (resp. fi). Le polygone des effectifs (resp. des fréquences) est obtenu à partir du diagramme en bâtons en joignant par un segment les sommets des bâtons. Exemple 7.7 La figure 7.1 donne le diagramme à bâtons et le polygone des effectifs associés au tableau 7.2. I. C. G ERALDO Chapitre 7. Séries statistiques à une variable 77 0 5 10 15 20 Nombre d'enfants N om br e de c ou pl es 0 1 2 3 4 (a) Diagramme à bâtons 0 5 10 15 20 Nombre d'enfants N om br e de c ou pl es 0 1 2 3 4 (b) Polygone des effectifs FIGURE 7.1 – Diagramme en bâtons et polygone des effectifs associés au tableau 7.2. 7.2.2 Variables quantitatives continues Soit ([ai−1, ai[, ni), i = 1, . . . , p une série statistique quantitative continue et soient f1, . . . , fp les fréquences respectives associées à chaque classe. 7.2.2.1 Histogramme C’est un graphique formé de p rectangles juxtaposés tels que le rectangle associé à la classe i (i = 1, . . . , p) a une largeur égale à l’amplitude de la classe [ai−1, ai[ et une hauteur égale à hi = fi li , i = 1, . . . , p. (7.1) Ainsi, l’aire totale de l’histogramme est égale à 1. L’histogramme donne rapidement une image de l’allure globale de la distribution ; il montre l’étalement des données et apporte ainsi des renseignements sur la dispersion et sur les valeurs extrêmes ; il permet de déceler, éventuellement, des valeurs aberrantes. Exemple 7.8 Reprenons le tableau 7.3 et complétons-le avec les hauteurs des rectangles composant l’histogramme. TABLE 7.5 – Données relatives à l’histogramme de l’âge des salariés. Ci [20, 30[ [30, 35[ [35, 40[ [40, 45[ [45, 50[ [50, 55[ [55, 60[ [60, 65[ ni 6 6 5 7 10 4 7 3 fi 6/48 6/48 5/48 7/48 10/48 4/48 7/48 3/48 li 10 5 5 5 5 5 5 5 hi ≃ 0.0125 0.025 0.0208 0.0292 0.0417 0.0167 0.0292 0.0125 L’histogramme est représenté sur la figure 7.2. 80 MTH160 : Cours et exercices (I. C. GERALDO) 7.2.3 Variables qualitatives 7.2.3.1 Diagramme à barres Le diagramme à barres verticales des effectifs ou des fréquences est une représenta- tion graphique de la distribution d’une variable qualitative sur laquelle l’axe des abscisses correspond aux différentes modalités de la variable et l’axe des ordonnées aux effectifs ou fréquences associées. Il est aussi possible de faire diagramme à barres horizontales des effectifs ou des fré- quences. Dans ce cas, c’est plutôt l’axe des ordonnée qui correspond aux différentes moda- lités de la variable et l’axe des abscisses aux effectifs ou fréquences associées. Exemple 7.11 La figure 7.4 donne les diagrammes à barres verticales des effectifs et à barres horizontales des fréquences associés au tableau 6.1. Maritime Plateaux Centrale Kara Savanes 0 50 00 00 15 00 00 0 25 00 00 0 (a) Diagramme à barres verticales (effectifs) M ar iti m e P la te au x C en tr al e K ar a S av an es 0.0 0.1 0.2 0.3 0.4 0.5 (b) Diagramme à barres horizontales (fré- quences) FIGURE 7.4 – Diagrammes à barres verticales (effectifs) et à barres horizontales (fréquences) associés au tableau 6.1. 7.2.3.2 Diagramme à points Le diagramme à points est une représentation graphique associée à une variable qua- litative sur laquelle l’axe des ordonnées correspond aux différentes modalités et l’axe des abscisses aux effectifs ou fréquences associés. Exemple 7.12 Le diagramme à points associé aux données du tableau 6.1 est donné par la figure 7.5. 7.2.3.3 Diagramme circulaire Le diagramme circulaire est une représentation sous forme de cercle telle qu’à chacune des modalités est associée une portion circulaire du diagramme proportionnelle à sa fré- quence. Ainsi, les angles (compris entre 0 et 360°) correspondants à chaque portion sont I. C. G ERALDO Chapitre 7. Séries statistiques à une variable 81 Maritime Plateaux Centrale Kara Savanes 1000000 1500000 2000000 2500000 FIGURE 7.5 – Diagramme à points associé aux données du RGPH 2010. obtenus par la formule : αi = 360 × ni n = 360 × fi, i = 1, . . . , p. (7.3) Exemple 7.13 Reprenons les données du tableau 6.1 et complétons ce tableau par les angles αi. On obtient le tableau suivant : TABLE 7.7 – Angles du diagramme circulaire associé aux données du RGPH 2010. Région Maritime* Plateaux Centrale Kara Savanes fi 0.420 0.222 0.100 0.124 0.134 αi 151° 80° 36° 45° 48° Le diagramme circulaire associé est donné par la figure 7.6. 7.3 CARACTÉRISTIQUES NUMÉRIQUES D’UNE DISTRIBUTION Le tableau de données complété avec les fréquences et les représentations graphiques donne les premières informations sur le caractère et la population étudiés. Pour les carac- tères quantitatifs en particulier, il existe certaines quantités qui permettent de mieux carac- tériser la distribution statistique obtenue. Remarque 7.14 Dans toute la suite de cette section, sauf mention contraire, nous considé- rons un caractère quantitatif X étudié sur une population de taille n. Les observations seront notées x1, . . . , xn et les modalités x1, . . . , xp. 82 MTH160 : Cours et exercices (I. C. GERALDO) Maritime (42%) Plateaux (22.2%) Centrale (10%) Kara (12.4%) Savanes (13.4%) FIGURE 7.6 – Diagramme circulaire associé aux données du RGPH 2010. 7.3.1 Les caractéristiques de position Encore appelées caractéristiques de tendance centrale, elles donnent une idée de l’ordre de grandeur des valeurs constituant la série. 7.3.1.1 Mode et classe modale Définition 7.15 Soit X le caractère étudié. 1) Si X est une variable quantitative discrète ou qualitative, on appelle mode de la série statistique obtenue et on note Mo(X), l’une des modalités x1, . . . , xp dont la fréquence est maximale. 2) Si X est une quantitative continue, une classe modale, Mo(X), est une classe de densité (rapport fréquence/amplitude) maximale. Un mode est alors le centre de l’une de ces classes. Une distribution statistique est dite unimodale si elle a un seul mode et multimodale si elle en a plusieurs. I. C. G ERALDO Chapitre 7. Séries statistiques à une variable 85 • S’il existe une classe Ci = [ai−1, ai[ telle que nic = n/2 ou fic = 50%, alors me = ai ; • Sinon il existe deux classes adjacentes Ci = [ai−1, ai[ et Ci+1 = [ai, ai+1[ telles que nic < n/2 < n(i+1)c ou fic < 50% < f(i+1)c. Ainsi ai < me < ai+1 et on calcule une valeur approximative de me par interpolation linéaire. Pour faire ce calcul, on suppose que la distribution est uniforme à l’intérieur de chaque classe. L’interpolation linéaire consiste à dire que les trois points A(ai, nic), B(ai+1, n(i+1)c) et M(me, n/2) sont approximativement alignés. • • • A M B nic ai n 2 me n(i+1)c ai+1 FIGURE 7.7 – Illustration de l’interpolation linéaire pour l’approximation de la médiane En utilisant le théorème de Thalès, on obtient n 2 − nic n(i+1)c − nic = me − ai ai+1 − ai d’où me = ai + (ai+1 − ai) n 2 − nic n(i+1)c − nic . (7.7) Cette dernière formule peut être réécrite en utilisant les fréquences : me = ai + (ai+1 − ai) 1 2 − fic f(i+1)c − fic . (7.8) Remarque 7.22 Pour les distributions continues, la médiane est l’abscisse du point d’inter- section des polygones des fréquences cumulées croissantes et décroissantes. 7.3.1.5 Les quartiles Définition 7.23 Considérons une série statistique classée par ordre croissant. Les quartiles sont trois valeurs notées Q1, Q2 et Q3 qui partagent la distribution en quatre parties com- prenant exactement le même nombre d’observations. Plus précisément, le premier quartile (resp. le second quartile, resp. le troisième quartile) noté Q1 (resp. Q2, resp. Q3) est la va- leur correspondant à une fréquence cumulée croissante 25% (resp. 50%, resp. 75%) ou à l’effectif cumulé croissant n 4 (resp. n 2 , resp. 3n 4 ). 86 MTH160 : Cours et exercices (I. C. GERALDO) Remarque 7.24 En particulier, le second quartile est confondu à la médiane. ■ Cas d’une distribution discrète. Ici aussi, supposons les observations classées par ordre croissant : x(1) ⩽ x(2) ⩽ · · · ⩽ x(n−1) ⩽ x(n). On distingue deux cas : • Si n est multiple de 4, alors on peut écrire n = 4k où k est un entier naturel non nul. Le premier quartile peut être pris égal à toute valeur comprise entre x(k) et x(k+1). Il est d’usage de choisir la moyenne de ces deux valeurs comme médiane : Q1 = x(k) + x(k+1) 2 . Idem pour le troisième quartile : Q3 = x(3k) + x(3k+1) 2 . • Si n n’est pas multiple de 4, alors on note k et k′ les parties entières respectives de n/4 et 3n/4. Les premier et troisième quartiles sont définis par : Q1 = x(k+1) et Q3 = x(k′+1). Exemple 7.25 1) Considérons les dix observations suivantes : 1, 1, 1, 2, 2, 2, 2, 3, 3, 4. Le nombre 10 n’est pas multiple de 4. On a 10/4 = 2.5 et 3 × 10/4 = 7.5. On a donc Q1 = x(3) = 1 et Q3 = x(8) = 3. 2) Considérons les huit observations suivantes : 0, 0, 1, 1, 2, 3, 4, 5. Le nombre 8 est multiple de 4 et 8 4 = 2. Le premier quartile est la moyenne de la 2e et de la 3e observations soit Q1 = 0.5. On vérifie de même que Q3 = 3.5. ■ Cas d’une distribution continue. Le calcul du quartile Q1 (resp. Q3) se fait en utilisant la même méthode que celle décrite pour la médiane en prenant soin de remplacer la fréquence cumulée croissante 50% par 25% (resp. 75%) et l’effectif cumulé croissant n/2 par n/4 (resp. 3n/4). 7.3.1.6 Les quantiles Définition 7.26 Soit X une variable quantitative étudiée sur une population et soit α ∈ [0, 1]. On appelle quantile (ou fractile) d’ordre α, la valeur xα de la variable X telle que la proportion d’observations inférieures ou égales à xα soit égale à α. Les quantiles les plus usuels sont la médiane et les quartiles. La médiane est le quantile d’ordre 50%, les quartiles Q1 et Q3 sont les quantiles d’ordres respectifs 25% et 75%. I. C. G ERALDO Chapitre 7. Séries statistiques à une variable 87 7.3.2 Les caractéristiques de dispersion Les caractéristiques de dispersion informent sur la répartition des modalités du carac- tère étudié autour des caractéristiques de tendance centrale. 7.3.2.1 Variance et écart-type ■ Cas d’une distribution discrète. Définition 7.27 Lorsque l’on dispose des observations x1, . . . , xn, la variance (ou écart qua- dratique moyen) est définie par : Var(X) = 1 n n ∑ i=1 (xi − X)2. (7.9) Lorsque la série statistique est donnée sous la forme (x1, n1), . . . , (xp, np) en donnant les modalités et les effectifs correspondants, la moyenne quadratique est définie par : Var(X) = 1 n p ∑ i=1 ni(xi − X)2. (7.10) La racine carrée de la variance notée σX est appelée écart-type de X : σX = √ Var(X). (7.11) Dans la pratique, on utilise la formule suivante dite formule de König-Huygens : Théorème 7.28 (Formule de König-Huygens) On a : 1 n n ∑ i=1 (xi − X)2 = ( 1 n n ∑ i=1 x2 i ) − X2 = X2 − (X)2 (7.12) ou encore 1 n p ∑ i=1 ni(xi − X)2 = ( 1 n p ∑ i=1 nix2 i ) − X2 = X2 − (X)2. (7.13) où X2 désigne la moyenne des carrés. En d’autres termes, la variance est égale à la moyenne (arith- métique) des carrées moins le carré de la moyenne. ■ Cas d’une distribution continue. Lorsqu’on ne dispose que des classes, il n’est pas possible de trouver une valeur exacte de la variance. En supposant que les données sont uniformément distribuées à l’intérieur de chaque classe, on obtient une approximation de la variance par la formule Var(X) ≃ 1 n p ∑ i=1 ni(ci − X)2 où c1, . . . , cp sont les centres des différentes classes. 90 MTH160 : Cours et exercices (I. C. GERALDO) • Le quartile Q3 correspond à un effectif cumulé croissant de 3× 48 4 = 36. Cette valeur n’apparaît pas dans les effectifs cumulés croissants mais on voit que 34 < 36 < 38 d’où on déduit que 50 < Q3 < 55. On utilise la formule d’interpolation linéaire : Q3 = 50 + (55 − 50)× 36 − 34 38 − 34 = 52.5. I. C. G ERALDO Chapitre 7. Séries statistiques à une variable 91 7.4 EXERCICES Exercice 7.1 La répartition des élèves d’un lycée en fonction de la langue vivante étudiée est donnée par le tableau suivant : Langue Anglais Allemand Espagnol Italien Autres Total Effectifs 934 351 205 69 41 1600 1) Préciser la population étudiée, l’unité statistique, le caractère, sa nature et ses modalités. 2) Compléter le tableau avec les fréquences. 3) Représenter cette distribution par un diagramme à secteurs. 4) Préciser le mode du caractère étudié. 5) Quel est le pourcentage d’élèves qui n’étudient pas l’anglais? Exercice 7.2 Un institut de statistique a réalisé une enquête sur le nombre de salariés de 40 entreprises de Lomé-la-belle. Les résultats suivants rangés dans l’ordre croissant sont les suivants : 20 22 24 30 32 36 37 39 40 41 43 44 45 45 47 48 50 51 51 52 52 53 53 55 56 58 59 59 61 62 63 64 66 75 76 79 82 86 90 99 1) Définir la population, l’unité statistique, le caractère étudié et sa nature. 2) Etablir la distribution des entreprises selon le nombre de salariés. Pour ce faire, on définit cinq (5) classes de la forme [ai, ai+1[ d’amplitudes respectives 20, 10, 10, 20, 20. La valeur minimale est 20 et la valeur maximale est 100. On complètera le tableau obtenu en y ajoutant les fréquences et les fréquences cumulées. 3) Tracer l’histogramme des fréquences de cette distribution. 4) Calculer le mode, la médiane, la moyenne et l’écart-type du nombre de salariés. 5) Calculer à nouveau la médiane et la moyenne mais cette fois-ci en utilisant les données brutes et non les classes. Que remarquez-vous? Exercice 7.3 Le tableau suivant donne la répartition du personnel d’une société suivant le salaire mensuel en kFCFA (milliers de FCFA) : Salaire [150,160[ [160,170[ [170,180[ [180,190[ [190,200[ [200,250[ [250,300[ Effectif 5 13 15 18 14 4 5 1) Calculer la moyenne, la variance, l’écart-type, la médiane et les quartiles Q1 et Q3. 2) Déterminer le pourcentage de personnel dont le salaire est inférieur à 200 kFCFA. Exercice 7.4 Dans un laboratoire pharmaceutique, une machine automatique fabrique en grande quantité des suppositoires contenant du paracétamol. On veut contrôler la qualité de la fabrication sur une période donnée. Dans ce but, pendant le fonctionnement de la machine, on prélève de temps à autre un suppositoire dont on mesure la masse X (en mg) de paracétamol qu’il contient. Les résultats des mesures de l’échantillon prélevé sont donnés dans le tableau suivant : 92 MTH160 : Cours et exercices (I. C. GERALDO) Masse (mg) [145, 155[ [155, 165[ [165, 175[ [175, 185[ [185, 195[ Effectifs 7 30 43 16 4 Faire une étude graphique et un résumé statistique de la masse de paracétamol des suppo- sitoires fabriqués dans ce laboratoire. Exercice 7.5 On observe l’arrivée des clients à un bureau de poste pendant un intervalle de temps donné. En répétant 100 fois l’observation, on obtient les résultats suivants : Nombre d’arrivées 1 2 3 4 5 6 Effectif 15 25 26 20 7 7 Calculer la moyenne, la variance, l’écart-type, le coefficient de variation, la médiane, les quartiles Q1 et Q3 et l’intervalle inter-quartile. I. C. G ERALDO Chapitre 8. Séries statistiques à deux variables 95 et celle de Y définie par : Y y1 y2 · · · yq Total Effectif n•j n•1 n•2 · · · n•q n Exemple 8.2 On mesure sur la même parcelle de terrain le rendement Y en quintaux par hectare (q/ha) en fonction de la quantité X d’engrais répartie sur la parcelle mesurée en kg/ha. Les données sont consignées dans le tableau suivant : Quantité xi 100 200 300 400 500 600 700 Rendement yi 40 50 50 70 65 65 80 Exemple 8.3 Dans une université, on a enquêté auprès de 5375 étudiants n’ayant aucun lien de parenté entre eux, sur leurs habitudes tabagiques (variable Y) et celles de leurs parents (variable X). Les données obtenues sont consignées dans le tableau suivant : Nombre de parents fumeurs Statut de l’étudiant Fumeur Non fumeur Total Deux 400 1380 1780 Un seul 416 1823 2239 Aucun 188 1168 1356 Total 1004 4371 5375 Les distributions marginales de X et Y sont respectivement données par les tableaux Nombre de parents fumeurs Deux Un seul Aucun Total Effectif 1780 2239 1356 5375 et Statut de l’étudiant Fumeur Non fumeur Total Effectif 1004 4371 5375 8.2 CARACTÉRISTIQUES NUMÉRIQUES 8.2.1 Cas des données non groupées Les moyennes et variances des variables X et Y se calculent par les formules usuelles comme suit : X = 1 n n ∑ i=1 xi, Y = 1 n n ∑ i=1 yi Var(X) = 1 n n ∑ i=1 (xi − X)2 = 1 n n ∑ i=1 x2 i − (X)2, Var(Y) = 1 n n ∑ i=1 (yi − Y)2 = 1 n n ∑ i=1 y2 i − (Y)2, Les écarts types sont respectivement définies par σX = √ Var(X) et σY = √ Var(Y). Les valeurs caractéristiques de la liaison entre les variables X et Y sont 96 MTH160 : Cours et exercices (I. C. GERALDO) • la covariance de X et Y définie par Cov(X, Y) = 1 n n ∑ i=1 (xi − X)(yi − Y) = 1 n n ∑ i=1 xiyi − XY. • et le coefficient de corrélation linéaire entre X et Y défini par : ρXY = Cov(X, Y)√ Var(X) √ Var(Y) = Cov(X, Y) σXσY ∈ [−1, 1]. Exemple 8.2 (suite) On vérifie que X = 400, Y = 60, 1 n ∑n i=1 xiyi = 26357.143 donc Cov(X, Y) = 2357.143. De plus, Var(X) = 40000, Var(Y) = 164.2857 donc σX = 200 et σY = 12.8174. Finalement, ρXY ≃ 0.92. 8.2.2 Cas des tableaux de contingence (données groupées) Dans ce cas aussi, les moyennes, variances et écarts types des variables X et Y se cal- culent par les formules usuelles comme suit : X = 1 n p ∑ i=1 ni•xi, Y = 1 n q ∑ j=1 y•j, Var(X) = 1 n p ∑ i=1 ni•(xi − X)2 = 1 n p ∑ i=1 ni•x2 i − (X)2, Var(Y) = 1 n q ∑ j=1 n•j(yj − Y)2 = 1 n q ∑ j=1 n•jy2 j − (Y)2, σX = √ Var(X) et σY = √ Var(Y). La covariance est calculée à l’aide de la formule Cov(X, Y) = 1 n p ∑ i=1 q ∑ j=1 nij(xi − X)(yj − Y) = 1 n p ∑ i=1 q ∑ j=1 nijxiyj − XY. Remarque 8.4 Lorsque les modalités des variables X et/ou Y sont des intervalles (ou classes), les xi et/ou yj sont remplacés par les centres des classes. L’analyse descriptive d’un tableau de contingence est facilitée par le calcul de deux ta- bleaux des fréquences conditionnelles appelés profils-lignes et profils-colonnes. Définition 8.5 On appelle : • profils-lignes, le tableau obtenu en divisant chaque ligne par la somme de ladite ligne c-est-à-dire le tableau formé des fréquences nij ni• = proportion d’individus de la modalité xi ayant la modalité yj; I. C. G ERALDO Chapitre 8. Séries statistiques à deux variables 97 • profils-colonnes, le tableau obtenu en divisant chaque colonne par la somme de ladite colonne c-est-à-dire le tableau formé des fréquences nij n•j = proportion d’individus de la modalité yj ayant la modalité xi. Remarque 8.6 Dans le tableau des profils-lignes, la somme de chaque ligne vaut 1 et la somme des colonnes n’a pas de sens et doit donc être évitée. De même, dans le tableau des profils-colonnes, la somme de chaque colonne vaut 1 et la somme des lignes n’a pas de sens et doit aussi être évitée. Exemple 8.3 (suite) • Le tableau des profils-lignes arrondis à trois chiffres après la virgule est donné par : Nombre de parents fumeurs Statut de l’étudiant Fumeur Non fumeur Total Deux 0.2247 0.7753 1 Un seul 0.1858 0.8142 1 Aucun 0.1386 0.8614 1 On peut interpréter la première ligne comme suit : parmi les étudiants dont les deux parents sont fumeurs, il y en a 22.47% qui sont fumeurs et 77.53% qui sont non- fumeurs. • Le tableau des profils-colonnes arrondis à quatre chiffres après la virgule est donné par : Nombre de parents fumeurs Statut de l’étudiant Fumeur Non fumeur Deux 0.3984 0.3157 Un seul 0.4143 0.4171 Aucun 0.1873 0.2672 Total 1 1 On peut interpréter la première colonne comme suit : parmi les étudiants fumeurs, 39.84% ont les deux parents qui sont fumeurs, 41.43% ont un seul parent fumeur et 18.73% n’ont aucun parent fumeur. 8.3 REPRÉSENTATION GRAPHIQUE On représente souvent un tableau de données brutes (ou non groupées) par un nuage de points dans un repère orthogonal du plan. Dand le cas d’un tableau de contingence, il est plus utile de représenter les profils-lignes et/ou profils-colonnes par un diagramme à barres juxtaposées.
Docsity logo



Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved