[SON] Bonjour. Dans cette séance 6, du cours 1, nous allons voir une nouvelle notion absolument fondamentale de probabilité qui est liée à ce qu'on appelle le conditionnement. Cette notion, comme on va le voir, est vraiment une notion qui démarque la théorie des probabilités, de la théorie des mesures ou de l'intégration, et qui va vraiment donner ses lettres de noblesse au modèle probabiliste. L'idée est la suivante, c'est, en fait, que quand on construit un modèle probabiliste, on a une certaine information a priori sur le modèle, et on souhaiterait prendre en compte, dans le modèle, cette information. Alors, voyons déjà sur un exemple, un petit peu l'intuition de ce qu'on veut faire. Imaginez qu'on lance 2 dés, et qu'on s'intéresse à la probabilité d'obtenir 2 fois un 6. Donc, si on a pas d'information supplémentaire, on suppose que les dés ne sont pas truqués, et dans ce cas, eh bien, on sait que le nombre de résultats possibles de l'expérience, c'est l'ensemble de tous les couples de résultats i, j, pour i variant entre 1 et 6, et j variant entre 1 et 6. Si on suppose donc que les dés ne sont pas truqués, on a un modèle avec probabilité uniforme, et on a autant de chance d'avoir un de ces quelconques résultats, il y a 36 possibilités, donc la probabilité d'avoir 2 fois un 6, c'est-à -dire d'avoir le couple 6, 6, c'est la probabilité d'un singleton, pour une probabilité uniforme, sur un espace à 36 éléments, donc, la probabilité de 6, 6, c'est 1 sur 36. Donc, maintenant supposons qu'on ait une information supplémentaire, et que cette information, ça soit par exemple, qu'il y a au moins un 6. Donc, vous voyez que maintenant en fait, si on s'est donné cette information a priori, on va considérer un nouveau modèle, puisque chaque résultat que l'on va obtenir pour les dés, chaque résultat possible de l'expérience va contenir un 6. Donc, on aura soit 6, 6, soit un couple de la forme 6, i, soit un couple de la forme i, 6, où i est compris entre 1 et 5, si je note comme première coordonnée du couple le résultat du premier dé, et comme deuxième coordonnée du couple le résultat du deuxième dé. Dans ce cas, j'ai donc 11 possibilités et si là encore, je suppose que les dés ne sont pas truqués, la probabilité du singleton 6, 6, ça va être un onzième, différent donc de cette probabilité-là . La différence, c'est qu'on a pris en compte cette information a priori que l'on avait sur le modèle. Autre exemple, on suppose maintenant que le résultat du premier dé est un 6. Dans ce cas, l'ensemble de tous les résultats possibles de l'expérience, ça va être l'ensemble des couples 6, i, où i est compris entre 1 et 6. Maintenant, vous voyez qu'il y a seulement 6 événements dans ce nouvel espace d'état Oméga barre, et la probabilité du singleton 6, 6, dans ce cas-là est égale à 1/6. Donc, vous voyez que la morale de cet exemple, c'est qu'une information qu'on se donne a priori sur le modèle va changer le modèle et en particulier, changer les probabilités d'un même événement sur le modèle. Donc, vous avez un espace d'état et une probabilité sur cet espace d'état, eh bien, vous voyez qu'à chaque fois, on a changé et l'espace d'état, et la probabilité, puisque la probabilité du même événement est différente dans chacune des 3 expériences. Donc, on va essayer de modéliser ça, et de savoir comment on peut représenter, comment on peut intégrer mathématiquement une information donnée a priori sur le modèle. Alors, on va revenir, là , à la notion de fréquence empirique, par lequel on a construit toutes nos intuitions pour construire le modèle probabiliste, et on va supposer, donc, qu'on réalise une expérience, on a vu que la probabilité pouvait être intuitée comme limite d'une répétition infinie de cette même expérience dans des conditions identiques. Et on va supposer que l'information a priori qu'on se donne sur le modèle, est modélisée par le fait qu'un certain événement aléatoire B est réalisé. Dans les axiomes précédents, dans le deuxième cas ici, l'événement qu'on supposait réaliser a priori, c'était il y a au moins un 6, dans le troisième exemple, l'événement supposé vrai a priori, c'est le résultat du premier dé est un 6. Donc, supposons, donc, de manière générale, qu'un événement B est réalisé et on cherche à savoir, ayant a priori cette information, quelle est la fréquence empirique de réalisation d'un événement A, et ce, tout d'abord, sur n expériences aléatoires successives. Donc, nous avons vu que, dans ce cas-là , la fréquence empirique, eh bien, c'était le nombre de réalisation de l'événement qui nous intéresse A, sur le nombre de réalisation possible, mais possible sachant que B est réalisé. Donc, en fait, on va chercher le nombre de réalisations d'avoir A et B réalisés, c'est-à -dire le nombre de réalisation de l'évènement A inter B, sur le nombre de réalisation où B est réalisé, c'est ce qu'on avait noté, n indice B dans une des séances précédentes. Donc, cette fréquence empirique relativement à l'information que B est réalisé, vous voyez, peut encore s'écrire n de A inter B sur n, mon nombre d'expériences fois n sur n B, c'est-à -dire la fréquence empirique de A inter B divisée par la fréquence empirique de B. Alors, si maintenant on fait tendre le nombre d'expériences n vers l'infini, je vous rappelle que c'est comme ça, qu'on a construit intuitivement la notion de probabilité, eh bien, on peut intuiter que ce quotient, bien évidemment, ce quotient est défini si la fréquence de réalisation de B est strictement positive pour chaque n, mais si on suppose a priori que B est réalisé, c'est ça que ça dit, eh bien, cette quantité-là va tendre vers la probabilité de A inter B, divisée par P de B. Donc, c'est cette quantité qu'on va définir de manière systématique maintenant. Donc, ce qu'on va appeler probabilité conditionnelle de A sachant B, ça va être la probabilité donc, on peut donner a priori de l'événement A, mais en modélisant le fait que l'événement B est réalisé et intégré dans ce modèle. Donc, on considère 2 événements aléatoires, A et B, et on suppose que la probabilité de B est strictement positive, pour que cette information, effectivement, ait un sens. Donc, on va définir la probabilité conditionnelle de A sachant B, comme le nombre P, donc on note de A, un trait vertical qui veut dire sachant, B, qui va être égal à la probabilité de A inter B sur la probabilité de B. Donc, vous voyez que c'est exactement ce qu'on a dit ce nombre-là , on l'obtient comme limite a priori de ces quantités-là . Donc, on appelle ça une probabilité conditionnelle donc, la première chose à remarquer, c'est que c'est bien une probabilité. Alors, on va le faire tout de suite, donc, qu'est ce qu'il faut montrer, on a P de A sachant B qui est défini comme étant égale à P de A inter B, sur P de B, Donc, première chose P de A inter B, est inférieur ou égal à P de B, car A inter B est inclus dans B donc, ce nombre P de A sachant B est plus petit que 1 et par ailleurs, c'est un quotient de nombre positive, donc il est positif. Donc, pour tout événement A, la probabilité de A conditionnellement à B, est compris entre 0 et 1. Deuxième chose, si je regarde maintenant la probabilité de Oméga sachant B, c'est par définition la probabilité de Oméga inter B, sur P de B, où Oméga est l'espace d'état tout entier, Oméga inter B, c'est B, donc ceci vaut P de B sur P de B, c'est-à -dire 1. Troisième, donc la probabilité de l'espace d'état tout entier, la probabilité conditionnelle sachant B, de l'espace d'état tout entier vaut 1. Bien. Troisième axiome à vérifier pour être sûr que cette probabilité conditionnelle est bien une probabilité. On prend une suite d'événements aléatoires [AUDIO_VIDE] disjoints 2 à 2, et on veut montrer la probabilité de sigma additivité. Donc, on veut calculer la probabilité de l'union sur n de An sachant B. Ça, c'est égal par définition à la probabilité de l'union sur n de An, le tout inter B, divisé par probabilité de B. Or, soit vous savez, soit vous l'avez vu dans la séance de rappel sur la théorie des ensembles, que l'intersection est distributive par rapport à la réunion, et ça, ça s'écrit encore comme la probabilité de la réunion sur n des An inter B sur P de B. Mais, nous savons que les événements aléatoires An sont 2 à 2 disjoints, donc ça va entraîner que les événements aléatoires An inter B qui sont ici, sont 2 à 2 disjoints, et donc nous allons pouvoir appliquer la propriété de Sigma additivité pour la probabilité P. Pour le numérateur ici de notre quantité. Et donc finalement nous allons pouvoir écrire que la probabilité de l'union sur n de An sachant B c'est égal à la somme sur n des probabilités de An inter B, propriété de Sigma additivité de la probabilité P divisé par P de B, et ça je peux encore l'écrire comme somme sur n des probabilités de An sachant B. donc on a montré la propriété de Sigma additivité pour cette probabilité dite conditionnelle sachant B. Donc ces 3 axiomes, nous avons montré les 3 axiomes qui prouvent que donc l'application qui est définie sur la tribu A ronde et qui à un évènement aléatoire A associe la probabilité de A sachant B donc est une probabilité. Et ce, donc, quel que soit l'évènement aléatoire grand B fixé tel que la probabilité de B soit strictement positive. bien. Alors nous avons voir 2 petits exemples ludiques de calcul de probabilité conditionnelle qui est donc très proche de l'exemple que nous avons vu sur les dés, donc il y a 2 questions dans cet exemple, Madame X a 2 enfants et l'ainée est une fille, quelle est la probabilité que les 2 enfants soient des filles? Et deuxième exemple, Madame Y a au moins une fille quel est la probabilité que ces 2 enfants soient des filles? Donc regardons déjà la première question, alors on étudie la probabilité que 2 enfants dans une famille soient des filles, donc on regarde quel va être l'espace d'état pour cet exercice-là . Bon je vais noter par grand F l'élément fille et par grand G l'élément garçon. Donc Oméga va avoir 4 éléments, soit on a 2 filles, tous les résultats possibles, donc l'espace d'état, soit on a fille garçon, soit garçon fille, soit garçon garçon. alors on regarde dans les 2 questions de l'exercice la probabilité que les 2 enfants soient des filles, donc on regarde la probabilité du singleton fille fille. Alors dans la première question, on va en fait conditionner par l'information l'évènement aléatoire B c'est l'ainée est une fille. Donc en fait c'est l'ensemble F, G ou F, F alors si on suppose qu'on a une proba un demi un demi d'avoir fille garçon, donc je vais appeler grand A ici le singleton F, F, eh bien vous voyez que la probabilité d'avoir 2 filles sachant que l'ainée est une fille, donc par définition c'est P de A inter B sur P de B, c'est donc égal, alors la probabilité de A inter B, eh bien, c'est la probabilité de A, donc c'est la probabilité du singleton fille, fille a 4 valeurs dans l'espace d'état Oméga, C'est une probabilité uniforme donc on va avoir 1 sur 4, divisé par la probabilité de l'évènement aléatoire B qui a 2 éléments donc qui vaut un demi et donc finalement on va trouver un demi. alors maintenant deuxième exemple donc on se donne une autre information a priori, que je vais modéliser par grand C, l'évènement aléatoire grand C, qui est que il y a au moins une fille. [AUDIO_VIDE] Donc dans ce cas-là cet ensemble-là se compose de soit fille fille soit fille garçon soit garçon fille et vous voyez que dans ce cas-là la probabilité de C elle vaut 3 quarts. Donc la probabilité de A sachant C, c'est P de A inter C sur probabilité de C, c'est donc égal, alors A inter C eh bien c'est A, la probabilité du singleton c'est toujours un quart divisé par la probabilité de C 3 quarts et donc finalement on trouve un tiers. donc retenez vraiment ça une information donnée a priori sur le modèle probabiliste change ce modèle et change le calcul de probabilité.