Home           Nous écrire           Liens Utiles           Votre Opinion            Fin de Page
 

                LES DISTRIBUTIONS  THEORIQUES  DE  PROBABILITE

                                                                               
        Amor BELHEDI, FSHS, Université de Tunis


Notions de base de la Probabilité   Variables aléatoire et distribution de probabilité    Lois de Distributions Discrètes    Lois de Distributions Continues      Loi Normale   Loi binomiale  Loi de Student   Loi de Fisher   Loi polynomiale  Loi Uniforme   Loi Géométrique  Loi Hypergéométrique  Loi de Poisson   Loi Exponentielle  Loi de Pascal  Loi Hyperexponentielle  Lois Logarithmiques  Loi Log-Normale


Introduction  Présenter & Décrire une variable  Réduire & Résumer une distribution  Notions et Distributions de Probabilités   Corrélation & Régression linéaire simple  Corrélation & Régression simples courbes  Test de Khi-deux   Corrélation dans un tableau  Chroniques & Distributions temporelles   Corrélation & Régression multiples   Droites des Moindres Rectangles   Analyse Factorielle   Classification & Typologie  Tests des hypothèses  Sondages & Distributions d'échantillonnage  Quelques Eléments de calcul matriciel  Tables Statistiques   Papiers Fonctionnels   Bibliographie Sommaire

  

 

            La probabilité joue un rôle de plus en plus important dans l'analyse de l'information  et permet de tenir compte de l'incertain et de l'aléatoire qui constituent un facteur non négligeable dans la réalité notamment dans les domaines notre connaissance se trouve limitée ou incomplète.

            Plusieurs modèles d'analyse adoptent, de plus en plus, des fondements probabilistes pour tenir compte de la réalité où on a souvent une partie plus ou moins importante qui reste toujours inconnue ou mal connue. La probabilité permet en outre, de pocéder aux tests statistiques de diverses hypothèses de travail et à l'inférence statistique pour voir si une distribution suit telle ou telle loi Cf. Chap 13). La connaissance de la loi de distribution du phénomène etudié nous permet aussi de pouvoir bien choisir un échantillon, définir la taille adéquate et estimer les paramètres de la population globale et de là généraliser les résultats obtenus sur un échantillon (Cf. Chap 12). Cette inférence statistique suppose la connaissance des principales lois de distributions théoriques de probabilité.

            On examinera d'abord la notion de probabilité pour passer en revue par la suite les principales distributions théoriques de probabilité.

 

I - LA PROBABILITE

 

            La probabilité s'appuie sur la notion de fréquence et de possibilité de réalisation pour un nombre n défini. Ces valeurs probables suivent une certaine distribution et se trouvent définies par les valeurs des paramètres comme la moyenne ou la variance.

 

1 - La notion de probabilité

 

            Le domaine du probable représente la clef du futur et de la prévisibilité des faits, sa connaissance permet de réduire le champ de notre ignorance sans être pour autant certains tout en étant capable de mesurer cette incertitude. Ces probabilités suivent différents modèles théoriques selon les phénomènes étudiés qu'on appelle lois de distribution qui se trouvent définies par la valeur de certains paramètres caractéristiques.

 

a- Le concept de probabilité

 

            La probabilité est le rapport entre le nombre de  cas favorables (n) et le nombre total de cas possibles (N). La probabilité est le rapport de possibilité : p = n/N.

            La probabilité représente la contrepartie conceptuelle (théorique) de la fréquence relative qui n'est que le rapport entre le nombre de cas remplissant une condition donnée et le nombre total: ni' = ni/n. La probabilité constitue la limite de la fréquence relative lorsque n tend vers l'infini: P = lim (ni/n) lorsque n tend vers l'infini. C'est une définition  fréquentielle qui se base sur la loi des grands nombres, elle est plus complète que la première définition qui reste partielle (probabilités égales, infinité de cas probables...).

 

Exemple: Quelle est la probabilité d'être originaire d'une commune? Cette probabilité est égale à la fréquence relative réelle de la population communale: 0,64. Dans un échantillon, la valeur oscille autour de ce seuil et y converge lorsque la taille de cet échantillon tend vers l'infini, c'est à dire ici la population réelle de la Tunisie.

                Quelle est la probabilité d'être né un dimande et au cours de janvier? La probabilité d'être né un dimanche est de 1/7, celle d'être né en janvier est de 31/365 = 0.0849  ou  8.493%.

                Dans un jeu de 40 cartes, quelle est la probabilité d'avoir un roi?, un trêfle?  P(Roi) = 4/40 = 0.1, P(Trêfle) = 10/40 = 0.25.

 

            La probabilité d'un phénomène varie de zéro (phénomène impossible) à l'unité (phénomène certain): 0 <= p =>1. La somme des probabilités est égale à l'unité (1): Spi = 1. L'événement contraire de (A) est son complément à l'unité (1 - A): P(A) = p = n/N, P(A) = 1-P(A) = 1 - p = 1 - n/N.

 

Exemple: Dans une ville de 10000 hab, 2500 habitent le centre-ville et 1500 dans la zone résidentielle aisée, quelle est la probabilité de résider en périphérie et dans les autres zones résidentielles?. La probabilité de rsider au centre étant de 0.25 (2500/10000), celle d'habiter en périphérie est de 1 - 0.25 = 0.75.

 

b- Probabilités totales et composées

 

Probabilités totales: Théorème de l'addition, A ou B

            La probabilité que l'un ou plusieurs événements indépendants et s'excluant mutuellement ait lieu est la somme de leurs probabilités séparées:  P(A ou B) = P(a) + P(B).

 

Probabilités composées: Théorème de la multiplication, A et B

            La probabilité de l'arrivée combinée des événements A et B est égale au produit de la probabilité de l'un par la probabilité conditionnelle de l'autre: P(A et B) = P(A).P(B/A) = P(B).P(A/B).

            Si les événements sont indépendants, la probabilité combinée est le produit de leurs probabilité : P(A et B) = P(A). P(B).

 

Exemple: Reprenant le même exemple, quelle est la probabilité de résider au centre-ville ou dans la zone aisée?. C'est une probabilité totale qui correspond à la somme des deux probabilités P(c ou za) = Pc + Pza = 1500/10000 + 2500+10000 = 0.15 + 0.25 = 0.4

                Dans le centre-ville, on compte 3000 emplois recensés pour un emploi total de 4000. Quelle est la probabilité de résider et travailler au centre?. La probabilité de résider au centre est de 2500/1000 = 0.25, celle d'y travailler est de 3000/4000 = 0.75, donc la probabilité de résider et de travailler au centre-ville est de 0.25  x 0.75 = 0.1875, soit 18.75%.

 

Exemple: Quelle est la probabilité d'avoir deux faces dans un jet indépendant de deux pièces?  La probabilité combinée de deux événements indépendants est le produit des deux probabilités: 0.5x0.2 = 0.25

Quelle est la probabilité d'avoir un roi coeur dans un jeu de 40 cartes?. P(roi) = 4/40 = 0.1, P(coeur) = 10/40 = 0.25, P(roi coeur) = (4/40).(10/40) = 1/40 = 0.025.

 

 

 

 

c- La probabilité conditionnelle

 

             La probabilité conditionnelle de A est la probabilité d'obtenir A lorsque B est déjà produit, c'est la probabilité liée (de cause). C'est la probabilité de l'événement A sachant que B est déjà réalisé (B est la condition). Elle est égale à: P(A/B) = P(A et B)/P(B) et P(B/A) = P(A et B)/P(A), avec P(B) et P(A) différents de zéro.

Si PA = n1/n et PB = n2/n, on a: PA et B = n3/n = (n1/n).(n3/n1)

                                                   PA et B =                 PA . PB/A

            Deux événements indépendants sont des événements dont la réalisation de l'un ne modifie pas celle de l'autre: P(B) = P(B/A)  d'où P(A et B) = P(A). P(B).

 

Exemple: Sur les 3000 emplois recensés dans le centre, on relève 1000 qui y habitent. Quelle est la probabilité de résider et de travailler au centre-ville?. La probabilité de travailler au centre est de 3000/4000 = 0.75, celle d'y résider est de 1000/3000= 0.333, la probabilité de travailler et de résider au centre est une probabilité composée, elle est égale au produit de la probabilité de travailler au centre par la probabilité conditionnelle d'y résider lorsqu'on y travaille déjà, elle est donc de: 0.75x0.333 = 0.25, soit 25%.

 

Exemple: Dans une urne contenant 2 boules rouges et 3 noires, Quelle est la probabilité d'avoir une boule noire lorsque une boule rouge a été déjà tirée?. La probabilité d'avoire une boule rouge est:  Pr = 2/5, La probabilité d'avoir une boule rouge lorsque une boule a été tirée: Pn/r = 8/4 = 0.75, La probabilité d'avoir une boule rouge et une boule noire est: p (r & n) = 2/5 x 9/4 = 6/20 = 0.3

 

Exemple: Quelle est la probabilité de tirer deux as dans un jeu de 40 cartes?. La probabilité de tirer un premier as est: P(As1) = 4/40, la probabilité d'avoir le 2 as est P(As2) = 3/39. D'où P(As1 et As2) = 3/(40.39) = 0.00769.

 

            On peut formuler le cas général des probabilités totales et composées comme suit:

P(A ou B) = P(A) + P(B) - P(A et B), d'où on a: P(A) + P(B) = P(A et B) + P(A ou B)

P(A et  B et C et D...) = P(A).P(B/A).P(C/AB).P(D/ABC)...

P(Ai ou Aj ou Ak ) = S P(Ai) - SP(Ai et Aj)

 

2 - Variable aléatoire et distribution de probabilité

 

a- La variable aléatoire

 

            Une variable aléatoire est une variable x qui peut prendre des valeurs données avec une probabilité déterminée. Elle peut être discrète (valeur distincte p(X= x), xi---pi) ou continue (probabilité d'un intervalle (Dx , p(x) = f(x)). On noX: la variable aléatoire et xi les valeurs possibles de cette variable.

 

Exemple: on jette une pièce de monnaie dans l'air, quelles sont les valeurs obtenues et leur  probabilité?. Il y a deux valeurs possibles distinctes: pile (p) et face (f). En jetant une fois, on peut obtenir p ou f avec une probabailité de 1/2 pour chacun puisque p = ni/n (lorsque n est grand): p, f, f, f, p, f, p, p... C'est  la probabilité de l'alternative ou de Bernouli (Cf. infra).

 

b- La distribution de probabilité

 

            La distribution de probabilité est la distribution des valeurs (xi)  de la variable aléatoire X et de leurs probabilités (pi ou fx). En désignant par f(xi) la probabilité que la variable aléatoire X prenne pour valeur xi, on ecrit alors: f(xi) = P(X = xi).

            La représentation graphique se fait par  un histogramme ou par une courbe de densité de probabilité (ddp) selon que la variable aléatoire est discrète ou continue. Les probabilités cumulées sont représentées par une courbe cumulative donnant la probabilité à gauche de xi :  P(x <= xi), c'est la fonction de répartition F(x) dont la valeur en chaque x est la somme des proabibilités relatives aux valeturs de X inférieures ou égales à x.

            On a alors: (0 <=  Fx  <= 1) et Spi = 1 et F(x) = P(X <= xi) = Spi     pour une variable. discrète. La probabilité que l'événement X prend ses valeurs dans un intervalle [a, b] est égale à : F(b) - F(a).

            Pour une variable aléatoire continue, la densité de probabilité  au point x est la dérivée de F(x): F'(x) = f(x). La probabilité  (x < X < x + dx) = f(x)dx. La probabilité d'un intervalle [a, b] est: P(a < X < b) = yab f(x)dx = F(b) - F(a) avec f(x)dx: la probabilité de l'intervalle (x, x+dx), F(x) = P(X<x) est la probabilité de l'intervalle ]- infini, x]. F est la primitive de f donc F'(x) = f(x). On a donc: F(x) = P(X<= xi) = Sp(x) = ypx.dx                 

 

 

 

pi = f(x)                                                 y = p(x)

P(X = xi) = pi                                        P (x < X < x + dx) = px

Variable discrète                           Variable continue

 

3 - Les paramètres d'une distribution

 

            La distribution théorique ou loi de probabilité dispose des mêmes paramètres statistiques de position, de dispersion ou de symétrie (Cf. Chap 2).  On se limitera ici et sauf indication contraire aux paramètres les plus utilisés: la moyenne appelée espérance mathématique et la variance.

 

a- L'espérance mathématique

 

            L'espérance mathématique est la moyenne arithmétique de la distribution de probabilité. C'est la somme des valeurs pondérées par leurs probabilités respectives: E(x) = Spi.xi  et E(x) = f x.px.dx  selon que la distribution est discrète ou continue.

Si pi = ni/n, on a E(x) = Sni.xi/n  et on retrouve la moyenne de la série classée (Cf. Chap 2).

 

b- La variance

 

            La variance est le moment d'ordre 2. On peut l'écrire comme suit: Vx = E(X - Ex)2. Elle est égale à l'espérance mathématique des carrés moins le carré de l'espérance: Vx = E(X)2 - E2(x).

Variable discrète: Vx = S(xi - Ex)2.pi =Spi.xi2 - | Ex |2

Variable continue:  Vx =  f |x - Ex |2 .px.dx = x2.px.dx - | Ex |2

 

Exemple: Dans 14 jets d'une pièce de monnaie on a obtenu les résultats suivants pour la face: 0, 1, 0, 0, 0, 1, 0,1, 0, 1, 0, 1, 1, 1. Quelle est l'espérance mathématique et la variance?.  E(x) = (1.7 + 0.7)/14 = 7/14 = 0.5. La variance est de: (7.12)/14 - 0.52 = 0.25.

c- La loi de probabilité

 

            Une loi de probabilité est une distribution définie par trois paramètres: 1 - un processus aléatoire d'épreuve, 2 - les résultats incompatibles deux à deux, 3 - les probabilités correspondantes: pi = Prob(xi).

 

Exemple: C'est le cas de la loi binomiale (Cf. infra) qui exprime les résultats d'un jet répétitif d'une pièce de monnaie. Le processus aléatoire d'épeuve est le jet de la pièce, les résultats incompatibles deux à deux sont pile et face, les probabilités correspondantes sont 0, 1. La loi binomiale se trouve formulée par le développement du binôme  (p + q)n : b (n, p) = Cxn  px. qn-x  avec les paramètres: Ex = np et Vx = npq.

Exemple: On jette indépendamment deux pièces. Quelle est la probabilité d'avoir 0, 1 et 2 faces?. Quelle sont l'espérance mathématique et la variance?

 

x

0

1

2

Total

 

P(x = 0) = 0.25

 

E(x) = 1

 

Pi

0.25

0.5

0.25

1

 

P(x <=1) = 0.75

 

V(x) = 0.5

 

SPi

0.25

0.75

1

 

 

 

 

sx = 0.7071

 

 

Exemple: Une population composée de trois catégories x, y et z, on veut tirer trois personnes différentes, quelle est la probabilité?. Le nombre de cas possibles est: N= (x + y + z)(x + y + z -1)/2, le nombre de triplets différents: xyz. La probabilité est alors: P = 2xyz/((x + y + z)(x + y + z - 1)

 

d- L'inégalité de Bienaymé Tchebycheff (ou Techebychev)

 

            La  probabilité qu'une valeur xi, d'une variable aléatoire x, soit située dans l'intervalle centré sur Ex et de demi-intervalle ts, est toujours supérieure à (1 -1/t2) ou inférieure à 1/t2. Autrement, la probabilité qu'une valeur xi s'éloigne de sa moyenne (Ex) de plus de (ts) est toujours inférieure ou égale à 1/t2 avec Ex: Espérance ou moyenne, s: écart type, t: 1, 2, ..n

P ((Ex - ts) < x < (m + ts )) < 1 - 1/t2                                                    

                                                           P. Externe                       Probabilité Interne              P. Externe

P( (x - Ex ) < ts)) >  1 -1/t2           ______________i_____________!_____________i_______________

                                                                                -t                       Ex                     t

P( (x - Ex  )=> ts) <=  1/t2                    P<1/2t2   P>1-1/t2              P<1/t2             P<1/2t2

 

            Cette inégalité est très utilisée dans les tests statistiques, elle permet de procéder à l'estimation à un seuil précis d'erreur ou d'écart par rapport à la valeur estimée et de pouvoir fixer la taille d'un échantillon (Cf. Chap 12 et 13)..

 

Exemple: Sur un échantillon, on a relevé une moyenne de 10 et un écart type de 5. Quelle est la probabilité que la valeur observée s'écarte de sa moyenne de 3 fois ou plus l'écart-type? En utilisant l'inégalité de Tchebycheff, on obtient: P( (x -Ex) => ts) <=  1/t2 on a: P(x - 10) >= 3.5) <= 1/9 = 0.111 ou 11.1%. La probabilité pour qu'une valeur soit située dan l'intervalle 3s est : P( (x - Ex) < ts) >  1/t2 = 1 - 1/32 = 0.8888, soit 88.88%.

 

4 - Les types de lois distribution

 

            Les lois de proababilité représentent des modèles théoriques de distributions qui nous permettent de mieux comprendre les faits observés et de pouvoir les analyser. On peut distinguer deux types de distributions selon la nature de la variable aléatoie considérée: les distributions discrètes et les distributions continues.

 

 

 

I1 - LES DISTRIBUTIONS DISCRETES

 

            On a plusieurs lois de distribution de probabilités de variables discrètes qui prennent des valeurs distinctes: la loi binomiale, la loi de poisson, géométrique, binomiale négative.

 

1 - La loi binomiale

 

            La loi de distribution d'une alternative[1] (x = 0 ou 1) suit la loi de Bernoulli qui  s'écrit comme suit : b = P(X = x) = px (1-p)1-x  avec Ex = p et Vx = p(1 - p), p: probabilité.

            La loi Binomiale est la loi de distribution d'une alternative répétée.  C'est la probabilité Px qu'un événement arrive x fois lorsque l'épreuve se répète n fois, pq  => 0, p + q = 1

            C'est le cas d'un jet de dé ou d'une pièce de monnaie.  Si on pose:  0 <= p <=1,  p + q = 1, p, q >= 0, avec p: pile, 1-p=q=face, n: nombre de jets, on a le résultat suivant:

Un seul jet:  (p + q)1 = p, q. On a seulement deux posibilités: pile ou face.

Deux jets: (p+q)2 = pp, pq, qp, qq: on a quatre possibilités: 2piles, 2faces, pile+face, face+pile

Trois jets : (p + q)3 = ppp, ppq, pqp, qpp,...

 

            On peut continuer le processus et généraliser le résultat, ce qui nous donne le terme général du binôme (p + q)n P(X = x) =  b (n, p) = Cxn  px. qn-x   avec les paramètres:

Ex = np et Vx = npq.   np-q < Mo <np+p                        Vx/Ex = (1-p) = q

E(Fn) = p                    Ex/Vx = 1 -p                               y1 = (1-2p)/(np(1-p))1/2 = (q-p)/(npq)1/2

V(fn) = pq/n                Px+1   = Px. P(n - x)/ Q(x +1)     y2 =3 + (1- 6p(1-p))/np(1-p)

 

            La loi binomiale dépend de deux paramètres: n et p qui peuvent être déterminées à partir de la moyenne et de la variance.

            Lorsque p tend vers 0.5 et n vers l'infini, y1 tend vers 0, y2 vers 3 et la courbe devient symétrique et normale (p < 0.5: dissymétrie gauche, p > 0.5 dissymétrie droite) qu'on peut approcher facilement par la loi normale, une loi très utilisée en statistique (Cf. infra).

            Lorsque deux variables indépendantes b(n1, p) et b(n2, p)  suivent la loi binomiale, leur somme suit aussi une loi binomiale de paramètres: b( n1 + n2, p) ,( Ex1 + Ex2,),  (s2x1 +s2x2).

 

Distribution binomiale selon la valeur de p

 

Aplications

            La loi binomiale a plusieurs applications dont on peut citer les principales:

- Le tirage d'un échantillon avec remise (TAR) ou tirage non exhaustif (TNE). Lorsqu'on procède à un tirage avec remise, les unités n'ont pas la même probabilité d'être choisies et certaines strates ou unités ont plus de probabilité d'être enquêtés pour une raison quelconque, comme dans une urne où on remet chaque fois la boule après avoir été tirée, on utilise la loi binomiale.

- La loi binomiale s'applique lorsqu'on a une succession d'épreuves (n) indépendantes et identiques dont chacune peut donner un résultat alternatif p et q = 1 - p. Elle permet d'obtenir la probabilité d'obtenir k réalisations d'un événement au cours de n épreuves indépendantes.

- Les phénomènes dispersés en tâche ou concentrés en tâches (probabilité élevée) peuvent être ajustés par la loi binomiale. C'est le cas de l'habitat rural par exemple, du microclimat qui favorise une certaine vie localisée...

 

Exemple: Dans une urne, il y a p boules blanches et q boules noires, sur n tirages avec remise quelle est la probabilité d'avoir k boules blanches? Application pour n = 5 et k = 3. Pour n = 5 et k = 3 on :  Il s'agit ici de la loi binomiale: b = C35 p3q5-3. La loi peut être généralisée : b = Cknpkqn-k.

Exemple: On lance une pièce 5 fois, quelle est la probabilité d'avoir 3 faces? On a p = 0.5 et x ou k =3,  d'où b(5, 3) = C35pkqn-k. = b = C35 0.530.55-3 = 5/16 = 0.41

Exemple: Dans une population on a fait des tests sur des groupes de 10 et on a trouve que 80 % sont scolarisés. Quelle est la loi de distribution? Quelle est la probabilité que toute la population soit scolarisée à plus de 80%? Quelle est la probailité pour que toute la population soit scolarisée à - 80%? Quelle est la probabilité qu'au moins 8 individus soient scoalisés à plius de 80%?

Il s'agit ici d'une loi binomiale b (10, 0.8) avec Ex = 8. La probabilité pour que toute la population soit scolarisée à plus de 80% est: 10! 0.810/0!.10! = 0,11. Celle que toute la population soit scolarisé à moins de 80% est: 10!0210/10!.0! = 0.0000001. La probabilité qu'au moins 8 individus soient scolarisés à plus de 80% est: P(x => 8) = 0.68

 

Approximation

- On peut approximer la loi binomiale par la loi Normale lorsque npq >20 tout en découpant les résultats en intervalles puisqu'on transforme une variable discrète en une variable continue.

 - Lorsque np <5, on utilise la loi de Poisson pour l'approximation de la loi binomiale, c'est le cas des phénomènes très rares (Cf.infra)..

 

Exemple (à voir après analyse de la loi normale Cf. infra): Soit b (n, p) avec n = 100 et p = 0.5 quelle est la probabilité de x = 50. Approximation par la loi normale.  On a P(x = 50) = 100!/(50!.50!.2)  = 0.08. Ex = 50 et Vx = 25. En utilisant la loi normale, on  a: P(X = 50) = P(49.5 <= x <= 50.5) = P((49.5 - 50)/25  <= xi <= (50.5 - 50)/25) = P (-0.1 < x <= 0.1) = 0.08.

 

2 - La loi polynomiale

 

            Lorsque on a plusieurs catégories dans une population, on a la loi polynomiale qui est la généralisation de la loi binomiale. C'est le terme général du polynôme (a + b + c..)n. C'est la loi de distribution des probabilités d'apparition de différentes catégories: p1, p2,..pk dans une population composée de k catégories. L'épreuve donne k résultats au lieu de 2. C'est la probabilité d'avoir: P(X1= x1, X2 = x2, Xk= xk). 

            Si on pose xi = 0, 1, 2, ... n, Sxi = n,   0 <= n1 <= n , Spi = 1, ni = n1, n2...  on a :    

P(n1, n2...nk) x (p1, p2,..pk) =  n! p1x1 p2x2...pkxk / x1!.x2!...xk!

Ex = np1, np2...npr

 

            La loi polynomiale est utilisée dans le le tirage avec remise d'une population composées de plusieurs catégoriés différentes.

 

3 - La loi de Pascal ou Binomiale Négative

 

            La probabilité d'avoir x, lorsque l'épreuve se répète n fois, augmente en fonction du nombre déjà produit, d'où la tendance à la concentration. C'est la loi de distribution agrégative qui exprime bien les phénomènes de concentration.

            Si on pose: k, p >0,  0<= p <= 1,  q = 1 + p,  x = 0, 1, 2, 3,  n, on peut écrire la loi comme suit: P(X = x) = Ck+x-1x [[P/(1+p)][1/(1+p)]k

On peut l'écrire aussi sous la forme suivante: P(X = x) = Cx k+x-1 P/(1+ p)k+x

Ex = kp,  Vx = kp(1 + p) et Ex/Vx = 1+p

            La loi de Pascal exprime le nombre d'épreuves indépendantes qu'il faut réaliser pour obtenir pour la r ème fois un résultat donné:  P(X = x) = Ck-1r-1pk-rqr avec k: nombre d'épreuves, r: le nombre de réalisation de x, q =1 - p, Ex = r/p et Vx = rq/p2. C'est la généralisation de la loi Géométrique.

            C'est le développement du binôme (q - p)-k , k est d'autant faible que la concentration est forte. Avec p(k - 1) < 1, on a une distribution en i et avec p(k - 1) > 1, on a une distribution en cloche.

 

Application

            La loi binomiale négative peut bien décrire les distributions spatiales agrégatives comme la localisation industrielle ou des services ou les distributions contagieuses à probabilité non constante: c'est le cas des innovations qui sont des événements agrégatifs indépendants.

 

Approximation

            Lorsque p tend vers 0, k vers l'infini et kp vers l , on peut utiliser la loi de Poisson P(x,l) pour approximer la loi binomiale négative. C'est la succession de phénomènes accidentels dont les causes sont hétérogènes, la répartition du résultat d'une infinité de lois de Poisson dont les moyennes se distribuent selon la loi Gamma à (v-1) ddl.

 

4 - La loi Géométrique

 

            C'est la loi de probabilité d'obtenir une première réalisation à la k ième épreuve dans une suite d'épreuves équiprobables (p) et indépendantes. C'est un tirage exhaustif, sans remise (Population finie), c'est à dire que les unités ont la même probabilité d'être choisies dans un échantillon.

            Si on pose p': la probabilité de réalisation à chaque épreuve, x = 1, 2, 3...  et 0 <= p' <= 1. On a : G(p', k) = Pk = p'(1 - p')k-1      avec Ex = 1/p  et Vx = (1- p)/p2

            La loi géométrique exprime le nombre d'épreuves indépendantes qu'il faut réaliser pour obtenir pour la première fois un résultat donné. P(X = k) = q k-1p avec q = 1 - p, Ex = 1/p et Vx = q/p2.

 

 

                Distribution géométrique selon la valeur de p

 

            C'est la probabilité que le premier nuage de l'été, la première crue de l'année surviennent un jour ou un mois donné de l'année.

Exemple: Quelle la proababilité d'avoir un premier nuage au 30 juillet lorsqu'on sait que la probabilité d'avoir un jour nuajeux est de 0.3.  C'est unne loi géométrique qui s'écrit: Pk = p(1 - p)k-1.  On a dpnc: Pk = 0.3(0.7)212 = 4.344.10-34.

 

5 - Loi Hyper-Géométrique

 

            C'est la loi  de probabilité d'obtenir x individus de proportion Np possédant le caractère p dans une population N composée dans un échantillon de n éléments.

Si on pose:

N :       le nombre d'éléments dans la population 0 <= N <= 69,

Np :     le nombre d'éléments possédant un caractère, 

N-Np: le reste des éléments,

n :        le nombre d'éléments de l'échantillon,  0  <= n <= Np

x :        le nombre d'éléments du groupe Np,   0 <= x  <=  n

CnN   : le nombre d'échantillons possibles

 CxNp: le nombre de groupes de x éléments possédant le caractère p

Cn-xN-Np : le nombre de groupes de (n -x) éléments ne possédant pas la propriété p

n/N :    le taux  de sondage

On a la relation: Hg (x, N, Np, n) = (CxNp.Cn-xN-Np )/CnN

avec Ex = np, Vx = (N - n).npq/(N - 1) et Ex/?Vx = (N - 1)(1 - p)/(N - n) avec p + q = 1 et 0<= p <= 1, (N - n)/(N - 1): facteur d'exhaustivité (<= 1)

 

Application

            Dans une population où il y a une proportion p (Np individus) possédant un caractère donné, on prélève un échantillon de n individus. C'est un tirage sans remise (TSR) ou tirage exhaustif (TE): x = somme de n variables x1,....xn non indépendantes correspond au tirage successif. C'est la probabilité d'avoir le premier caractère.

 

Exemple: Un examen de n questions, chacune compte 4 réponses possibles dont une seule est bonne. Le programme comprend N questions dont on tire aléatoirement n. Un candidat ayant appris une proportion p de spn programme, quelle est la distribution de sa note?.

Il s'agit d'une loi hypergéométrique H (x, N, n, p). Un certain nombre de réponses peut être deviné par hasard parmi les (n - x) questions non revisées y = n - r. A chaque question non revisée est associée une variable de Bernouilli de paramètre 1/4: P(X = x) = pxqn-x avec Ex = p et Vx = pq. La loi de distribution de y est binomiale b (n - x, 1/4) si x est fixé. N = X + Y avec Y/X b (n  - x, 1/4), x et y ne sont pas indépendants. P(N = i) = SP(X=x).P(y = I - x/X = x)  avec E(N) = 15p + 5 et V(N) = (1- p)[(15/4)  - (Np/11)].

Exemple: un groupe de 20 étudiants élisent un délégué. Après 5 votes un candidat recueille 4 voix exprimés. Quelle est l aloi de distribution? Quels sont le sparamètres?. C'est un échantillon sans remise avec des groupes de population,, c'est une loi Hypergéométrique avec n/N = 0.2,  de moyenne Ex = 4.5/20 = 1 et de variance Xx = 4.5.15.16/20.20.19= 0.82.

 

Approximation

            Lorsque N tend vers l'infini,  ( n/N < 10%), la loi Hg (N, n, p) tend vers la distribution Binomiale b(n, p). Quand, n/N < 1/10, on a: npq > 20 et  Hg  tend vers la loi Normale N(0, 1).

 

            Si on l'étend à  plusieurs caractères (m), on obtient la loi hypergéométrique généralisée qui permet de déterminer la probabilité d'avoir n1, n2,..nm individus possédant les m caractères dans un prélèvement de n éléments:

P(X1= x1, X2 = x2,....Xk= xk) = Cx1n1 Cx2n2...Cxknk/ Cnn1+n2+...nm

avec Ex = np1, ...npr, pi = Ni/n, x1 = 0, 1, ....n , Sxi = n, Cx  ,  0 <= k  <= N   et   SNi = N

Si n tend vers l'infini, la distribution tend vers la loi Polynomiale (pi = ni/(n1 +....nm)

 

6 - La loi de Poisson

 

            Le nombre d'apparition x d'un événement rare (de faible probabilité) est une variable aléatoire qui suit la loi de Poisson. La probabilité que tel événement se produise x fois est:

P(X = x) =  e-l lx / x !  avec Ex = l, Vx = l, Ex/Vx = 1,  y1 = 1/l1/2   et  y2 = 3 + 1/l. le mode: l-1 < Mo <l

Px = lx.P0/ x !

P(x + 1)  =  Px. l/(x + 1)

            Si deux lois indépendantes P1 et P2 suivent des lois de Poisson de paramètre m1 et m2, leur somme suit la loi de Poisson de paramètre (m1 + m2).

 

                           &nbs