LES DISTRIBUTIONS
D'ECHANTILLONNAGE ET LES SONDAGES
Amor BELHEDI, FSHS, Université de Tunis
Distributions d'Echantillonnage Inégalité de Tchébicheff Concept et Fondement des Sondages Grandes Catégories de Sondages Types de Sondages Estimation Taille de l'Echantillon
Introduction Présenter & Décrire une variable Réduire & Résumer une distribution Notions et Distributions de Probabilités Corrélation & Régression linéaire simple Corrélation & Régression simples courbes Test de Khi-deux Corrélation dans un tableau Chroniques & Distributions temporelles Corrélation & Régression multiples Droites des Moindres Rectangles Analyse Factorielle Classification & Typologie Tests des hypothèses Sondages & Distributions d'échantillonnage Quelques Eléments de calcul matriciel Tables Statistiques Papiers Fonctionnels Bibliographie Sommaire
Dans un échantillon, la valeur d'un paramètre statistique quelconque comme la moyenne ou la variance tend à suivre une certaine distribution bien déterminée et converge vers la valeur réelle du paramètre correspondant dans la popultion-mère d'où on a tiré l'échantillon, c'est ce qu'on appelle distribution d'échantillonnage.
Sur cette propriété fondamentale, s'appuient les techniques de sondage pour fixer la taille minimale d'un échantillon à enquêter si on veut qu'il soit représentatif ou estimer la valeur réelle d'un paramètre de la population en fonction du résultat obtenu sur l'échantillon avec un risque d'erreur connu.
I - LES DISTRIBUTIONS D'ECHANTILLONNAGE
Les valeurs observées dans un échantillon tendent à converger vers les paramètres d'origine de la population mère avec une probabilité bien déterminée et un risque d'erreur donné (1/t2). Certains pararmètres tendent à être distribués selon une loi donnée comme la loi normale ou la loi de Student, on dit qu'ils ont une distribution asymptotiquement normale ou de Student...
1 - L'inégalité de Tchebicheff
L'inégalité de Bienaymé Tchebicheff se trouve à la base de cette règle. Elle stipule que la probabilité qu'une valeur x de l'échantillon s'écarte de la moyenne réelle observée dans la population-mère (m) de plus de (t) fois son écart type est au plus égale à 1/t2. Elle s'écrit comme suit: P (I x - m I >= ts) <= 1/t2
Si on pose e = ts/(n)1/2 on a la relation suivante : P (I x - m I >= s2/ne2
On constate dans cette inégalité que lorsque n tend vers l'infini, la différence entre les valeurs de l'échantillon et celle de la population tend vers zéro. On a P(I x -m I >= e) tend vers 0.
Cette inégalité peut être généralisée aux différents paramètres statistiques ce qui permet de mieux définir la distribution d'échantillonnage et fixer le degré de précision.
Exemple: Une population renferme 40% d'analphabètes,on observe un taux de 35% dans un échantillon. Quelle est la probabilité d'observer un tel écart dans un intervalle de deux écart-types?. On a: P | f - p | < | t(pq/n)1/2 | > 1 - 1/t2 ce qui nous donne P |0.05 | < 0.48/n1/2| > 1 - ¼ = 0.75.
2 - La moyenne
La moyenne d'un échantillon suit la loi normale ou de Student selon la nature de la population mère et la taille de l'échantillon:
- La moyenne x suit une loi normale de moyenne m et d'écart-type s/(n)1/2 lorsque la population mère est normale ou lorsque la taille de l'échantillon (n) dépasse 30.
- Elle suit une loi de Student à (n-1) degrés de liberté, de moyenne m et d'écart-type: s2/(n -1), lorsque n est inférieur à 30 ou s est inconnu .
Loi de distribution de la moyenne selon la taille de l'échantillon et la nature de la popultion-mère
|
Conditions |
Moyenne |
Variance |
Loi de Distribution |
|
|
n >= 30 Population normale |
m |
s2/n |
N (m, s/n1/2 ) |
(x - m)/s/n1/2 suit N(0, 1) |
|
n < 30 |
m |
s2/(n -1) |
Tn-1 |
(x - m)/(s/(n -1)1/2 ) suit Tn-1 |
|
s inconnu s2x= s2/n = s2/(n-1) |
m |
s2/(n -1) |
Tn-1 |
(x - m)/(s/(n -1)1/2 ) suit Tn-1 |
|
Population infinie |
m |
s(N - n)/ n(N - 1) |
|
|
s2x: Variance observée dans l'échantillon. s2: Variance de la population, s2: variance estimée de la population. N: Effectif de la population infinie.
Exemple: Une enquête sur 100 individus donne un âge moyen de 35 et un écart type de 12. Quelle est la la distribution d'échantillonnage? Puisuqe n > 30, la moyenne suit la loi Normale N(m, s/n1/2). puisque l'écart type est inconnu on procède à son estimation: s2 = ns2/(n - 1), d'où S2x = s2/n = s2/(n - 1). La moyenne suit la N(m, s/(n(n - 1)1/2), soit N(35, 0.1206). Puisque l'écart type est inconnu, la moyenne suit la loi de Student Tn-1.
Exemple: On a enquêté 10000 sur un total de 700000 ménages, on a obtenu une moyenne de 950 D/an de consommation et un écart type de 700. Quelle est la loi de distribution?. Il s'agit là d'un tirage exhaustif: n/N = 10/700 = 0.014 mais (N - n)/(n - 1) = 0.9857 ce qui est très proche de 1 et on l'assimile à un tirage indépendant. Puisque n > 30, on a x suit N(m, s/n1/2) avec Sx = 700/100 = 7, d'où on écrit: (x - m)/(s/n1/2) suit N(0, 1).
Exemple: Un comptage routier a donné 1.33 véhicule/mn. Quelle est la distribution d'échantillonnga? Il s'agit d'une loi de Poisson de paramètre m = 1.33.
2 - La variance
La variance d'un échantillon suit une loi normale de moyenne: (n-1)s2/n et d'écart-type égal à: (2(n - 1))1/2 s2 /n.
On a alors: (ns2 - (n - 1)s2)/(s2 (2(n - 1))1/2 /n) suit une loi N(0,1)
a- Cas général
Variance (s2) = (n - 1)((n - 1)U4 - (n - 3)s4)/n3
Lorsque n est élevé, la variance (s2) tend vers (U4 - s4)/n
(s2 - (n - 1)/n)/(Vs2)1/2 suit la loi normale N(0,1)
(s2 - s2)n1/2 /(U4 - s4)1/2 suit la loi normale N(0,1)
b- Relation entre les moyennes (x, m) et les variances (s2 et s2)
Le rapport entre une variable normale réduite: (x - m)/s/n1/2 et la racine carrée d'une variable c2 indépendante: (ns2/(n - 1)s2)1/2 suit une loi de Student à (n - 1) ddl. On obtient alors: (x - m)(n - 1)1/2 /s suit Tn-1:
(x - m)/s/n1/2 et (ns2/(n - 1)s2)1/2
(s2 - s2)n1/2 /(U4 - s4)1/2 suit la loi normale N(0, 1)
Dans le cas d'une distribution normale, on a : n.s2/s2 suit une loi de c2 n-1
3 - La médiane
La distribution de la médiane est asympthotiquement normale pour toute distribution connue.
La médiane Me' suit une loi Normale de moyenne Me et d'écart-type égal à (ps2/2n )1/2 en cas d'une population normale, et 1/(4n.f2(Me*) en cas d'une autre distribution avec f2(Me*): la valeur de la fréquence (densité de preobabilité ddp) de la médiane de la population. Me: Médiane de la population. Me': Médiane de l'échantillon.
On peut écrire alors dans le premier cas de la loi normale que: (Me'-Me)2n1/2/sp1/2 suit la loi N(0, 1)
Rapport entre médiane et moyenne
Lorsque n est élevé (il tend vers l'infini), le rapport entre la variance de la médiane-échantillon et la variance de la moyenne tend vers la valeur 1.57
Var Me'/Varx = ps2. n/2ns2 = p/2 = 1.57
4 - La fréquence
Dans un tirage sans remise on a la fréquence f = x/n avec une moyenne (p) et une variance: (pq/n)1/2 avec f: fréquence observée dans l'échantillon, p: la proportion dans la poulation mère, q: 1 - p. On peut écrire alors selon l'inégalité de Tchebycheff la relation suivante: P(| f - p | <= t (pq/n)1/2 | >= 1 - 1/t2
Lorsque n tend vers l'infini, la fréquence f tend vars p avec un risque d'erreur de 1/t2 et f suit la loi N(0, 1): (f - p)/(pq/n)1/2 suit N(0, 1)
5 - Les valeurs extrêmes
a- Sur la base d'une distribution polynomiale (Cf. Chap 3), on peut déterminer les probabilités suivantes:
- la probabilité que (n -1) valeurs soient < x,
- la probabilité qu'une valeur x < xi
- la probabilité qu'il n'y a pas de valeurs > x + Dx
On peut alors écrire: g(xn) = n[fxninf px.dx]n-1.f (xn)
b- Dans le cas d'une distribution uniforme, on a la relation suivante :
P(x < x <= nx + Dx) = P(n - 1, 1, 0)
= n![P(x <= x)n-1 P(x < X <= X + Dx ]/((n - 1)! 1! 0!) = nxn-1 Dx
g(xn) = fnxn-1 Dx 0
c- La plus grande valeur
La densité de probabilité (ddp) s'écrit : W(u) = a.Exp (-Exp -a(U-Mo)) - a(U - Mo)
F(x) = W(u) = Exp (-Exp -a(U-Mo))
u : Plus grande valeur, a : N(f(Mo)
Mo = Me - 0.36651/a = Me - 0.233(Q3 - Q1)
a = 1.5725 U/((Q3 - Q1) a = p/s4s1/2
Cette fonction de répartition donne les éffectifs théoriques: W(u) xn
Uo = U - 0.45005 s4
y = a(U - Mo) Mo = U - 0.45005 s4
a = p/s4s1/2
Test c2 n-1 si c2 obs > c2 a,n-1 : Ajustement retenu.
d- Le critère d'équiprobabilité
On découpe en intervalles de 0.5 = p
p = W(u) = Exp (-e -y) d'où y = -ln (-lnp)
Np = p.n = Nombre d'observations pour lesquelles la plus grande valeur U est <= u
Les points y et u sont alignés sur une droite y = a(U - Mo)
U est déterminé ppar interpolation linéaire selon la méthode des moindes carrés
y = a(U -u) + y
Exemple: Les températures maximales absolues annuelles ont été les suivantes. Ajuster les données au mèle de la plus grande valeur.
|
28 |
28.5 |
29 |
29.5 |
30 |
30.5 |
31 |
31.5 |
32 |
32.5 |
33 |
33.5 |
34 |
34.5 |
35 |
35.5 |
36 |
36.5 |
37 |
37.5 |
38 |
|
|
28.5 |
29 |
29.5 |
30 |
30.5 |
31 |
31.5 |
32 |
32.5 |
33 |
33.5 |
34 |
34.5 |
35 |
35.5 |
36 |
36.5 |
37 |
37.5 |
38 |
38.5 |
|
|
1 |
0 |
2 |
1 |
3 |
2 |
6 |
9 |
6 |
7 |
4 |
6 |
5 |
4 |
4 |
3 |
2 |
2 |
0 |
2 |
2 |
71 |
On a Q1 = 31.65, Q2 = 32.89 et Q3 = 34.66 ce qui nous donne a = 1.57254/(Q3 - Q1) = 0.522, Mo = Me - 0.3651/a = 32.19. On écrit y = a(u - Mo)= 0.522(u - 32.19) et y = 0.522u - 16.803.
On a Wu = e-0.522u + 16.803. Cette fonction de répartition donne les fréquences théoriques et en multipliant Wu par 71, on obtient les effectifs théoriques. Le test de Khi-deux est significatif.
La méthode des moments donne y = 0.583u + 18.77. La méthode des moindes carrés nous donne Wu = e-0.547u + 17.624.
6 - La corrélation
Lorsque les deux variables x et y sont normales ou n est suffisamment élevé, le coefficient de corrélation linéaire suit une loi normale de moyenne r et d'écart-type égal à (1-r2)/n1/2. On a alors: rn1/2/(1 - r2)1/2 suit N(0, 1)
Si n est faible, r suit une loi de Student de moyenne r et d'écart-type (1 - r2)/(n - 2)1/2. On a alors: r(n - 2)1/2/(1 - r2)1/2 suit Tn-2.
Dans ce cas, la transformée de Fisher (z) suit la loi Normale de moyenne: 1/2ln((1 + r)/(1 - r) et d'écart-type égal à: 1/(n - 1)1/2. Elle s'écrit ainsi: z =1/2ln((1 + r)/(1 - r).
(z. 1/2ln((1 + r)/(1 - r))(n - 3)1/2 suit N(0, 1)
r2(n - 2)1/2/(1- r2)1/2 suit Tn-2 or Tn - 2 = F(1, n -2)
r2(n - 2)/(1 - r2) suit F(1, n - 2)
Exemple: On a relevé dans un échantillon de 400 individus une corrélation de 0.8, quelle est la loi de distribution de r?. La corrélation suit la loi normale de moyenne r et d'écart type égal à: (1 - r2)/n1/2), soit r suit N(0.8, 0.018).
7 - Les coefficients de corréaltion
Lorsque x et y sont des variables normales et n est élevé le coefficient de régresion (a) suit une loi normale de moyenne (a) et d'écart-type: sy((1 - r2)/n)1/2)/sx.
Lorsque n est faible, il suit la loi de Student à (n - 2) ddl de moyenne (a) et d'écart-type: sy((1 - r2)/(n - 2))1/2)/sx.
Le coefficient b suit une loi Normale de moyenne (b) et d'écart-type: sy((1 - r2)/n)1/2.
Souvent on est amené à faire des enquêtes pour collecter les données sur le terrain. selon quelles règles collecter cette information, comment fixer la taille de l'échantillon et comment procéder à l'estimation des données à partir de l'information recueillie?. Autrement, comment généraliser les résultats obtenus dans un échantillon sur l'ensemble de l apopulation. Ces distributions d'échantillonnage sont de nature à nous permettre de fixer la taille des échantillons pour un risque d'erreur donné et l'estimation des valeurs réelles de la population, c'est à dire la généralisation des résultats obtenus sur l'échantillon.
II - CONCEPT ET FONDEMENT DES SONDAGES
Un sondage est une enquête portant sur un sous-ensemble représentatif et dont les résultats sont généralisables à l'ensemble de la population. Il signifie aussi la méthode de choisir l'échantillon. Il s'appuie sur la notion de représentativité.
1- Le concept de sondage
Le sondage est une enquête sur un échantillon représentatif de la population mère , il est défini par un taux, un plan et une base de sondage. C'est aussi le procédé qui consiste à tirer l'échantillon, on dit faire un sondage ou une enquête par sondage.
L'échantillon est un sous-ensemble représentatif d'une population, tiré selon des règles précises conformément à un plan de sondage précis donné et une base de sondage. L'échantillonnage est la méthodologie suivie pour déterminer l'échantillon: taille, base de sondage, plan de tirage...
La base de sondage est l'ensemble des critères ou variables de base servant à définir et à tirer l'échantillon. C'est aussi la liste exhaustive des unités à partir de la quelle se fait le tirage.
Le taux de sondage est le rapport entre la taille de l'échantillon (n) et celle de la population (N) t = n/N
2 - Le fondement
Le sondage trouve son fondement théorique dans la loi des grands nombres ou la loi de convergence. Lorsque la taille de l'échantillon n augmente, les valeurs observées dans l'échantillon tendent à converger vers les valeurs réelles de la population avec un certain risque déterminé. Ce risque d'erreur diminue lorsque la taille de l'échantillon augmente et tend vers zéro dans le cas d'un recensement .

Convergence de la valeur du paramètre échantillon vers la valeur réelle dans la population
Les lois de distribution d'échantillonnage permettent ainsi de fixer la taille optimale d'un échantillon pour un risque d'erreur fixé à l'avance.
3 - Les deux catégories de sondages
On peut distinguer deux grandes catégories de sondages: les sondages raisonnées et les sondages aléatoires.
a- Les sondages raisonnés
Un sondage raisonné est un sondage où les critères de choix et les unités sont raisonnablement choisis par le chercheur. Il présente la même structure que la population d'origine, l'échantillon en est la miniature. Le fondement de ce type d'échantillonnage est la représentativité structurelle qui fait qu'en enquêtant un échantillon de même structure on peut généraliser les résultats.
La base de sondage est représentée par les variables, liés au phénomène étudié, de préférence observables pour pouvoir contrôler la structure de l'échantillon. Ces variables ont la même distribution que le phénomène étudié si bien qu'elles constituent des variables de contrôle.
Le sondage raisonné est simple et constitue le seul procédé à défaut d'une liste exhaustive des unités, c'est ce qui explique son utilisation fréquente. Utilisé avec prudence, il donne des résultats acceptables: > 10% et une bonne spartiale.
Les limites découlent de l'absence de fondement théorique solide au niveau de la représentativité et l'absence de règles de choix des unités. De là, la difficulté de mesurer la précision du résultat et de la généralisation. Il suppose une connaissance préalable de la structure
.
b- Les sondages aléatoires
Le sondage aléatoire
est un sondage où le tirage se fait selon des règles précises à partir d'une
liste exhaustive appelée base de sondage, il se fonde sur la loi des
grands nombres. Les unités sont choisies aléatoirement en utilisant la Table
des Nombres au Hasard (TNH).
La TNH est une table où les chiffres ont la même probabilité
d'apparition qui se présente sous forme de 2 à 7 chiffres qu'on peut lire dans
tous les sens (vertical, horizontal, diagonal), les ordres (premiers, derniers
chiffres, chiffres alternés...) et avec un nmbre variable de chiffres (2 à 7).
Il est conseillé cependant de choisir, pour la rapidité de l'opération, le même
nombre de chiffres que la valeur extême de la population (N). L'utilisation de
la TNH passe par les stades suivants :
- Numéroter la population à étudier de 1 à N.
- Etablir la taille de l'échantillon n
- Lire la TNH selon un ordre et un sens donnés en utilisant autant de chiffres qu'il y a dans la population.
- Relever les chiffres <=N qui apparaissent par ordre jusqu'à obtenir n (n: taille de l'échantillon).
- Pour disposer des unités de remplacement, on continue le processus de tirage de 25 à 33% unités supplémentaires. Le remplacement des défaillants se fait dans l'ordre des remplaçants.
Lorsque la taille de l'échantillon est suffisamment élevée, on peut voir apparaître une grande proportion constituée des mêmes unités qui se trouvent choisies par des méthodes différentes à l'aide de la TNH (premiers ou derniers chiffres, deux, trois ou quatre chiffres, lecture horizontale ou verticale).
Le sondage aléatoire assure une très grande précision et permet de connaître le risque ce qui permette la généralisation des résultats. On peut estimer la valeur réelle des paramètres en définissant un intervalle de variation avec une probabilité connue.
III - LES TYPES DE SONDAGES
On peut distinguer plusieurs types de sondage indépendamment de la catégorie (raisonné ou aléatoire), le sondage élémentaire, systématique, parquota, stratifié, en grappes..
1 - Le sondage élémentaire
C'est un sondage sans contrainte majeure, il s'agit simplement de choisir n unités parmi la population N sans critère précis sinon la représentativité.
Dans un sondage aléatoire (S.A), chaque unité a la même probabilité d'être choisie, c'est un sondage sans remise. La méthode présentée ci-dessus permet de choisir les unités. Dans un sondage raisonné, il suffit de choisir n unités.
Exemple: Choisir 10 unités dans une popolation de 100. Pour un sondage aléatoire, il s'agit d'abord de numéroter la population de 1 à 100, fixer le sens et l'ordre de la leceture de la TNH, par exemple: les trois premiers horizontalement. Relever les éléments qui apparaîssent inéférieurs à 100 jusqu'à obtenir 10. Continuer le processus et relever 3 unités supplémentaires pour un éventuel remplacement des défaillants. Pour un sondage raisonné, on n'a pas de règle du choix, l'essentiel est de choisir 10.
2 - Le sondage systématique
Il s'agit de choisir les unités à intervalle régulier de manière à couvrir toute la population. La première unité (ou la base b) est choisie dans l'intervalle [1 - N/n] tandis que le pas de la progression arithmétique (ou raison r) est de r = N/n. Dans un S.A, la base est choisie dans la TNH selon le procédé indiqué ci-dessus. C'est un sondage plus facile, mais pose le problème de remplacement en cas de défaillance et ne convient pas aux phénomènes périodiques
Exemple: Choisir un échantillon systématique avec un taux de sondage de 1/10 pour une population de 100. Pour un SAS: On numérote la population de 1 à 100, on fixe le sens et l'ordre de lecture de la TNH: 2 derniers verticalement puisque la base est comprise entre 1 et 10 (N/n) qui est en même temps la raison: les unités choisies sont par exemple: 5, 15, 25, 35, 45,..95 . Pour un SRS: On choisit un chiffre entre 1 et 10 qui constitue la base puis on ajoute 10 pour les autres.
3 - Le sondage par quota
Lorsqu'on a une population hétérogène où on a plusieurs modalités ou classes estimées discriminantes (taille, forme) on peut assurer une répartition équitable en fonction de l'effectif de la strate (quota proportinnel) ou privilégier les petites strates en leur donnant plus de chance d'être enquêtées contrairement aux grandes strates où on peut se contenter d'un nombre réduit d'unités mais suffisamment grand pour permettre la généralisation (quota non proportionnel). Le choix des unités dans un SA se fait toujours à l'aide de la TNH selon les mêmes règles à l'intérieur de chaque strate séparement.
Dans le quota proportionnel, on a: Qi = Si .t avec t: taux de sondage global, Si: effectif de la strate i, Qi: quota de la strate i. Chaque strate et chaque individu a la même probabilité d'être choisis.
Dans le quota non proportionnel, on a: Qi = Si.ti avec t = (Sti.Si)/Pi et Pi: population totale, t: taux global de sondage.
Exemple: On a 10 gros propriétaires qui accaparent 60% du sol à côté de 500 petits exploitants qui n'ont que 15% des terres et on a fixé le taux de sondage à 1/10°.
Dans un quota proportionnel, on a 1 et 50 respectivement. Dans un quota non proportionnel, on peut enquêter tous les gros propriétaires (10) mais seulement 31 petits ce qui respecte le taux global de 1/10.
4 - Le sondage stratifié
Le tirage se fait à plusieurs niveaux ou degrés avec le choixau tirage des unités primaires (UP) dans un premier degré puis les unités secondaires (US) choisies dans les UP... Les unités échantillons sont en cascade. C'est le cas lorsque le tirage se fait selon plusieurs critères, la combinaison des critères définit les strates. On peut distinguer plusieurs types de sondages selon que les probabilités de tirage aux différents degrés sont égales ou inégales:
|
U. Primaires |
U. Secondaires |
|
|
|
P. Egales |
P. Inégales |
|
P. Egales |
EE |
EI |
|
P. Inégales |
IE |
II |
On peut citer l'enquête population-emploi et l'enquête consommation de l'INS. Dans ce cas, les UP sont définies par la combinaison Région (5) et le milieu (3). Dans ces UP, la combinaison taille du ménage (5) et activité de son chef (5) constitue les US.
5 - Le sondage par grappe ou aréolaire
Il constitue un cas particulier des sondages stratifiés notamment dans les sondages où l'espace constitue un paramètre important (région, quartier...), il contribue à réduire les déplacements sur le terrain. Ce type de sondage nécessite un nombre réduit de types représentatifs. Dans une enquête portant sur une ville, il vaut mieux enquêter le minimum de quartier représentatifs avec le maximum de ménages dans chaque quartier qu'un nombre réduit de ménages répartis dans tous les quartiers ce qui réduit fortement les déplacements; ceci est encore plus pertinent lorque le terrain d'enquête est trop vaste comme l'ensemble du pays: au lieu d'enquêter touts les villes, on dresse une typologie de 4 à 5 groupes où on choisit une ville.
IV - LES SONDAGES SPATIAUX
Dans l'espace, l'unité est bidimentionnelle et peut être de trois formes selon les besoins de l'analyse: ponctuelle, linéaire ou aréale. Sur une carte, une photographie aérienne ou un plan, on peut tirer un certain nombre de points ou de lieux à étudier. Il s'agit de graduer la carte horizontalement (X) et verticalement (Y) pour pouvoir tirer les points ou les transects (coupe) aléatoirement selon la TNH (Cf. P Haggett - 1973: L'analyse spatiale en géographie, AC).
.
1 - Le sondage élémentaire
Dans un sondage élémentaire on tire les coordonnées des lieux (x, y) selon la TNH. Pour les phénomènes linéaires, on choisit au hasard deux points (x, y ) pour chaque traverse. C'est le cas par exemple lorsqu'on veut étudier les prix fonciers dans un espace urbain.

2 - Le sondage systématique
Dans un sondage systématique, seul le premier point ou la première traverse sont tirés au hasard, les autres sont choisis selon le même schéma pour couvrir l'ensemble de l'espace avec des points ou des traverses à des distances régulières.

3 - Le sondage hiérarchique
C'est un sondage stratifié à deux degrés qui consiste à tracer des carrés et les numéroter, choisir les UP représentées par les carrés de base et à l'intérieur de ces carrés, fixer les points selon le même procédé de graduation et de tirage (avec un nombre égal ou variable par carré ).
La grille peut être établie par les coordonnées d'un point tiré au hasard, les autres points sont choisis de telle manière qu'il y 'ait une grille de carrés où on tire un nombre égal de points selon la TNH.

4 - Le sondage aréolaire
Il consiste à définir les strates constituées par des unités spatiales homogènes comme le type de sol ou les types de culture et tirer dans chaque strate un certain nombre de points selon la TNH. Ce nombre peut être égal ou variable. Ces strates sont des unités homogènes.
5 - Le sondage systématique stratifié sans alignement
C'est un sondage stratifié, systématique mais qui évite l'alignement. Il a été élaboré par Berry et comprend les étapes suivantes:
- Définir les différentes strates
- Déterminer une grille graduée de 0 à 9 (pour chaque strate)qu'on on place au dessus de la strate
- A l'aide de la TNH, on choisit un point P à partir du coin inférieur gauche et on y place la grille
- On fait varier y à l'aide de la TNH (alors que x est fixe) ce qui nous ramène à un second point P1 de même abscisse mais d'ordonné différent.
- On refait le même processus précédent pour faire varier non pas y mais x, ce qui donne le troisième point P2
- On répète les étapes jusqu'à remplir la grille.

Selon l'effet de la distance, on peut choisir le type adéquat de sondage, si la distance est aléatoire on peut utiliser le sondage systématique, pour un effet linéaire on utilise le sondage systématique ou stratifié. Lorsqu'on a des processus périodiques, on utilise le sondage stratifié mais quand l'effet de la distance est inconnu, il vaut mieux utiliser le sondage systématique stratifié non aligné.
V - L'ESTIMATION: le passage de l'échantillon à la population et la généralisation
Nous avons vu que chacun des paramètres de l'échantillon a une distribution d'échantillonnage bien définie et tend, lorsque n est grand à converger vers la valeur réelle de la population.
L'inégalité de Bienaymé Tchébicheff permet de déterminer avec précision la valeur réelle du paramètre: P ( I x - Ex I => tsx ) <=1/t2
Si on pose t s/n1/2 = e on a : P ( I x - Ex I => s2/ne2
Lorsque n tend vers l'infini: P ( I x - Ex I =>e tend vers 0.
L'objectif de tout sondage est de pouvoir estimer les valeurs réelles des paramè