Home                                                                                                                                                  Fin de Page
 

            LA CORRELATION ET LA REGRESSION SIMPLES COURBES

                                                                                          
Amor BELHEDI, FSHS, Université de Tunis


Le choix du modèle   La linéarisation   Le modèle puissance     Le modèle exponentiel      Le modèle de Pareto    Le modèle de Gibrat    
Le modèle polynomial      L'échelle logarithmique  


Introduction  Présenter & Décrire une variable  Réduire & Résumer une distribution  Notions et Distributions de Probabilités   Corrélation & Régression linéaire simple  Corrélation & Régression simples courbes  Test de Khi-deux   Corrélation dans un tableau  Chroniques & Distributions temporelles   Corrélation & Régression multiples   Droites des Moindres Rectangles   Analyse Factorielle   Classification & Typologie  Tests des hypothèses  Sondages & Distributions d'échantillonnage  Quelques Eléments de calcul matriciel  Tables Statistiques   Papiers Fonctionnels   Bibliographie Sommaire

 

            Souvent hgghgg la relation entre les variables est loin d'être linéaire ce qui pose deux problèmes: 1 - Comment choisir le modèle de la relation?. 2 - Quelle méthode utiliser pour analyser la corréaltion et la régression de type courbe et s'il n'y a qu'une linéaire comment transformer une courbe en une ligne droite pour pouvoir l’étudier par la suite?.

 

            Dans ce chapitre on s'interessera d'abord aux grandes familles de courbes ,  au choix du modèle à adopter ensuite et les règles à suivre pour ce faire, enfin on abordera la transformation linéaire de ces courbes tout en se limitant aux principales notamment les plus utilisées.

 

I - LES GRANDS TYPES DE COURBES OU DE MODELES

 

            On ne va pas présenter, ici, les multiples fonctions  qui existent ce qui dépasse l'objet de ce chapitre, on se limitera simplement aux modèles les plus utilisés: linéaire, puissance, exponentiel, Pareto, Gibrat et logistique. L'étudiant trouvera dans les ouvrages plus spécialisés d'autres types de courbes qui répondent à des besoins particuliers.

 

1 - Le modèle linéaire : le rapport proportionnel

            On a déja ce modèle dans le chapitre précédent et on le cite ici pour simple rappel. C'est une droite d'équation y = ax + b qui exprime la quantité de variation de y lorsque x varie d'une unité alors que b est la valeur de y lorsque x = 0. Le modèle linéaire exprime un rapport constant d'évolution proportionnelle entre deux variables x et y.

 

2 - Le modèle puissance : le rapport relatif constant ou le lien allométrique

            Le modèle puissance exprime une relation allométrique de la forme y = b.xa  donnant graphiquement une courbe convexe lorsque a <10, concave lorsque a > 1 ou en i quand a  <  0. Lpuissance a indique de combien varie y en % (augmente ou dimunie selon le signe de a) lorsque x augmente de 1%. C'est le cas des processus d'allométrie en biologie et d'élasticité en économie, c'est le cas aussi lorsque deux phénomènes se trouvent liés par un rapport constant. La plupart des relations sont de ce type dans la mesure où elle assure l'équilibre de l'ensemble et exprime une loi de répartition interne dans un système donné. C'est le cas de l'organisme humain où, à part les cas de maladie ou de déformation, chaque organe croît selon un rythme fixe qui garantit l'équilibre général du corps indépendamment de la quantité concernée qui peut varier de quelques grammes à des dizaines de kg. C'est la loi qui guide aussi l'économie d'un pays où à certains agrégats comme l'épargne, l'investissement ou la consommation sont en rapport fixe avec le revenu. L'objet des enquêtes de consommation qu'effectue l'INS est de déterminer ces paramètres de base et de pouvoir détecter les tendances de changement des structures socio-économiques: si le revenu d'un tunisien augment de 10% de combien augmenterait sa consommation (alimentaire, de loisirs, de culture, de viande...), son épargne (logement, globale...)?.. C'est ce qu'on appelle en économie l'élasticité. En géographie, la plupart des phénomènes se trouvent concernés par ce type de rapports qui expriment qui expriment la réalité de l'évolution dont le rythme varie au cours du temps ou dans l'espace vers l'accélération (a > 1) ou la décélération (a < 1) passant ainsi par plusieurs stades différents exprimant la naissance, la diffusion et la généralisation enfin la saturation, voire le repli et la contraction. C'est très rare qu'on observe un rapport absolu constant comme le laisse voir le modèle linéaire. Le modèle puissane ou allométrique exprime plutôt la présence d'un taux de croissance proportionnel.

 

Exemples: C'est le cas par exemple du prix du terrain  dans les années 1990 au centre-ville (Pc) ou en périphérie (Pc) en fonction de la taille des villes en Tunisie  (mesurée par la population P en 1984): Pc = 8.831 P0.4648  et Pc = 1.9564 P0.2485  (Cf. A Belhedi, 1992: L'organisation de l'espace en Tunisie). Le prix du terrain augmente de 46.5% au centre et de 24.85% en périphérie lorsque la taille de la ville double (augmente de 100%), les rapports sont de 4.65% et 2.485% pour une hausse de la taille des villes de 10%. Le rapport qui lie le prix et la taille est ainsi constant.

                C'est le cas aussi du nombre de déplacements quotidiens selon le revenu mensuel par personne à Tunis en 1977: D = 0.76R0.39, cette relation devient D =1.091R0.2 et D = 0.034R0.85 pour les déplacements réguliers et secondaires (Cf. A Belhedi - 1980: Les déplacements urbains tunisois, Géo et dév, 1, 47 - 75). A une hausse du revenu de 100% (un doublement) on assiste à une augmentation des déplacements secondaires de 85% (loisires, achats, visite...) mais seulemnt de 20% pour les déplacements obligés de travail ou d'étude.

                C'est le cas par exemple du rapport entre la taille P en milliers) et la superficie d'une ville (en ha) en Tunisie avec une relation de la forme: S = 0.238P0.84 contre S = 5.7P0.635 en France (A Belhedi - 1992: L'organisation de l'espace, pp 240 - 241, A Belhedi 2003), le modèle urbanistique tunisien apparaît plus étalé puisqu'à une augmentation de 10% de la taille correspond une hausse de 8,4% de la superficie contre seulement 6,3% en France. Le modèle allométrique exprime la loi rang-taille ou  la loi de Zipf avec la forme suivante: Pr =139367r-1,275 en 1994  contre Pr = 832367r-1,0923 en 1984 (Cf. A Belhedi 1992, op cité et 2002: A propos de laloi rang-taille. RTG,).

               

3 - Le modèle exponentiel : l'évolution à un taux constant

            Le modèle exponentiel matérialise une relation de la forme y = b.expax ou y = b.10ax. Il s'exprime par une courbe en J (a > 1) ou en i (a < 0)  qui présente une analogie parfois trompeuse avec le modèle puissance. Il représente une évolution (croissance ou décroissance) à un taux constant ou en accélération.  On a parlé parfois du modèle de croissance économique exponentiel pour le Japon ou l'Italie à un certain moment pour exprimer ce processus de croissance de plus en plus élevé. On cite aussi le processus des générations spontanées, la multiplication des cellules ou le dépeuplement et l'extinction d'une race.

 

Exemple: C'est le cas de la relation entre la densité résidencielle et la distance du centre ville vers l apériphérie mais aussi les valeurs foncières quii décroissent du centre selon un gradient de type exponentiel. A Tunis, on a au début des années 1980 la relation suivante: P = 1229.8 exp-2.82d  où P est le prix en dinars, d: la distance du centre-ville en m avec r = -0.956 et une variance expliquée de 91.4%. Ce gradient est le plus faible en direction dion du nors ((0.538), il est le plus élevé en direction de l'est (3.257) vu la position du lac.

 

4 - Le modèle logistique: l'évolution proportionnelle à un potentiel avec limite

            Le modèle logistique exprime la croissance proportionnelle au développement potentiel possible (L - y). La limite (L)[1] peut être absolue: Y = L - Exp-(ax + b) ou relative :    Y = L/(1 + Exp-(ax + b)). C'est une courbe en S asymptotique à l'axe de la limite (absolue) ou à deux axes (la limite et l'axe des x) qui caractérise les processus de diffusion des phénomènes dans le temps ou l'espace, c'est le cas de la loi de Mitscherlich en fumure ou la loi de Compertz.

 

Exemple: C'est le cas par exemple de l'évolution du taux d'urbanisation en Tunisie (Cf A Belhedi 1992, op cité avec U = 100/(1 + Exp(0.0203t  +  40.89)) .La limité de 100% ne peut être dépassée. Au début, l'urbanisation était limitée ce qui fait qu'elle progresse à un rythme très élevé mais une fois le phénomène génréralisé la pente s'infléchit et baisse dessinant une inflexion autour de 50% vers les années 1975. L'urbanisation concerne  désormais une frange de la population à la fois limitée et difficile à intégrer facilement ce qui explique que la courbe commence à se stabiliser.

                C'est aussi la courbe d'apparition et de diffusion d'un équipement donné dans les villes comme le boucher, le café ou plus récemment le club vidéo, le publitel ou le publinet...

 

5 - Le modèle de Pareto : la loi des inégalités et la distribution hiérarchique

            La loi de Pareto exprime les inégalités soéconomiques et d'une manière générale les processus hiéraoù l'effectif d'une population dépassant une valeur donnée diinue au fur et à mesure que cette valeur augmente. C'est le cas des distributions de tous les phénomènes selon la taille (les exploitants selon lataille, la population selon le revenu, les villes selon la taille, les pays selon le PIB...). Le modèle s'écrit comme suit: Nx = k.x-a  avec Nx : l'effectif cumulé des observations ayant une valeur inférieure à un seuil donné (x  £ xi).

 

Exemple: C'est le cas par exemple de la loi rang-taille ou loi de Zipf  exprimée sous la forme d'une loi de répartition en 1984 décrivant la hiérachie urbaine: on a Ni = 93005xi-0.986152  avec Ni: le nombre de centres urbains supérieurs à une taille donnée xi résumant 94,3% . On  auusi la relation Ux = 283.6T - 0.149 en 1975 avec Ut: % cumulé  supérieur ou égal à une taille T (Cf. Abelhedi, 1992, p 232).

                C'est le cas  aussi de l'importance de la marche  à pied avec le revenu à Tunis en 1978 : Marche à pied (%) = -33.35 log R (D/ménage/mois) + 120.874 (District de Tunis, op cité).

 

                        5 - 6                            8                      4

Quelques modèles de courbes. 1: linéaire, 2: puissance, 3: exponentiel,

        5-6: puissance ou exponentiel négatif, pareto, 4: indépendance.

 

 

6 - La loi de Gibrat : la loi de l'effet proportionnel.

            Une série de causes indépendantes  à effets petits, égaux et proportionnels à la grandeur du phénomène conduit à une dissymétrie à droite et à une courbe log-normale. y = alog x + b. C'est le cas des distributions de revenus, des fortunes ou de l'effet de taille... Tout se fait dans un système comme si les phénomènes croissent proportionnellement à leur taille.

 

Exemple: La distribution hiérarchique des villes selon la taille peut être formulée avec ce modèle. Ux = -21.2 logT + 159.1 avec Ux: % cumulé supérieur à une taille T  (Cf A Belhedi, 1992, op cité, p 232).

 

7 - Le modèle parabolique: la courbe se présente sous forme d'un  parabole de la forme y = ax2 + bx + c avec un maximum ou un minimum au milieu selon le signe de a. Il correspond aux processus qui passent au cours de l'évolution par un extrêmum et reviennent: c'est le cas par exemple de la nébulosité  dans un climat méditerranéen à deux saisons prononcées ou de la mortalité selon l'âge qui est élevée au début, baisse progressivement pour atteindreun minimum autour de 20-23 ans pour commencer à augmenter de nouveau ...

 

8 - Le modèle polynomial: il s'exprime par une courbe complexe avec plusieurs creux et bosses de la forme y = a1xn + a2xn-1 + ...b. Les plus simples étant le modèle cubique et quadratique.

 

            Il existe d'autres modèles de distributions mais d'utilisation réduite et trés limitée à certains cas particuliers d'analyse. Il est impératif de connaître le fondement théorique de chaque modèle pour pouvoir l'utiliser en temps utile et choisir le type approprié aux données et à la nature du problème posé.

 

II - LE CHOIX DU MODELE ET DE LA COURBE

 

            Avant de procéder aux calculs, il faut bien choisir le modèle de relation à adopter si on ne veut pas passer à côté du problème et tirer des conclusions sur l'absence de lien là où il peut être très fort pour la simple raison qu'on a mal choisi le type de courbe.

            Le choix du modèle de la relation (la courbe) doit s'appuyer sur certaines règles: la connaissance théorique (ou empirique) du phénomène étudié, le nuage de points, enfin l'inensité de la corrélation.

 

1 - La connaissance théorique du phénomène: Très souvent on connaît déjà que tel phénomène suit une distribution normale, exponentielle ou de puissance, telle ou telle loi. Dans ce cas, on n'a pas à hésiter à choisir le modèle correspondant.

            On sait très bien que la granulométrie suit la loi de Gauss, que plusieurs phénomènes en géographie suivent le modèle puissance comme la relation entre la taille et la superficie  d'une ville, que les phénomènes de diffusion suivent un modèle logistique...

 

2 - La connaissance du terrain: A défaut d'une théorie, la connaissance du terrain peut s'avérer utile et nous aider à choisir le modèle de distribution d'un phénomène donné.

            En étudiant la motorisation à Tunis en 1977, nous avons découvert que la posséssion de la voiture commençait réellement vers un revenu du ménage de 140 dinars. Ce seuil n'a pas de fondement théorique mais était le fruit de la connaissance du terrain. Sa connaissance nous a permis de corriger la partition en classes des revenus des ménages et de pas aboutir à une impasse[2].

 

3 - La représentation graphique

 

            Le nuage de points permet dans pas de cas et en l'absence de connaissance théorique préalable de voir à quel type de courbe on a affaire:

a - L'indépendance: L'indépendance s'exprime graphiquement par un nuage de points sous la forme d'un alignement parallèle à l'un des axes ou d'une trame circulaire ou elliptique (Cf. chap 4).

 

b - La  liaison fonctionnelle: Une liaison fonctionnelle se manifeste par un alignement systématique de tous les points suivant une courbe donnée. La connaissance de x nous permet ainsi de déterminer avec précision la valeur de y . On note la relation: y = f(x) où y est fonction de x.

           

c - La dépendance: La dépendance est la situation la plus fréquente dans les sciences sociales qui exprime la présence d'une relation plus ou moins forte entre deux variables de la forme y = f(x) +/- e laissant la part à l'aléatoire (Cf.chap 4). 

            Graphiquement, la dépendance s'exprime par un nuage de points sous forme d'une courbe donnée. La connaissance théorique des grandes familles de courbes nous permet d'en choisir la plus appropriée pour ajuster le nuage de points.

            La représentation graphique est en mesure de nous permettre le choix du modèle de distribution en l'absence d'une théorie ou d'une connaissance solide du terrain et c'est malheureusement le cas dans la plupart des recherches. Le nuage de point nous permet de choisir le modèle le plus proche, il nous épargne le tatonnement, les calculs inutiles et les fausses pistes.

 

4 - La plus forte corrélation (r max)

            Si le nuage de points ne permet pas de trancher en faveur d'un modèle donné, on calcule le coefficient de corrélation des 2 ou 3 modèles les plus proches du nuage obtenu et on adopte celui qui a le coefficient le plus élevé sous réserve d'essayer de trouver la justification du modèle choisi. En effet, à une situation donnée on peut toujours trouver un modèle voire plusieurs qui expliquent le maximum de variance mais il faut toujours justifier le choix d'un modèle plutôt qu'un autre et adopter celui qui offre une explication raisonnable et acceptable même si sa variance expliquée est plus réduite..

 

Exemple: Dans le cas de la relation entre fécondité et planning familial (Chap 4) on peut trouver un modèle polynomial ou exponentiel qui expliquent chacun 99% de la variance mais quelle serait l'explication de tels modèles?. La question n'est pas tant de trouver un modèle et n'importe lequel que de trouver une explication logique et acceptable.

 

Région

Fécondité %° (F)

Planning Familial P

 % des femmes utilisant le P.F

Tunis

133.1

39.3

Sfax

137.4

33.1

Sahel

148.1

28.2

Nord-Est

137.3

32.6

Nord-Ouest

139.1

28.7

Centre-Ouest

192.8

11.4

Sud

183.2

15.9

 

                L'examen du nuage de points montre qu'on peut utiliser un des trois modèles suivants avec une explication allant de 97 à 99% :

                Régression linéaire: elle explique 97% :         F = -2.392636 P + 217.6695343   

                Régression parabolique: elle explique 99% :   F =  0.0652x2 - 5.5902x + 250.9943 

                Régression exponentielle: elle explique 99% : F = 226.3298.10-0.0065P

                Dans ce cas, il ne suffit pas de trouver un modèle qui explique le maximum de variance (on en trouve toujours) mais il s'agit d'expliquer le phénomène avec un fondement théorique à l'appui à la fois raisonnable et irréfutable.

 

III - LA LINEARISATION

 

            Une fois, on a choisi  le modèle il y a lieu de transformer la relation courbe sous forme linéaire, plus facile à étudier de la forme y = ax + b. Une fois les données linéarisées, il y a leur d'applique systématiquement toutes les étapes de la méthode de l'ajustemelinéaire par les moindres carrés qu'on a eée au chapitre précédent.

            Il existe plusieurs méthodes de linéarisation dont on peut certains comme citer la racine (carrée ou autre) et les fonctions trigonométriques (sin, cos, tg et cotg...) mais on se limitera ici à la transformation logarithmique qui est la plus simple et la plus utilisée.

 

1 - Le logarithme

 

a- Définition:   Le logarithme a d'une valeur x  en fonction d'une base b est la valeur à laquelle on élève la base b pour obtenir la valeur initiale x:   log bx = a     d'où    ba = x

Ainsi log1010 = 1 d'où 101=10 et log10100 = 2 d'où 102 = 100...

 

b- La base: On peut utiliser n'importe quel chiffre comme base (8, 17, 2, 10,...) mais les plus utilisées sont 10 et e = 2.718 d'où le logarithme décimal (noté log) et le logarithme naturel ou népérien (noté ln). Dans la suite du texte on écrira seulement log x et lnx

 

c - Les règles de base du logarithme : elles sont au nombre de quatre règles qu'on va utiliser pour transformer une courbe en une ligne droite:

- Le loagarithme de la base est toujours égal à l'unité: log1010 = 1  et logee = 1

- Le logarithme d'un produit est égal à la somme des logarithmes : log (a.b) = log a + log b

- Le logarithme d'un quotient est gal à la différence des logarithmes: log(a/b) = log a - Llg b

- Le logarithme d'une puissance est égal à la puissance multipliée par le logarithme de ce nombre: log xa = a.log x.

 

2 - La transformation logarithmique

 

            En utilisant le logarithme on arrive à transformer la plupart des relations courbes en des relations linéaires plus simples de la forme y = ax+b.

 

a- Le modèle puissance

En utilisant les règles précédentes on transforme la relation y = bxqui devient de la forme linéaire log y = a.log x + log b.  

 Si on pose y', x' et b' comme le logarithme de y, x et b on obtient y' = ax' + b' . Tout revient à travailler sur les logarithmes des observations (y' et x') au lieu des valeurs réelles. Une fois, on a obtenu b', il y a lieu de calculer b: b = 10b'

 

Exemple:  La loi rang-taille de Zipf  qui s’écrit : Pr = br-a  devient alors après transformation logaritmique une relation linéaire de la forme :  log Pr = -alogr + log b .

 

b- Le modèle exponentiel

La relation y = b.expax devient ln y = ax + lnb.  On peut écrire alors: y' = ax + b'. Il s'agit de transformer les valeurs y en logarithmes mais pas celles de x. Une fois, on a trouvé b', on calcule b = eb'. On peut utiliser aussi le modèle y=b.10ax donnant y' = ax + logb avec b = 10b'. Les deux relations sont équivalents, la première utilise le logarithme naturel, la seconde utilise plutôt le logarithme décimal, les paramètres a et b ne sont pas équivalentes mais le résultat final est le même.

 

c- Le modèle logistique

La relation y = L/(1 + Exp -(ax + b)  devient alors ln (y/(1 - y) = ax + b et on obtient: y' = ax + b avec y' = y/(1 - y). On peut utiliser aussi le logarithme décimal.

 

d- La Loi de Pareto

On a Nx = k.x-a  ce qui nous donne  ln Nx = -a ln x + ln k. On a ainsi y' = -ax' + k'  (avec y' = Nx, x' = lnx, k' = lnk, k = 10k'). On peut aussi utiliser le logarithme décimal.

 

            On voit qu'on peut transformer facilement n'importe quelle courbe en une relation linéaire de la forme y = ax + b si bien que la méthode de corrélation linéaire qu'on va voir maintenant reste valable pour tout type de relation simple.

            Seulement le logarithme ne peut pas être utilisé lorsqu'on a des valeurs nulles ou négatives. Dans ce cas d'autres transformations plus appropriées sans trop déformer les données sont à utiliser. Toute transformation est porteuse de biais mais c'est le seul moyen d'analyser la corrélation entre deux variables.

 

            Le logarithme ne s'applique qu'aux valeurs strictement positives puisque le logarithme de 1 est zéro et celui de zéro n'existe pas. Dans le cas où on a des valeurs nulles ou négatives, il faut soit éliminer ces valeurs ce qui est problématique dans lamesure où cela fausse la réalité, soit adopter une transformation appropriée et là aussi il y a le biais de fausser les données elles-mêmes. Si on a des valeurs négatives qui vont par exemple jusqu'à -5 on peut adopter la forme log (x + 6) de telle manière que la valeur minimale aurait une valeur log de : 0(log (-5 +  6) = log1 = 0 mais que représente ce (x + 6)?.

            En outre, le logarithme contribue à exagérer les petites valeurs et contracter les grandes valeurs ce qui revient à donner plus d'importance aux premières.

 

IV - LA CORRELATION ET LA REGRESSION LINEAIRES

 

            Une fois la forme linéarisée, on applique systématiquement la méthode de la corrélation linéaire de bout en comble à la différence près qu'au lieu de travailler sur les valeurs réelles, on travaille sur les logarithmes de ces valeurs.

            La transformation logarithmique ou autre n'est qu'un moyen pour permettre le calcul des paramètres de la corrélation et de la régression. Une fois on a déterminé les paramètres de la régression on présente les résultats sous leur forme définitive. Les résidus doivent être calculés avec la formulule initiale avant transformation pour garder leur sens par rapport aux valeurs observées.

 

Exemple: le modèle puissance. Le modèle puissance s'écrit s'écrit y = bxa   qui se transforme ave le logarithme à la forme linéaire: logy = alogx + log b. En posant y': logy, x': logx, b' = logb, on obtient la formulation logarithmique y' = ax' + b'.

                Le calcul de la corrélation, des paramètres a et b se fait à partir des logaritmes de x et de y selon les mêmes formules du chapitre 4.

R = Covy'x'/sx'./sy'              Covy'x' = 1/nSx'y' - xa'ya'          xa '= Sxi'/n      Vx' = 1/nSx'2  -  xa'2

a =  Covy'x'/sx'2         b' = ya' - axa'         e =  sy(1 - r2)2 .  xa’ et ya’ sont les moyennes arithmétiques de x’ et de y’.

                Une fois les paramètres a, b (b = 10b')  et e calculés, on présente le résultat sous la forme initiale du modèle avant transformation logaritmique: y = bxa  + /- ke.

 

Exemple: Etudier la relation entre le revenu mensuel et le mode de déplacements des tunisois. Y'a-t-il une relation?. Quelle est son intensité et sa forme?.

 

Revenu D/mois

% Marche  à pied

% T.C

% Voiture

15-20

82.5

16

0

20.30

75

22.5

0

30-40

69.5

26

0

40-80

60

32.5

2.6

80-100

54.5

33

6

100-140

50

32.5

7.6

140-200

45

31

12.5

200-300

39

25

20

300-400

36.3

5

30

400-500

32.5

21.5

37.5

500-800

28

17.2

53.5

800-1000

25

11

61.5

Source : District de Tunis. 1978, A Belhedi 1980, Géo & Développement, n°1.

 

Pour la marche à pied (2°colonne), l'examen du nuage de points montre une distribution dissymétrique en (i), ce qui milite en faveur de la loi de Pareto (y = a log x + b). La corrélation et la régression donnent les résultats suivants:

 

 

Moyenne

Variance

Ecart-type

Marche à pied

49.775

327.506

18.097

Revenu

2.132

0.2916

0.54

Modèle:

 y = a log x + b

Covariance : -9.725

Coefficient de corrélation r = -0.9951

Variance expliquée: r2 = 0.99

a = -33.3487      b = 120.874    Erreur-type: 1.782

Marche à pied = -33.35 log R + 120.874

Test Student:   Tobs = a.sx (n - 2)1/2/e = -31.958

Test de Fisher : Fobs = (n - 1)r2:(1 - r2) = 1020.618

 

                Quant à la voiture, on constate que  le nuage de point dessine plutôt une courbe allométrique. On peut utiliser le modèle puissance: y = bxa. Il y a lieu donc d'utiliser le logarithmes des valeurs observées. Les résultats sont confinés dans le tableau  suivant:

 

 

Moyenne

Variance

Ecart-type

Marche à pied

1.226

0.1458

0.3818

Revenu

2.377

0.1458

0.3818

Modèle :

y =  bxa

% Voit = b Rev a

Covariance : 0.166

Coefficient de corrélation r = 0.9839

Variance expliquée: r2 = 0.9681

a = 1.13929      b = 0.032    Erreur-type : 0.0788

% Voiture = 0.032 Revenu 1.139

 

Exemple : Analyser la relation entre la densité des établissements à Tunis (Nb Etablissements /ha) en fonction de la distance ( d en m) au Centre-ville:

 

distance  d

200

300

400

500

600

700

800

900

1000

1100

1200

1300

1400

1500

Densité D

69.7

35.5

26.4

25.2

17.2

12.3

8.7

7.9

7.6

4.7

4.1

2.9

2.4

2.06

 

                L'examen du nuage de points montre que l'allure est de type allométriq: y =  bxa. Les calculs nous donnent le résultat suivant : D = 57974.76 d-1.3625  avec r = - 0.96655 et r2 = 0.93422. La distance au centre explique ainsi 93.4% de la densité des établissements à Tunis. La forme de la relation  rejles modèles d'allocation spatiale de la ville et se présente sous forme allométrique ce qui exprime un gradient lié à la distance  et on retrouve ici le schéma gravitaire.

 

Exemple: Analyse de la relation entre l'urbanisation et le taux d'électrification en  1994. La relation est plutôt de type puissance avec r = 0.9408, la variance expliquée est de 88.5% et la relation s'écrit: E = 17.427U0.3916. La corrélation linéaire n'st que de 0.9228, soit 85.15%. L'erreur tye est de 4.06. Chaque fois que l'urbanisation augmente de 10% l'électrification augmente de 3.9%

 

Région

Tu

NE

NO

CE

CO

SE

SO

Moyenne

Ecart type

% Urbanisation

92.1

58.7

34.4

69.5

29.5

61.9

66.4

19.80078

58.92857

% Electrification

98.1

85.7

76.3

59.8

92.3

92

89.4

84.8

11.9738

 

Exemple: Analyse de la relation entre la motorisation et le niveau de  dépense (DPA) en 1994. Le modèle puissance explique 64% avec une corrélation de 0.81 et une équation de Mot = 1.0233PA0.016 (la relation linéaire est de Mot = 0.01529 DPA +0.698 avec r = 0.7479 et r2 = 0.559). Chaque fois que le niveau de vie augmente de 10%, la motorisation progresse de 1.6%