LA CORRELATION ET LA REGRESSION SIMPLES COURBES
Amor BELHEDI, FSHS, Université de Tunis
Le
choix du modèle La linéarisation Le modèle puissance Le modèle exponentiel
Le modèle de Pareto Le modèle de Gibrat
Le modèle polynomial
L'échelle logarithmique
Introduction Présenter & Décrire une variable Réduire & Résumer une distribution Notions et Distributions de Probabilités Corrélation & Régression linéaire simple Corrélation & Régression simples courbes Test de Khi-deux Corrélation dans un tableau Chroniques & Distributions temporelles Corrélation & Régression multiples Droites des Moindres Rectangles Analyse Factorielle Classification & Typologie Tests des hypothèses Sondages & Distributions d'échantillonnage Quelques Eléments de calcul matriciel Tables Statistiques Papiers Fonctionnels Bibliographie Sommaire
Souvent hgghgg la relation entre les variables est loin d'être linéaire ce qui pose deux problèmes: 1 - Comment choisir le modèle de la relation?. 2 - Quelle méthode utiliser pour analyser la corréaltion et la régression de type courbe et s'il n'y a qu'une linéaire comment transformer une courbe en une ligne droite pour pouvoir létudier par la suite?.
Dans ce chapitre on s'interessera d'abord aux grandes familles de courbes , au choix du modèle à adopter ensuite et les règles à suivre pour ce faire, enfin on abordera la transformation linéaire de ces courbes tout en se limitant aux principales notamment les plus utilisées.
I - LES GRANDS TYPES DE COURBES OU DE MODELES
On ne va pas présenter, ici, les multiples fonctions qui existent ce qui dépasse l'objet de ce chapitre, on se limitera simplement aux modèles les plus utilisés: linéaire, puissance, exponentiel, Pareto, Gibrat et logistique. L'étudiant trouvera dans les ouvrages plus spécialisés d'autres types de courbes qui répondent à des besoins particuliers.
1 - Le modèle linéaire : le rapport proportionnel
On a déja ce modèle dans le chapitre précédent et on le cite ici pour simple rappel. C'est une droite d'équation y = ax + b qui exprime la quantité de variation de y lorsque x varie d'une unité alors que b est la valeur de y lorsque x = 0. Le modèle linéaire exprime un rapport constant d'évolution proportionnelle entre deux variables x et y.
2 - Le modèle puissance : le rapport relatif constant ou le lien allométrique
Le modèle puissance exprime une relation allométrique de la forme y = b.xa donnant graphiquement une courbe convexe lorsque a <10, concave lorsque a > 1 ou en i quand a < 0. Lpuissance a indique de combien varie y en % (augmente ou dimunie selon le signe de a) lorsque x augmente de 1%. C'est le cas des processus d'allométrie en biologie et d'élasticité en économie, c'est le cas aussi lorsque deux phénomènes se trouvent liés par un rapport constant. La plupart des relations sont de ce type dans la mesure où elle assure l'équilibre de l'ensemble et exprime une loi de répartition interne dans un système donné. C'est le cas de l'organisme humain où, à part les cas de maladie ou de déformation, chaque organe croît selon un rythme fixe qui garantit l'équilibre général du corps indépendamment de la quantité concernée qui peut varier de quelques grammes à des dizaines de kg. C'est la loi qui guide aussi l'économie d'un pays où à certains agrégats comme l'épargne, l'investissement ou la consommation sont en rapport fixe avec le revenu. L'objet des enquêtes de consommation qu'effectue l'INS est de déterminer ces paramètres de base et de pouvoir détecter les tendances de changement des structures socio-économiques: si le revenu d'un tunisien augment de 10% de combien augmenterait sa consommation (alimentaire, de loisirs, de culture, de viande...), son épargne (logement, globale...)?.. C'est ce qu'on appelle en économie l'élasticité. En géographie, la plupart des phénomènes se trouvent concernés par ce type de rapports qui expriment qui expriment la réalité de l'évolution dont le rythme varie au cours du temps ou dans l'espace vers l'accélération (a > 1) ou la décélération (a < 1) passant ainsi par plusieurs stades différents exprimant la naissance, la diffusion et la généralisation enfin la saturation, voire le repli et la contraction. C'est très rare qu'on observe un rapport absolu constant comme le laisse voir le modèle linéaire. Le modèle puissane ou allométrique exprime plutôt la présence d'un taux de croissance proportionnel.
Exemples: C'est le cas par exemple du prix du terrain dans les années 1990 au centre-ville (Pc) ou en périphérie (Pc) en fonction de la taille des villes en Tunisie (mesurée par la population P en 1984): Pc = 8.831 P0.4648 et Pc = 1.9564 P0.2485 (Cf. A Belhedi, 1992: L'organisation de l'espace en Tunisie). Le prix du terrain augmente de 46.5% au centre et de 24.85% en périphérie lorsque la taille de la ville double (augmente de 100%), les rapports sont de 4.65% et 2.485% pour une hausse de la taille des villes de 10%. Le rapport qui lie le prix et la taille est ainsi constant.
C'est le cas aussi du nombre de déplacements quotidiens selon le revenu mensuel par personne à Tunis en 1977: D = 0.76R0.39, cette relation devient D =1.091R0.2 et D = 0.034R0.85 pour les déplacements réguliers et secondaires (Cf. A Belhedi - 1980: Les déplacements urbains tunisois, Géo et dév, 1, 47 - 75). A une hausse du revenu de 100% (un doublement) on assiste à une augmentation des déplacements secondaires de 85% (loisires, achats, visite...) mais seulemnt de 20% pour les déplacements obligés de travail ou d'étude.
C'est le cas par exemple du rapport entre la taille P en milliers) et la superficie d'une ville (en ha) en Tunisie avec une relation de la forme: S = 0.238P0.84 contre S = 5.7P0.635 en France (A Belhedi - 1992: L'organisation de l'espace, pp 240 - 241, A Belhedi 2003), le modèle urbanistique tunisien apparaît plus étalé puisqu'à une augmentation de 10% de la taille correspond une hausse de 8,4% de la superficie contre seulement 6,3% en France. Le modèle allométrique exprime la loi rang-taille ou la loi de Zipf avec la forme suivante: Pr =139367r-1,275 en 1994 contre Pr = 832367r-1,0923 en 1984 (Cf. A Belhedi 1992, op cité et 2002: A propos de laloi rang-taille. RTG,).
3 - Le modèle exponentiel : l'évolution à un taux constant
Le modèle exponentiel matérialise une relation de la forme y = b.expax ou y = b.10ax. Il s'exprime par une courbe en J (a > 1) ou en i (a < 0) qui présente une analogie parfois trompeuse avec le modèle puissance. Il représente une évolution (croissance ou décroissance) à un taux constant ou en accélération. On a parlé parfois du modèle de croissance économique exponentiel pour le Japon ou l'Italie à un certain moment pour exprimer ce processus de croissance de plus en plus élevé. On cite aussi le processus des générations spontanées, la multiplication des cellules ou le dépeuplement et l'extinction d'une race.
Exemple: C'est le cas de la relation entre la densité résidencielle et la distance du centre ville vers l apériphérie mais aussi les valeurs foncières quii décroissent du centre selon un gradient de type exponentiel. A Tunis, on a au début des années 1980 la relation suivante: P = 1229.8 exp-2.82d où P est le prix en dinars, d: la distance du centre-ville en m avec r = -0.956 et une variance expliquée de 91.4%. Ce gradient est le plus faible en direction dion du nors ((0.538), il est le plus élevé en direction de l'est (3.257) vu la position du lac.
4 - Le modèle logistique: l'évolution proportionnelle à un potentiel avec limite
Le modèle logistique exprime la croissance proportionnelle au développement potentiel possible (L - y). La limite (L)[1] peut être absolue: Y = L - Exp-(ax + b) ou relative : Y = L/(1 + Exp-(ax + b)). C'est une courbe en S asymptotique à l'axe de la limite (absolue) ou à deux axes (la limite et l'axe des x) qui caractérise les processus de diffusion des phénomènes dans le temps ou l'espace, c'est le cas de la loi de Mitscherlich en fumure ou la loi de Compertz.
Exemple: C'est le cas par exemple de l'évolution du taux d'urbanisation en Tunisie (Cf A Belhedi 1992, op cité avec U = 100/(1 + Exp(0.0203t + 40.89)) .La limité de 100% ne peut être dépassée. Au début, l'urbanisation était limitée ce qui fait qu'elle progresse à un rythme très élevé mais une fois le phénomène génréralisé la pente s'infléchit et baisse dessinant une inflexion autour de 50% vers les années 1975. L'urbanisation concerne désormais une frange de la population à la fois limitée et difficile à intégrer facilement ce qui explique que la courbe commence à se stabiliser.
C'est aussi la courbe d'apparition et de diffusion d'un équipement donné dans les villes comme le boucher, le café ou plus récemment le club vidéo, le publitel ou le publinet...
5 - Le modèle de Pareto : la loi des inégalités et la distribution hiérarchique
La loi de Pareto exprime les inégalités soéconomiques et d'une manière générale les processus hiéraoù l'effectif d'une population dépassant une valeur donnée diinue au fur et à mesure que cette valeur augmente. C'est le cas des distributions de tous les phénomènes selon la taille (les exploitants selon lataille, la population selon le revenu, les villes selon la taille, les pays selon le PIB...). Le modèle s'écrit comme suit: Nx = k.x-a avec Nx : l'effectif cumulé des observations ayant une valeur inférieure à un seuil donné (x £ xi).
Exemple: C'est le cas par exemple de la loi rang-taille ou loi de Zipf exprimée sous la forme d'une loi de répartition en 1984 décrivant la hiérachie urbaine: on a Ni = 93005xi-0.986152 avec Ni: le nombre de centres urbains supérieurs à une taille donnée xi résumant 94,3% . On auusi la relation Ux = 283.6T - 0.149 en 1975 avec Ut: % cumulé supérieur ou égal à une taille T (Cf. Abelhedi, 1992, p 232).
C'est le cas aussi de l'importance de la marche à pied avec le revenu à Tunis en 1978 : Marche à pied (%) = -33.35 log R (D/ménage/mois) + 120.874 (District de Tunis, op cité).

5 - 6 8 4
Quelques modèles de courbes. 1: linéaire, 2: puissance, 3: exponentiel,
5-6: puissance ou exponentiel négatif, pareto, 4: indépendance.
6 - La loi de Gibrat : la loi de l'effet proportionnel.
Une série de causes indépendantes à effets petits, égaux et proportionnels à la grandeur du phénomène conduit à une dissymétrie à droite et à une courbe log-normale. y = alog x + b. C'est le cas des distributions de revenus, des fortunes ou de l'effet de taille... Tout se fait dans un système comme si les phénomènes croissent proportionnellement à leur taille.
Exemple: La distribution hiérarchique des villes selon la taille peut être formulée avec ce modèle. Ux = -21.2 logT + 159.1 avec Ux: % cumulé supérieur à une taille T (Cf A Belhedi, 1992, op cité, p 232).
7 - Le modèle parabolique: la courbe se présente sous forme d'un parabole de la forme y = ax2 + bx + c avec un maximum ou un minimum au milieu selon le signe de a. Il correspond aux processus qui passent au cours de l'évolution par un extrêmum et reviennent: c'est le cas par exemple de la nébulosité dans un climat méditerranéen à deux saisons prononcées ou de la mortalité selon l'âge qui est élevée au début, baisse progressivement pour atteindreun minimum autour de 20-23 ans pour commencer à augmenter de nouveau ...
8 - Le modèle polynomial: il s'exprime par une courbe complexe avec plusieurs creux et bosses de la forme y = a1xn + a2xn-1 + ...b. Les plus simples étant le modèle cubique et quadratique.
Il existe d'autres modèles de distributions mais d'utilisation réduite et trés limitée à certains cas particuliers d'analyse. Il est impératif de connaître le fondement théorique de chaque modèle pour pouvoir l'utiliser en temps utile et choisir le type approprié aux données et à la nature du problème posé.
II - LE CHOIX DU MODELE ET DE LA COURBE
Avant de procéder aux calculs, il faut bien choisir le modèle de relation à adopter si on ne veut pas passer à côté du problème et tirer des conclusions sur l'absence de lien là où il peut être très fort pour la simple raison qu'on a mal choisi le type de courbe.
Le choix du modèle de la relation (la courbe) doit s'appuyer sur certaines règles: la connaissance théorique (ou empirique) du phénomène étudié, le nuage de points, enfin l'inensité de la corrélation.
1 - La connaissance théorique du phénomène: Très souvent on connaît déjà que tel phénomène suit une distribution normale, exponentielle ou de puissance, telle ou telle loi. Dans ce cas, on n'a pas à hésiter à choisir le modèle correspondant.
On sait très bien que la granulométrie suit la loi de Gauss, que plusieurs phénomènes en géographie suivent le modèle puissance comme la relation entre la taille et la superficie d'une ville, que les phénomènes de diffusion suivent un modèle logistique...
2 - La connaissance du terrain: A défaut d'une théorie, la connaissance du terrain peut s'avérer utile et nous aider à choisir le modèle de distribution d'un phénomène donné.
En étudiant la motorisation à Tunis en 1977, nous avons découvert que la posséssion de la voiture commençait réellement vers un revenu du ménage de 140 dinars. Ce seuil n'a pas de fondement théorique mais était le fruit de la connaissance du terrain. Sa connaissance nous a permis de corriger la partition en classes des revenus des ménages et de pas aboutir à une impasse[2].
3 - La représentation graphique
Le nuage de points permet dans pas de cas et en l'absence de connaissance théorique préalable de voir à quel type de courbe on a affaire:
a - L'indépendance: L'indépendance s'exprime graphiquement par un nuage de points sous la forme d'un alignement parallèle à l'un des axes ou d'une trame circulaire ou elliptique (Cf. chap 4).
b - La liaison fonctionnelle: Une liaison fonctionnelle se manifeste par un alignement systématique de tous les points suivant une courbe donnée. La connaissance de x nous permet ainsi de déterminer avec précision la valeur de y . On note la relation: y = f(x) où y est fonction de x.
c - La dépendance: La dépendance est la situation la plus fréquente dans les sciences sociales qui exprime la présence d'une relation plus ou moins forte entre deux variables de la forme y = f(x) +/- e laissant la part à l'aléatoire (Cf.chap 4).
Graphiquement, la dépendance s'exprime par un nuage de points sous forme d'une courbe donnée. La connaissance théorique des grandes familles de courbes nous permet d'en choisir la plus appropriée pour ajuster le nuage de points.
La représentation graphique est en mesure de nous permettre le choix du modèle de distribution en l'absence d'une théorie ou d'une connaissance solide du terrain et c'est malheureusement le cas dans la plupart des recherches. Le nuage de point nous permet de choisir le modèle le plus proche, il nous épargne le tatonnement, les calculs inutiles et les fausses pistes.
4 - La plus forte corrélation (r max)
Si le nuage de points ne permet pas de trancher en faveur d'un modèle donné, on calcule le coefficient de corrélation des 2 ou 3 modèles les plus proches du nuage obtenu et on adopte celui qui a le coefficient le plus élevé sous réserve d'essayer de trouver la justification du modèle choisi. En effet, à une situation donnée on peut toujours trouver un modèle voire plusieurs qui expliquent le maximum de variance mais il faut toujours justifier le choix d'un modèle plutôt qu'un autre et adopter celui qui offre une explication raisonnable et acceptable même si sa variance expliquée est plus réduite..
Exemple: Dans le cas de la relation entre fécondité et planning familial (Chap 4) on peut trouver un modèle polynomial ou exponentiel qui expliquent chacun 99% de la variance mais quelle serait l'explication de tels modèles?. La question n'est pas tant de trouver un modèle et n'importe lequel que de trouver une explication logique et acceptable.
|
Région |
Fécondité %° (F) |
Planning Familial P % des femmes utilisant le P.F |
|
Tunis |
133.1 |
39.3 |
|
Sfax |
137.4 |
33.1 |
|
Sahel |
148.1 |
28.2 |
|
Nord-Est |
137.3 |
32.6 |
|
Nord-Ouest |
139.1 |
28.7 |
|
Centre-Ouest |
192.8 |
11.4 |
|
Sud |
183.2 |
15.9 |
L'examen du nuage de points montre qu'on peut utiliser un des trois modèles suivants avec une explication allant de 97 à 99% :
Régression linéaire: elle explique 97% : F = -2.392636 P + 217.6695343
Régression parabolique: elle explique 99% : F = 0.0652x2 - 5.5902x + 250.9943
Régression exponentielle: elle explique 99% : F = 226.3298.10-0.0065P
Dans ce cas, il ne suffit pas de trouver un modèle qui explique le maximum de variance (on en trouve toujours) mais il s'agit d'expliquer le phénomène avec un fondement théorique à l'appui à la fois raisonnable et irréfutable.
III - LA LINEARISATION
Une fois, on a choisi le modèle il y a lieu de transformer la relation courbe sous forme linéaire, plus facile à étudier de la forme y = ax + b. Une fois les données linéarisées, il y a leur d'applique systématiquement toutes les étapes de la méthode de l'ajustemelinéaire par les moindres carrés qu'on a eée au chapitre précédent.
Il existe plusieurs méthodes de linéarisation dont on peut certains comme citer la racine (carrée ou autre) et les fonctions trigonométriques (sin, cos, tg et cotg...) mais on se limitera ici à la transformation logarithmique qui est la plus simple et la plus utilisée.
1 - Le logarithme
a- Définition: Le logarithme a d'une valeur x en fonction d'une base b est la valeur à laquelle on élève la base b pour obtenir la valeur initiale x: log bx = a d'où ba = x
Ainsi log1010 = 1 d'où 101=10 et log10100 = 2 d'où 102 = 100...
b- La base: On peut utiliser n'importe quel chiffre comme base (8, 17, 2, 10,...) mais les plus utilisées sont 10 et e = 2.718 d'où le logarithme décimal (noté log) et le logarithme naturel ou népérien (noté ln). Dans la suite du texte on écrira seulement log x et lnx
c - Les règles de base du logarithme : elles sont au nombre de quatre règles qu'on va utiliser pour transformer une courbe en une ligne droite:
- Le loagarithme de la base est toujours égal à l'unité: log1010 = 1 et logee = 1
- Le logarithme d'un produit est égal à la somme des logarithmes : log (a.b) = log a + log b
- Le logarithme d'un quotient est gal à la différence des logarithmes: log(a/b) = log a - Llg b
- Le logarithme d'une puissance est égal à la puissance multipliée par le logarithme de ce nombre: log xa = a.log x.
2 - La transformation logarithmique
En utilisant le logarithme on arrive à transformer la plupart des relations courbes en des relations linéaires plus simples de la forme y = ax+b.
a- Le modèle puissance
En utilisant les règles précédentes on transforme la relation y = bxa qui devient de la forme linéaire log y = a.log x + log b.
Si on pose y', x' et b' comme le logarithme de y, x et b on obtient y' = ax' + b' . Tout revient à travailler sur les logarithmes des observations (y' et x') au lieu des valeurs réelles. Une fois, on a obtenu b', il y a lieu de calculer b: b = 10b'
Exemple: La loi rang-taille de Zipf qui sécrit : Pr = br-a devient alors après transformation logaritmique une relation linéaire de la forme : log Pr = -alogr + log b .
b- Le modèle exponentiel
La relation y = b.expax devient ln y = ax + lnb. On peut écrire alors: y' = ax + b'. Il s'agit de transformer les valeurs y en logarithmes mais pas celles de x. Une fois, on a trouvé b', on calcule b = eb'. On peut utiliser aussi le modèle y=b.10ax donnant y' = ax + logb avec b = 10b'. Les deux relations sont équivalents, la première utilise le logarithme naturel, la seconde utilise plutôt le logarithme décimal, les paramètres a et b ne sont pas équivalentes mais le résultat final est le même.
c- Le modèle logistique
La relation y = L/(1 + Exp -(ax + b) devient alors ln (y/(1 - y) = ax + b et on obtient: y' = ax + b avec y' = y/(1 - y). On peut utiliser aussi le logarithme décimal.
d- La Loi de Pareto
On a Nx = k.x-a ce qui nous donne ln Nx = -a ln x + ln k. On a ainsi y' = -ax' + k' (avec y' = Nx, x' = lnx, k' = lnk, k = 10k'). On peut aussi utiliser le logarithme décimal.
On voit qu'on peut transformer facilement n'importe quelle courbe en une relation linéaire de la forme y = ax + b si bien que la méthode de corrélation linéaire qu'on va voir maintenant reste valable pour tout type de relation simple.
Seulement le logarithme ne peut pas être utilisé lorsqu'on a des valeurs nulles ou négatives. Dans ce cas d'autres transformations plus appropriées sans trop déformer les données sont à utiliser. Toute transformation est porteuse de biais mais c'est le seul moyen d'analyser la corrélation entre deux variables.
Le logarithme ne s'applique qu'aux valeurs strictement positives puisque le logarithme de 1 est zéro et celui de zéro n'existe pas. Dans le cas où on a des valeurs nulles ou négatives, il faut soit éliminer ces valeurs ce qui est problématique dans lamesure où cela fausse la réalité, soit adopter une transformation appropriée et là aussi il y a le biais de fausser les données elles-mêmes. Si on a des valeurs négatives qui vont par exemple jusqu'à -5 on peut adopter la forme log (x + 6) de telle manière que la valeur minimale aurait une valeur log de : 0(log (-5 + 6) = log1 = 0 mais que représente ce (x + 6)?.
En outre, le logarithme contribue à exagérer les petites valeurs et contracter les grandes valeurs ce qui revient à donner plus d'importance aux premières.
IV - LA CORRELATION ET LA REGRESSION LINEAIRES
Une fois la forme linéarisée, on applique systématiquement la méthode de la corrélation linéaire de bout en comble à la différence près qu'au lieu de travailler sur les valeurs réelles, on travaille sur les logarithmes de ces valeurs.
La transformation logarithmique ou autre n'est qu'un moyen pour permettre le calcul des paramètres de la corrélation et de la régression. Une fois on a déterminé les paramètres de la régression on présente les résultats sous leur forme définitive. Les résidus doivent être calculés avec la formulule initiale avant transformation pour garder leur sens par rapport aux valeurs observées.
Exemple: le modèle puissance. Le modèle puissance s'écrit s'écrit y = bxa qui se transforme ave le logarithme à la forme linéaire: logy = alogx + log b. En posant y': logy, x': logx, b' = logb, on obtient la formulation logarithmique y' = ax' + b'.
Le calcul de la corrélation, des paramètres a et b se fait à partir des logaritmes de x et de y selon les mêmes formules du chapitre 4.
R = Covy'x'/sx'./sy' Covy'x' = 1/nSx'y' - xa'ya' xa '= Sxi'/n Vx' = 1/nSx'2 - xa'2
a = Covy'x'/sx'2 b' = ya' - axa' e = sy(1 - r2)2 . xa et ya sont les moyennes arithmétiques de x et de y.
Une fois les paramètres a, b (b = 10b') et e calculés, on présente le résultat sous la forme initiale du modèle avant transformation logaritmique: y = bxa + /- ke.
Exemple: Etudier la relation entre le revenu mensuel et le mode de déplacements des tunisois. Y'a-t-il une relation?. Quelle est son intensité et sa forme?.
|
Revenu D/mois |
% Marche à pied |
% T.C |
% Voiture |
|
15-20 |
82.5 |
16 |
0 |
|
20.30 |
75 |
22.5 |
0 |
|
30-40 |
69.5 |
26 |
0 |
|
40-80 |
60 |
32.5 |
2.6 |
|
80-100 |
54.5 |
33 |
6 |
|
100-140 |
50 |
32.5 |
7.6 |
|
140-200 |
45 |
31 |
12.5 |
|
200-300 |
39 |
25 |
20 |
|
300-400 |
36.3 |
5 |
30 |
|
400-500 |
32.5 |
21.5 |
37.5 |
|
500-800 |
28 |
17.2 |
53.5 |
|
800-1000 |
25 |
11 |
61.5 |
Source : District de Tunis. 1978, A Belhedi 1980, Géo & Développement, n°1.
Pour la marche à pied (2°colonne), l'examen du nuage de points montre une distribution dissymétrique en (i), ce qui milite en faveur de la loi de Pareto (y = a log x + b). La corrélation et la régression donnent les résultats suivants:
|
|
Moyenne |
Variance |
Ecart-type |
|
Marche à pied |
49.775 |
327.506 |
18.097 |
|
Revenu |
2.132 |
0.2916 |
0.54 |
|
Modèle: y = a log x + b |
Covariance : -9.725 Coefficient de corrélation r = -0.9951 Variance expliquée: r2 = 0.99 a = -33.3487 b = 120.874 Erreur-type: 1.782 Marche à pied = -33.35 log R + 120.874 Test Student: Tobs = a.sx (n - 2)1/2/e = -31.958 Test de Fisher : Fobs = (n - 1)r2:(1 - r2) = 1020.618 |
||
Quant à la voiture, on constate que le nuage de point dessine plutôt une courbe allométrique. On peut utiliser le modèle puissance: y = bxa. Il y a lieu donc d'utiliser le logarithmes des valeurs observées. Les résultats sont confinés dans le tableau suivant:
|
|
Moyenne |
Variance |
Ecart-type |
|
Marche à pied |
1.226 |
0.1458 |
0.3818 |
|
Revenu |
2.377 |
0.1458 |
0.3818 |
|
Modèle : y = bxa % Voit = b Rev a |
Covariance : 0.166 Coefficient de corrélation r = 0.9839 Variance expliquée: r2 = 0.9681 a = 1.13929 b = 0.032 Erreur-type : 0.0788 % Voiture = 0.032 Revenu 1.139 |
||
Exemple : Analyser la relation entre la densité des établissements à Tunis (Nb Etablissements /ha) en fonction de la distance ( d en m) au Centre-ville:
|
distance d |
200 |
300 |
400 |
500 |
600 |
700 |
800 |
900 |
1000 |
1100 |
1200 |
1300 |
1400 |
1500 |
|
Densité D |
69.7 |
35.5 |
26.4 |
25.2 |
17.2 |
12.3 |
8.7 |
7.9 |
7.6 |
4.7 |
4.1 |
2.9 |
2.4 |
2.06 |
L'examen du nuage de points montre que l'allure est de type allométriq: y = bxa. Les calculs nous donnent le résultat suivant : D = 57974.76 d-1.3625 avec r = - 0.96655 et r2 = 0.93422. La distance au centre explique ainsi 93.4% de la densité des établissements à Tunis. La forme de la relation rejles modèles d'allocation spatiale de la ville et se présente sous forme allométrique ce qui exprime un gradient lié à la distance et on retrouve ici le schéma gravitaire.
Exemple: Analyse de la relation entre l'urbanisation et le taux d'électrification en 1994. La relation est plutôt de type puissance avec r = 0.9408, la variance expliquée est de 88.5% et la relation s'écrit: E = 17.427U0.3916. La corrélation linéaire n'st que de 0.9228, soit 85.15%. L'erreur tye est de 4.06. Chaque fois que l'urbanisation augmente de 10% l'électrification augmente de 3.9%
|
Région |
Tu |
NE |
NO |
CE |
CO |
SE |
SO |
Moyenne |
Ecart type |
|
% Urbanisation |
92.1 |
58.7 |
34.4 |
69.5 |
29.5 |
61.9 |
66.4 |
19.80078 |
58.92857 |
|
% Electrification |
98.1 |
85.7 |
76.3 |
59.8 |
92.3 |
92 |
89.4 |
84.8 |
11.9738 |
Exemple: Analyse de la relation entre la motorisation et le niveau de dépense (DPA) en 1994. Le modèle puissance explique 64% avec une corrélation de 0.81 et une équation de Mot = 1.0233PA0.016 (la relation linéaire est de Mot = 0.01529 DPA +0.698 avec r = 0.7479 et r2 = 0.559). Chaque fois que le niveau de vie augmente de 10%, la motorisation progresse de 1.6%