Introduction
Amor BELHEDI, FSHS, Université de Tunis
Statistique & Statistiques Statistique & connaissance scientifique Statistique & Géographie Quelques concepts de base
Introduction Présenter & Décrire une variable Réduire & Résumer une distribution Notions et Distributions de Probabilités Corrélation & Régression linéaire simple Corrélation & Régression simples courbes Test de Khi-deux Corrélation dans un tableau Chroniques & Distributions temporelles Corrélation & Régression multiples Droites des Moindres Rectangles Analyse Factorielle Classification & Typologie Tests des hypothèses Sondages & Distributions d'échantillonnage Quelques Eléments de calcul matriciel Tables Statistiques Papiers Fonctionnels Bibliographie Sommaire
La plupart des sciences ont, de nos jours, recours à l'outil statistique pour l'analyse et la structuration des données, vérifier certaines hypothèses de travail, interpréter les résultats obtenus par certaines techniques très élaborées et ou exploratoires. Ce recours à la statistique est tellement généralisé de nos jours que la nécessité de la statistique ne pose plus de problème.
1 - Statistiques et statistique
Généralement on confond la statistique au singulier avec les statistiques au pluriel alors que chacune relève d'une attitude différente.
1.1 - Les statistiques: l'attitude empirique et la pensée utilitaire
Les statistiques sont un ensemble de chiffres, et de valeurs relatifs à un phénomène donné sous forme de tableaux, listes ou graphiques. Elles expriment la multitude qui conduit toujours à un problème de numération et de dénombrement: le premier recensement est celui de J. César en l'an (0).
Les statistiques correspondent à une pensée utilitaire: un objectif militaire, stratégique ou fiscal qui a conduit souvent à élaborer les premières statistiques humaines. La rareté des ressources et les impératifs de planification ont exigé ensuite l'établissement de statistiques et de banques de données. Les statistiques correspondent donc à une attitude empirique.
Le terme status veut dire d'ailleurs: établir et constater, état et situation, Etat (dans le bas latin). L'Etat a donc vocation de connaître l'état des choses et des gens dont il est responsable. La connaissance d'une totalité multiforme nécessite une puissance totale et les premières statistiques ont été associées au mercantilisme: "la richesse est affaire d'Etat".
Le terme statistique a été proposé en 1748 par Achenwail à Gottingen, il a été reconnu par l'Académie Française en 1835.
1.2 - La statistique: l'attitude scientifique
La statistique est l'ensemble des méthodes servant à mesurer, organiser, analyser et interpréter les données, les observations, les expériences et les résultats. C'est la démarche qui permet de trouver l'ordre dans le désordre apparent: elle permet de :
- Dégager le général et le commun de ce qui est particulier et spécifique.
- Déterminer le mécanisme et la loi
- Atteindre une plus grande précision.
C'est l'ensemble des outils qui permettent de mieux quantifier pour bien qualifier.
La statistique constitue la méthode générale d'analyse des faits observés et collectés : les statistiques. C'est la méthode d'analyse des statistiques, qui constituent la matière première de toute analyse de la multitude.
2 - La statistique et la connaissance scientifique
Ce qu'on dit ici pour la géographie et le géographe peut être facilement généralisé sans grand risque d'erreur à toutes les autres disciplines à des nuances près et en tenant compte des spécificités disciplinaires qui utilisent telles méthodes plutôt que d'autres.
Notre formation de géographe, fait que nous allons traiter ici plutôt du rapport de la géographe à la statistique pour dégager son utilité et son apport; les spécialistes des autres disciplines peuvent opérer de la même manière en changeant un peu la problématique, les champs concernés ou les exemples utilisés.
2.1 - La Géographie comme exemple
L'exemple de la Géographie peut être facilement généralisé à la plupart des disciplines, à des nuances près qu'il toujours des problèmes spécifiques à chaque champ disciplinaire. La nécessité d'analyser les distributions spatiales : objet de la Géographie, fait que le géographe se trouve obligé d'utiliser la statistique pour :
- Atteindre une plus grande précision et dépasser la simple description et l'empirie.
- Pouvoir comparer mais pour cela faut-il mesurer?.
- Mieux qualifier les faits étudiés
Dans une première étape, on trouve la statistique descriptive qui est un
ensemble d'outils de description, de structuration des données et d'analyse des
résultats. L'usage de ces outils est devenu tellement généralisé et suffisamment
entré dans les moeurs pour être remis en cause: "c'est un outil nouveau pour un
vieil usage".
La Géographie étudie les relations spatiales, d'où le recours aux méthodes de corrélation et de régression pour dégager le degré et la forme des relations sous-jacentes, déterminer les facteurs de différenciation spatiale par l'analyse factorielle et élaborer des typologies .
Le Géographe est aussi amené à faire des enquêtes par sondage sur des échantillons pour pouvoir généraliser par la suite à l'ensemble de la population qu'il veut étudier d'où le recours à un certain nombre de méthodes d'inférence statistique .
Il a besoin de tester des hypothèses de travail ou vérifier une loi de distribution : c'est la statistique mathématique qui permet de tirer des conclusions générales à partir d'observations partielles: "C'est l'art de tirer le meilleur du moins bon en toute connaissance des risques" (H Guitton).
L'étude de la différenciation spatiale et des relations n'était pas explicite dans la démarche classique, l'outil statistique va permettre d'expliciter ce qui était implicite.
D'autre part, la comparaison constitue un autre aspect fondamental de la Géographie, or pour comparer il faut pouvoir mesurer et avec précision.
L'outil statistique constitue enfin le pont antre la théorie et le terrain, entre le modèle et l'observation, entre le mécanisme et les chiffres: c'est le laboratoire d'expérimentation des sciences sociales qui constitue l'instrument de base de la démarche déductive.
La décision nécessite la prévision et ne tolère par le positions floues et incertaines tandis que la certitude ne peut être que assurée que lorsqu'on dispose d'une référence et qu'on est en mesure de mesurer l'écart à cette référence. La statistique constitue alors un outil descriptif, explicatif et prévisionnel à la fois permettant la décision et l'action ce qui ouvre l'horizon du chercheur sur l'action, la planification, l'aménagement et la décision.
2.2 - Démarche et approches et nécessité de la statistique
La démarche progressive de l'analyse des données renferme au moins six(6)étapes quelque soit la discipline considérée et qu'on peut résumer dans ce qui suit :
1 - Collecter les données
2 - Structurer les informations, les décrire et les présenter
3 - Analyser les lois et les modèles de distributions des phénomènes et tester les hypothèses de distribution.
4 - Analyser les liens entre les variables et les phénomènes
5 - Découvrir les dimensions sous-jacentes à travers des données visibles, observables et mesurables
6 - Procéder à des classifications, des typologies et des régionalisations
Les différentes approches utilisées se résument aussi en cinq tâches fondamentales qu'on peut présenter comme suit:
1 - L'analyse des données et des informations et leur structuration
2 - L'explication et l'interprétation des résultats obtenus
3 - La prévision
4 - La décision
5 - L'action et l'intervention sur le réel.
Au cours de ces étapes et pour bien conduire ces tâches, le chercheur est appelé à utiliser l'outil statistique pour pouvoir répondre aux questions qu'il s'est posé implicitement ou d'une manière explicite.
3 - Quelques termes de base
Un certain nombre de termes se trouvent consacrés dans l'analyse de données et la statistique qu'il convient de connaître. On se limitera ici à quelques concepts de base nécessaires à la compréhension de la suite comme le termes de population, unité, caractère, modalité et variable:
Population : C'est un ensemble fini, mesurable, spécifié par un ou plusieurs caractères, composé d'éléments ou unités liés par des propriétés communes. C'est le cas par exemple de la population urbaine...
Individu, unité : C'est un élément de la population, défini par un ou plusieurs caractères.
Caractère : C'est la propriété commune à toutes les unités de la population.. Il représente une intensité (valeur) ou une nature (situation, état) variable. Il peut prendre des valeurs ou des modalités différentes.
Modalité : C'est une valeur ou une situation possibles prise par le caractère. La modalité peut prendre deux forme: qualitative et quantitative.
Variable statistique : C'est un caractère qui peut prendre des valeurs ou des modalités variables. Les différentes modalités d'un caractère forment la variable.
Elle peut prendre deux formes: qualitative et quantitative :
* Variable qualitative : Le caractère décrit une situation et un état. Il peut être de différentes formes:
- Ordinale : elle exprime un ordre. C'est le cas de grande ville, ville moyenne, petite ville, village, hameau, Douar...
- Nominale: Elle appelle les individus par leur nom, c'est le cas de la liste des villes: Tunis, Sfax, Gabès..
- Naturelle ou cardinale: : Elle exprime la nature des phénomènes comme la couleur...
- Binaire : on a deux modalités seulement: présence et absence, oui et non...
* Variable quantitative: Le caractère exprime l'intensité d'un phénomène ou d'un processus, on a une valeur. Elle prend deux formes :
- Continue: le caractère peut prendre toutes les valeurs d'un intervalle. Elle est mesurable. C'est le cas de la taille, du poids, de la surface...
- Discrète : le caractère prend des valeurs isolées et entières. Il est comptable,c'est le cas de la taille du ménage ou du nombre d'enfants....
Selon le type de variable, la manière de présenter les données sous forme de tableau ou de graphique diffère, c'est pourquoi il faut connaître toujours la nature de la variable qu'on étudie (cf. Chapitre de l'analyse univariée).
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|