Minimum à savoir des statistiques
Enquêtes en paysage, gestion de territoires, etc.
Vous avez une pièce de monnaie ?
Le plus simple est de regarder la conférence vidéo du CRM "Pile ou face, et autres grandes questions de probabilité" de Jeffrey Rosenthal à rechercher dans iTune-U
Fiable et éthiquement acceptable
La prise de données doit se faire en respectant des règles qui garantissent la fiabilité de la mesure mais aussi l'éthique des enquêtes.
Avant de foncer pensez
Voici les principaux éléments pour lesquels ils faut se préparer
Moyenne, Médiane, Mode, Étendue de distribution, Variance, Écart-type, Coefficient de corrélation
Les statistiques servent rarement à comprendre quoi que ce soit, mais sont utiles pour prédire les situations à explorer.
Données | écart à la moyenne | Carré des écarts à la moyenne | |
1 | -3 | 9 | |
1 | -3 | 9 | |
2 | -2 | 4 | |
3 | -1 | 1 | |
3 | -1 | 1 | |
5 | 1 | 1 | |
5 | 1 | 1 | |
5 | 1 | 1 | |
7 | 3 | 9 | |
8 | 4 | 16 | |
-------- | -------- | ||
Total | 40 | 52 | |
Moyenne - > | 4 | 5,2 <- varaiance | |
Racine carrée | 2,28 <- écart-type |
Dans une distribution normale (Gaussienne, en cloche) à une seule variable, la médiane est égale à la moyenne; 68,23% des effectifs sont compris entre la moyenne moins l'écart type et la moyenne plus l'écart type; 95,44% des effectifs sont compris entre la moyenne moins deux fois l'écart type et la moyenne plus deux fois l'écart type; 99,74% des effectifs sont compris entre la moyenne moins trois fois l'écart type et la moyenne plus trois fois l'écart type.
Donnée caractère X | Donnée caractère Y | Écart à la moyenne X | Écart à la moyenne Y | Produit des écarts à la moyenne | |
A | 6 | 17 | -17 | -34 | 578 |
B | 9 | 23 | -14 | -28 | 392 |
C | 10 | 25 | -13 | -26 | 338 |
D | 12 | 29 | -11 | -22 | 242 |
E | 18 | 41 | -5 | -10 | 50 |
F | 22 | 49 | -1 | -2 | 2 |
G | 30 | 65 | 7 | 14 | 98 |
H | 34 | 73 | 11 | 22 | 242 |
I | 44 | 93 | 21 | 42 | 882 |
J | 45 | 95 | 22 | 44 | 968 |
total | 230 | 510 | 3792 | ||
moyenne | 23 | 51 | Covariance -> | 379,2 | |
Écart-type | 14,51 | 29,03 | Coeficient de corrélation linéaire -> | 379,2/(14,51*29,03)=0,9 |
Le coeficient de corrélation de rang de Spearman (quand le nuage de points se tord) est égal à 1 moins 6 fois la moyenne des carrés des écarts de leur rang divisé par le cube de l'effectif moins l'effectif. Si des valeurs sont égales on fait la moyenne de leur rang. ex: valeurs {2;3;3;5;7} -> rang{1;2,5;2,5;4;5}
coef=1-(6*(moyenne((rang(X) - rang(Y))^2))/(n^3-n))
donnée X | Donnée Y | rang X | rang Y | rang X -rang Y | carré de la différence de rang | |
17 | 2 | 1 | 1 | 0 | 0 | |
20 | 3 | 2 | 2,5 | -0,5 | 0,25 | |
23 | 3 | 3 | 2,5 | 0,5 | 0,25 | |
27 | 7 | 4 | 5 | -1 | 1 | |
5 | 30 | 5 | 5 | 4 | -1 | 1 |
----- | ----- | ----- | ----- | ----- | ----- | |
Total | 117 | 20 | 15 | 15 | -2 | 2,5 |
Coeficient de Spearman =1-((6*0,5)/(5*5*5-5)) | 0,875 |
La droite de régression idéalise dans une fonction linéaire y=f(x) la relation entre les points.