ANALYSES logo_notes ET PAYSAGE

Minimum à savoir des statistiques

Statistiques, un minimum indispensable

Enquêtes en paysage, gestion de territoires, etc.

Avoir une idée claire des probabilités avant de faire des statistiques

Vous avez une pièce de monnaie ?

Le plus simple est de regarder la conférence vidéo du CRM "Pile ou face, et autres grandes questions de probabilité" de Jeffrey Rosenthal à rechercher dans iTune-U

Tout commence par une cueillette de données fiables

Fiable et éthiquement acceptable

La prise de données doit se faire en respectant des règles qui garantissent la fiabilité de la mesure mais aussi l'éthique des enquêtes.

Enquête d'une population

Avant de foncer pensez

Voici les principaux éléments pour lesquels ils faut se préparer

Les principaux indicateurs

Moyenne, Médiane, Mode, Étendue de distribution, Variance, Écart-type, Coefficient de corrélation

Les statistiques servent rarement à comprendre quoi que ce soit, mais sont utiles pour prédire les situations à explorer.

Mesures de tendance centrale

Mesures de dispersion

Données écart à la moyenne Carré des écarts à la moyenne
1 -3 9
1 -3 9
2 -2 4
3 -1 1
3 -1 1
5 1 1
5 1 1
5 1 1
7 3 9
8 4 16
-------- --------
Total 40 52
Moyenne - >45,2 <- varaiance
Racine carrée 2,28 <- écart-type

Dans une distribution normale (Gaussienne, en cloche) à une seule variable, la médiane est égale à la moyenne; 68,23% des effectifs sont compris entre la moyenne moins l'écart type et la moyenne plus l'écart type; 95,44% des effectifs sont compris entre la moyenne moins deux fois l'écart type et la moyenne plus deux fois l'écart type; 99,74% des effectifs sont compris entre la moyenne moins trois fois l'écart type et la moyenne plus trois fois l'écart type.

Corrélation entre deux séries de données

Donnée caractère X Donnée caractère Y Écart à la moyenne X Écart à la moyenne Y Produit des écarts à la moyenne
A 6 17 -17 -34 578
B 9 23 -14 -28 392
C 10 25 -13 -26 338
D 12 29 -11 -22 242
E 18 41 -5 -10 50
F 22 49 -1 -2 2
G 30 65 7 14 98
H 34 73 11 22 242
I 44 93 21 42 882
J 45 95 22 44 968
total 230 510 3792
moyenne 23 51 Covariance ->379,2
Écart-type 14,51 29,03 Coeficient de corrélation linéaire ->379,2/(14,51*29,03)=0,9

Le coeficient de corrélation de rang de Spearman (quand le nuage de points se tord) est égal à 1 moins 6 fois la moyenne des carrés des écarts de leur rang divisé par le cube de l'effectif moins l'effectif. Si des valeurs sont égales on fait la moyenne de leur rang. ex: valeurs {2;3;3;5;7} -> rang{1;2,5;2,5;4;5}
coef=1-(6*(moyenne((rang(X) - rang(Y))^2))/(n^3-n))

donnée X Donnée Y rang X rang Y rang X -rang Y carré de la différence de rang
17 2 1 1 0 0
20 3 2 2,5 -0,5 0,25
23 3 3 2,5 0,5 0,25
27 7 4 5 -1 1
5 30 5 5 4 -1 1
----- ----- ----- ----- ----- -----
Total 117 20 15 15 -2 2,5
Coeficient de Spearman =1-((6*0,5)/(5*5*5-5)) 0,875

Droite de régression. Idéal de la nature calculable et prévisible.

La droite de régression idéalise dans une fonction linéaire y=f(x) la relation entre les points.

 

Quelques références

pub