Science des données - Écart-type des statistiques


Écart-type

L'écart type est un nombre qui décrit la répartition des observations.

Écart-type

Une fonction mathématique aura des difficultés à prédire des valeurs précises, si les observations sont "étalées". L'écart type est une mesure de l'incertitude.

Un écart-type faible signifie que la plupart des nombres sont proches de la valeur moyenne (moyenne).

Un écart-type élevé signifie que les valeurs sont réparties sur une plage plus large.

L'écart type est souvent représenté par le symbole Sigma : σ

Nous pouvons utiliser la std()fonction de Numpy pour trouver l'écart type d'une variable :

Exemple

import numpy as np

std = np.std(full_health_data)
print(std)

Le résultat:

Écart-type

Que signifient ces chiffres ?


Coefficient de variation

Le coefficient de variation est utilisé pour avoir une idée de la taille de l'écart type.

Mathématiquement, le coefficient de variation est défini comme :

Coefficient of Variation = Standard Deviation / Mean

 Nous pouvons le faire en Python si nous procédons avec le code suivant :

Exemple

import numpy as np

cv = np.std(full_health_data) / np.mean(full_health_data)
print(cv)

Le résultat:

Coefficient de variation

Nous voyons que les variables Durée, Calorie_Burnage et Hours_Work ont ​​un écart type élevé par rapport à Max_Pulse, Average_Pulse et Hours_Sleep.