Science des données - Écart-type des statistiques
Écart-type
L'écart type est un nombre qui décrit la répartition des observations.
Une fonction mathématique aura des difficultés à prédire des valeurs précises, si les observations sont "étalées". L'écart type est une mesure de l'incertitude.
Un écart-type faible signifie que la plupart des nombres sont proches de la valeur moyenne (moyenne).
Un écart-type élevé signifie que les valeurs sont réparties sur une plage plus large.
L'écart type est souvent représenté par le symbole Sigma : σ
Nous pouvons utiliser la std()
fonction de Numpy pour trouver l'écart type d'une variable :
Exemple
import numpy as np
std = np.std(full_health_data)
print(std)
Le résultat:
Que signifient ces chiffres ?
Coefficient de variation
Le coefficient de variation est utilisé pour avoir une idée de la taille de l'écart type.
Mathématiquement, le coefficient de variation est défini comme :
Coefficient of Variation = Standard Deviation / Mean
Nous pouvons le faire en Python si nous procédons avec le code suivant :
Exemple
import numpy as np
cv = np.std(full_health_data) / np.mean(full_health_data)
print(cv)
Le résultat:
Nous voyons que les variables Durée, Calorie_Burnage et Hours_Work ont un écart type élevé par rapport à Max_Pulse, Average_Pulse et Hours_Sleep.