Science des données - Centiles statistiques
25 %, 50 % et 75 % - Centiles
Les centiles sont utilisés dans les statistiques pour vous donner un nombre qui décrit la valeur à laquelle un pourcentage donné des valeurs est inférieur.
Essayons de l'expliquer par quelques exemples, en utilisant Average_Pulse.
- Le centile 25 % de Average_Pulse signifie que 25 % de toutes les séances d'entraînement ont un pouls moyen de 100 battements par minute ou moins. Si nous renversons l'énoncé, cela signifie que 75 % de toutes les séances d'entraînement ont un pouls moyen de 100 battements par minute ou plus.
- Le centile à 75 % de Average_Pulse signifie que 75 % de toutes les séances d'entraînement ont un pouls moyen de 111 ou moins. Si nous renversons l'énoncé, cela signifie que 25 % de toutes les séances d'entraînement ont un pouls moyen de 111 battements par minute ou plus.
Tâche : trouver le centile de 10 % pour Max_Pulse
L'exemple suivant montre comment le faire en Python :
Exemple
import numpy as np
Max_Pulse= full_health_data["Max_Pulse"]
percentile10 = np.percentile(Max_Pulse, 10)
print(percentile10)
- Max_Pulse = full_health_data["Max_Pulse"] - Isolez la variable Max_Pulse de l'ensemble complet de données de santé.
- np.percentile() est utilisé pour définir que nous voulons le centile de 10 % de Max_Pulse.
Le centile à 10 % de Max_Pulse est de 120. Cela signifie que 10 % de toutes les séances d'entraînement ont un Max_Pulse de 120 ou moins.