Science des données - Introduction aux statistiques
Introduction aux statistiques
La statistique est la science de l'analyse des données.
Lorsque nous avons créé un modèle de prédiction, nous devons évaluer la fiabilité de la prédiction.
Après tout, que vaut une prédiction, si on ne peut pas s'y fier ?
Statistiques descriptives
Nous aborderons d'abord quelques statistiques descriptives de base.
Les statistiques descriptives résument les caractéristiques importantes d'un ensemble de données telles que :
- Compter
- Somme
- Écart-type
- Centile
- Moyenne
- Etc..
C'est un bon point de départ pour se familiariser avec les données.
Nous pouvons utiliser la describe()
fonction en Python pour résumer les données :
Exemple
print (full_health_data.describe())
Sortir:
Voyez-vous quelque chose d'intéressant ici?