Science des données - Introduction aux statistiques


Introduction aux statistiques

La statistique est la science de l'analyse des données.

Lorsque nous avons créé un modèle de prédiction, nous devons évaluer la fiabilité de la prédiction.

Après tout, que vaut une prédiction, si on ne peut pas s'y fier ?


Statistiques descriptives

Nous aborderons d'abord quelques statistiques descriptives de base.

Les statistiques descriptives résument les caractéristiques importantes d'un ensemble de données telles que :

  • Compter
  • Somme
  • Écart-type
  • Centile
  • Moyenne
  • Etc..

C'est un bon point de départ pour se familiariser avec les données.

Nous pouvons utiliser la describe()fonction en Python pour résumer les données :

Exemple

print (full_health_data.describe())

Sortir:

Statistique Décrire

Voyez-vous quelque chose d'intéressant ici?