Science des données - Table de base de données


Tableau de base de données

Une table de base de données est une table avec des données structurées.

Le tableau suivant présente une table de base de données avec des données de santé extraites d'une montre de sport :

Durée Pouls_moyen Max_Pulse Calorie_burnage Heures_travail Heures_Sommeil
30 80 120 240 dix sept
30 85 120 250 dix sept
45 90 130 260 8 sept
45 95 130 270 8 sept
45 100 140 280 0 sept
60 105 140 290 sept 8
60 110 145 300 sept 8
60 115 145 310 8 8
75 120 150 320 0 8
75 125 150 330 8 8

Cet ensemble de données contient des informations sur une séance d'entraînement typique, telles que la durée, le pouls moyen, la dépense calorique, etc.


Structure des tables de la base de données

Une table de base de données se compose de colonne(s) et de ligne(s) :

Colonne 1 Colonne 2 Colonne 3 Colonne 4 Colonne 5 Colonne 6
Durée Pouls_moyen Max_Pulse Calorie_burnage Heures_travail Heures_Sommeil
Rangée 1 30 80 120 240 dix sept
Rangée 2 30 85 120 250 dix sept
Rangée 3 45 90 130 260 8 sept
Rangée 4 45 95 130 270 8 sept
Rangée 5 45 100 140 280 0 sept
Rangée 6 60 105 140 290 sept 8
Rangée 7 60 110 145 300 sept 8
Ligne 8 60 115 145 310 8 8
Rangée 9 75 120 150 320 0 8
Rangée 10 75 125 150 330 8 8

Une ligne est une représentation horizontale des données.

Une colonne est une représentation verticale de données.


variables

Une variable est définie comme quelque chose qui peut être mesuré ou compté.

Les exemples peuvent être des caractères, des nombres ou l'heure.

Dans l'exemple ci-dessous, nous pouvons observer que chaque colonne représente une variable.

Durée Pouls_moyen Max_Pulse Calorie_burnage Heures_travail Heures_Sommeil
30 80 120 240 dix sept
30 85 120 250 dix sept
45 90 130 260 8 sept
45 95 130 270 8 sept
45 100 140 280 0 sept
60 105 140 290 sept 8
60 110 145 300 sept 8
60 115 145 310 8 8
75 120 150 320 0 8
75 125 150 330 8 8

Il y a 6 colonnes, ce qui signifie qu'il y a 6 variables (Duration, Average_Pulse, Max_Pulse, Calorie_Burnage, Hours_Work, Hours_Sleep).

Il y a 11 lignes, ce qui signifie que chaque variable a 10 observations.

Mais s'il y a 11 lignes, comment se fait-il qu'il n'y ait que 10 observations ?

C'est parce que la première ligne est l'étiquette, ce qui signifie qu'il s'agit du nom de la variable.