Science des données - Table de base de données
Tableau de base de données
Une table de base de données est une table avec des données structurées.
Le tableau suivant présente une table de base de données avec des données de santé extraites d'une montre de sport :
Durée | Pouls_moyen | Max_Pulse | Calorie_burnage | Heures_travail | Heures_Sommeil |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | dix | sept |
30 | 85 | 120 | 250 | dix | sept |
45 | 90 | 130 | 260 | 8 | sept |
45 | 95 | 130 | 270 | 8 | sept |
45 | 100 | 140 | 280 | 0 | sept |
60 | 105 | 140 | 290 | sept | 8 |
60 | 110 | 145 | 300 | sept | 8 |
60 | 115 | 145 | 310 | 8 | 8 |
75 | 120 | 150 | 320 | 0 | 8 |
75 | 125 | 150 | 330 | 8 | 8 |
Cet ensemble de données contient des informations sur une séance d'entraînement typique, telles que la durée, le pouls moyen, la dépense calorique, etc.
Structure des tables de la base de données
Une table de base de données se compose de colonne(s) et de ligne(s) :
Colonne 1 | Colonne 2 | Colonne 3 | Colonne 4 | Colonne 5 | Colonne 6 | |
Durée | Pouls_moyen | Max_Pulse | Calorie_burnage | Heures_travail | Heures_Sommeil | |
---|---|---|---|---|---|---|
Rangée 1 | 30 | 80 | 120 | 240 | dix | sept |
Rangée 2 | 30 | 85 | 120 | 250 | dix | sept |
Rangée 3 | 45 | 90 | 130 | 260 | 8 | sept |
Rangée 4 | 45 | 95 | 130 | 270 | 8 | sept |
Rangée 5 | 45 | 100 | 140 | 280 | 0 | sept |
Rangée 6 | 60 | 105 | 140 | 290 | sept | 8 |
Rangée 7 | 60 | 110 | 145 | 300 | sept | 8 |
Ligne 8 | 60 | 115 | 145 | 310 | 8 | 8 |
Rangée 9 | 75 | 120 | 150 | 320 | 0 | 8 |
Rangée 10 | 75 | 125 | 150 | 330 | 8 | 8 |
Une ligne est une représentation horizontale des données.
Une colonne est une représentation verticale de données.
variables
Une variable est définie comme quelque chose qui peut être mesuré ou compté.
Les exemples peuvent être des caractères, des nombres ou l'heure.
Dans l'exemple ci-dessous, nous pouvons observer que chaque colonne représente une variable.
Durée | Pouls_moyen | Max_Pulse | Calorie_burnage | Heures_travail | Heures_Sommeil |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | dix | sept |
30 | 85 | 120 | 250 | dix | sept |
45 | 90 | 130 | 260 | 8 | sept |
45 | 95 | 130 | 270 | 8 | sept |
45 | 100 | 140 | 280 | 0 | sept |
60 | 105 | 140 | 290 | sept | 8 |
60 | 110 | 145 | 300 | sept | 8 |
60 | 115 | 145 | 310 | 8 | 8 |
75 | 120 | 150 | 320 | 0 | 8 |
75 | 125 | 150 | 330 | 8 | 8 |
Il y a 6 colonnes, ce qui signifie qu'il y a 6 variables (Duration, Average_Pulse, Max_Pulse, Calorie_Burnage, Hours_Work, Hours_Sleep).
Il y a 11 lignes, ce qui signifie que chaque variable a 10 observations.
Mais s'il y a 11 lignes, comment se fait-il qu'il n'y ait que 10 observations ?
C'est parce que la première ligne est l'étiquette, ce qui signifie qu'il s'agit du nom de la variable.