Science des données - Qu'est-ce que les données ?
Qu'est-ce que les données ?
Les données sont une collection d'informations.
L'un des objectifs de la science des données est de structurer les données, de les rendre interprétables et faciles à utiliser.
Les données peuvent être classées en deux groupes :
- Données structurées
- Données non structurées
Données non structurées
Les données non structurées ne sont pas organisées. Nous devons organiser les données à des fins d'analyse.
Données structurées
Les données structurées sont organisées et plus faciles à utiliser.
Comment structurer les données ?
Nous pouvons utiliser un tableau ou une table de base de données pour structurer ou présenter des données.
Exemple de tableau :
[80, 85, 90, 95, 100, 105, 110, 115, 120, 125]
L'exemple suivant montre comment créer un tableau en Python :
Exemple
Array = [80, 85, 90, 95, 100, 105, 110, 115, 120, 125]
print(Array)
Il est courant de travailler avec de très grands ensembles de données en Data Science.
Dans ce tutoriel, nous allons essayer de rendre le plus simple possible la compréhension des concepts de Data Science. Nous allons donc travailler avec un petit jeu de données facile à interpréter.