Science des données - Qu'est-ce que les données ?


Qu'est-ce que les données ?

Les données sont une collection d'informations.

L'un des objectifs de la science des données est de structurer les données, de les rendre interprétables et faciles à utiliser.

Les données peuvent être classées en deux groupes :

  • Données structurées
  • Données non structurées

Données non structurées

Les données non structurées ne sont pas organisées. Nous devons organiser les données à des fins d'analyse.

Données non structurées

Données non structurées


Données structurées

Les données structurées sont organisées et plus faciles à utiliser.

Données structurées


Comment structurer les données ?

Nous pouvons utiliser un tableau ou une table de base de données pour structurer ou présenter des données.

Exemple de tableau :

[80, 85, 90, 95, 100, 105, 110, 115, 120, 125]

L'exemple suivant montre comment créer un tableau en Python :

Exemple

Array = [80, 85, 90, 95, 100, 105, 110, 115, 120, 125]
print(Array)

Il est courant de travailler avec de très grands ensembles de données en Data Science.

Dans ce tutoriel, nous allons essayer de rendre le plus simple possible la compréhension des concepts de Data Science. Nous allons donc travailler avec un petit jeu de données facile à interpréter.