Apprentissage automatique - Distribution normale des données
Répartition normale des données
Dans le chapitre précédent, nous avons appris à créer un tableau complètement aléatoire, d'une taille donnée, et entre deux valeurs données.
Dans ce chapitre, nous allons apprendre à créer un tableau où les valeurs sont concentrées autour d'une valeur donnée.
En théorie des probabilités, ce type de distribution de données est connu sous le nom de distribution de données normale ou distribution de données gaussienne , d'après le mathématicien Carl Friedrich Gauss qui a proposé la formule de cette distribution de données.
Exemple
Une distribution de données normale typique :
import numpy
import matplotlib.pyplot as plt
x =
numpy.random.normal(5.0, 1.0, 100000)
plt.hist(x, 100)
plt.show()
Résultat:
Remarque : Un graphique de distribution normale est également connu sous le nom de courbe en cloche en raison de sa forme caractéristique de cloche.
Histogramme expliqué
Nous utilisons le tableau de la numpy.random.normal()
méthode, avec 100000 valeurs, pour dessiner un histogramme avec 100 barres.
Nous spécifions que la valeur moyenne est de 5,0 et l'écart type est de 1,0.
Cela signifie que les valeurs doivent être concentrées autour de 5,0 et rarement plus éloignées que 1,0 de la moyenne.
Et comme vous pouvez le voir sur l'histogramme, la plupart des valeurs se situent entre 4,0 et 6,0, avec un sommet à environ 5,0.