Apprentissage automatique - Écart type
Qu'est-ce que l'écart type ?
L'écart type est un nombre qui décrit la répartition des valeurs.
Un écart-type faible signifie que la plupart des nombres sont proches de la valeur moyenne (moyenne).
Un écart-type élevé signifie que les valeurs sont réparties sur une plage plus large.
Exemple : Cette fois, nous avons enregistré la vitesse de 7 voitures :
speed = [86,87,88,86,87,85,86]
L'écart type est :
0.9
Cela signifie que la plupart des valeurs se situent dans la plage de 0,9 par rapport à la valeur moyenne, qui est de 86,4.
Faisons de même avec une sélection de nombres avec une plage plus large :
speed = [32,111,138,28,59,77,97]
L'écart type est :
37.85
Cela signifie que la plupart des valeurs se situent dans la plage de 37,85 par rapport à la valeur moyenne, qui est de 77,4.
Comme vous pouvez le constater, un écart type plus élevé indique que les valeurs sont réparties sur une plage plus large.
Le module NumPy a une méthode pour calculer l'écart type :
Exemple
Utilisez la méthode NumPy std()
pour trouver l'écart type :
import numpy
speed = [86,87,88,86,87,85,86]
x = numpy.std(speed)
print(x)
Exemple
import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.std(speed)
print(x)
Variance
La variance est un autre nombre qui indique à quel point les valeurs sont réparties.
En fait, si vous prenez la racine carrée de la variance, vous obtenez l'écart type !
Ou à l'inverse, si vous multipliez l'écart-type par lui-même, vous obtenez la variance !
Pour calculer la variance, vous devez procéder comme suit :
1. Trouvez la moyenne :
(32+111+138+28+59+77+97) / 7 = 77.4
2. Pour chaque valeur : trouvez la différence par rapport à la moyenne :
32 - 77.4 = -45.4
111 - 77.4 = 33.6
138
- 77.4 = 60.6
28 - 77.4 = -49.4
59 - 77.4 = -18.4
77
- 77.4 = - 0.4
97 - 77.4 = 19.6
3. Pour chaque différence : trouvez la valeur au carré :
(-45.4)2 = 2061.16
(33.6)2 = 1128.96
(60.6)2 = 3672.36
(-49.4)2 = 2440.36
(-18.4)2 = 338.56
(- 0.4)2 = 0.16
(19.6)2 = 384.16
4. La variance est le nombre moyen de ces différences au carré :
(2061.16+1128.96+3672.36+2440.36+338.56+0.16+384.16)
/ 7 = 1432.2
Heureusement, NumPy a une méthode pour calculer la variance :
Exemple
Utilisez la méthode NumPy var()
pour trouver la variance :
import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.var(speed)
print(x)
Écart-type
Comme nous l'avons appris, la formule pour trouver l'écart type est la racine carrée de la variance :
√1432.25 = 37.85
Ou, comme dans l'exemple précédent, utilisez le NumPy pour calculer l'écart type :
Exemple
Utilisez la méthode NumPy std()
pour trouver l'écart type :
import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.std(speed)
print(x)
Symboles
L'écart type est souvent représenté par le symbole Sigma : σ
La variance est souvent représentée par le symbole Sigma Square : σ 2
Résumé du chapitre
L'écart type et la variance sont des termes souvent utilisés dans l'apprentissage automatique, il est donc important de comprendre comment les obtenir et le concept qui les sous-tend.