Fonctions de science des données


Ce chapitre présente trois fonctions couramment utilisées lors de l'utilisation de Data Science : max(), min() et mean().


L'ensemble de données de la montre de sport

Durée Pouls_moyen Max_Pulse Calorie_burnage Heures_travail Heures_Sommeil
30 80 120 240 dix sept
30 85 120 250 dix sept
45 90 130 260 8 sept
45 95 130 270 8 sept
45 100 140 280 0 sept
60 105 140 290 sept 8
60 110 145 300 sept 8
60 115 145 310 8 8
75 120 150 320 0 8
75 125 150 330 8 8

L'ensemble de données ci-dessus se compose de 6 variables, chacune avec 10 observations :

  • Durée - Combien de temps a duré la séance d'entraînement en minutes ?
  • Average_Pulse - Quel était le pouls moyen de la séance d'entraînement ? Ceci est mesuré en battements par minute
  • Max_Pulse - Quel était le pouls maximum de la séance d'entraînement ?
  • Calorie_Burnage - Combien de calories ont été brûlées pendant la séance d'entraînement ?
  • Hours_Work - Combien d'heures avons-nous travaillé à notre travail avant la session de formation ?
  • Hours_Sleep - Combien avons-nous dormi la nuit avant la séance d'entraînement ?

Nous utilisons le trait de soulignement (_) pour séparer les chaînes car Python ne peut pas lire l'espace comme séparateur.



La fonction max()

La fonction Python max()est utilisée pour trouver la valeur la plus élevée dans un tableau.

Exemple

Average_pulse_max = max(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)

print (Average_pulse_max)

La fonction min()

La fonction Python min()est utilisée pour trouver la valeur la plus basse dans un tableau.

Exemple

Average_pulse_min = min(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)

print (Average_pulse_min)

La fonction moyenne()

La fonction NumPy mean()est utilisée pour trouver la valeur moyenne d'un tableau.

Exemple

import numpy as np

Calorie_burnage = [240, 250, 260, 270, 280, 290, 300, 310, 320, 330]

Average_calorie_burnage = np.mean(Calorie_burnage)

print(Average_calorie_burnage)

Nous écrivons np. devant mean pour faire savoir à Python que nous voulons activer la fonction mean de la bibliothèque Numpy .