Science des données - Tracé de fonctions linéaires


L'ensemble de données de la montre de sport

Jetez un œil à notre ensemble de données sur la santé :

Durée Pouls_moyen Max_Pulse Calorie_burnage Heures_travail Heures_Sommeil
30 80 120 240 dix sept
30 85 120 250 dix sept
45 90 130 260 8 sept
45 95 130 270 8 sept
45 100 140 280 0 sept
60 105 140 290 sept 8
60 110 145 300 sept 8
60 115 145 310 8 8
75 120 150 320 0 8
75 125 150 330 8 8

Tracer les données existantes en Python

Maintenant, nous pouvons d'abord tracer les valeurs de Average_Pulse contre Calorie_Burnage en utilisant la bibliothèque matplotlib.

La plot()fonction est utilisée pour créer un graphique de regroupement hexagonal 2D de points x, y :

Exemple

import matplotlib.pyplot as plt

health_data.plot(x ='Average_Pulse', y='Calorie_Burnage', kind='line'),
plt.ylim(ymin=0)
plt.xlim(xmin=0)

plt.show()

Exemple expliqué

  • Importer le module pyplot de la bibliothèque matplotlib
  • Tracez les données de Average_Pulse contre Calorie_Burnage
  • kind='line'nous dit quel type de parcelle nous voulons. Ici, on veut avoir une ligne droite
  • plt.ylim() et plt.xlim() nous indiquent à quelle valeur nous voulons que l'axe commence. Ici, nous voulons que l'axe commence à zéro
  • plt.show() nous montre la sortie

Le code ci-dessus produira le résultat suivant :

Fonction linéaire

La sortie graphique

Comme nous pouvons le voir, il existe une relation entre Average_Pulse et Calorie_Burnage. Calorie_Burnage augmente proportionnellement avec Average_Pulse. Cela signifie que nous pouvons utiliser Average_Pulse pour prédire Calorie_Burnage.



Pourquoi la ligne n'est-elle pas entièrement tracée jusqu'à l'axe des y ?

La raison en est que nous n'avons pas d'observations où Average_Pulse ou Calorie_Burnage sont égaux à zéro. 80 est la première observation de Average_Pulse et 240 est la première observation de Calorie_Burnage.

Fonction linéaire

Regardez la ligne. Qu'advient-il de la dépense calorique si le pouls moyen passe de 80 à 90 ?

Fonction linéaire

Nous pouvons utiliser la ligne diagonale pour trouver la fonction mathématique permettant de prédire la dépense calorique.

Comme il s'avère:

  • Si le pouls moyen est de 80, la dépense calorique est de 240
  • Si le pouls moyen est de 90, la dépense calorique est de 260
  • Si le pouls moyen est de 100, la dépense calorique est de 280

Il y a un modèle. Si le pouls moyen augmente de 10, la dépense calorique augmente de 20.