Science des données - Tracé de fonctions linéaires
L'ensemble de données de la montre de sport
Jetez un œil à notre ensemble de données sur la santé :
Durée | Pouls_moyen | Max_Pulse | Calorie_burnage | Heures_travail | Heures_Sommeil |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | dix | sept |
30 | 85 | 120 | 250 | dix | sept |
45 | 90 | 130 | 260 | 8 | sept |
45 | 95 | 130 | 270 | 8 | sept |
45 | 100 | 140 | 280 | 0 | sept |
60 | 105 | 140 | 290 | sept | 8 |
60 | 110 | 145 | 300 | sept | 8 |
60 | 115 | 145 | 310 | 8 | 8 |
75 | 120 | 150 | 320 | 0 | 8 |
75 | 125 | 150 | 330 | 8 | 8 |
Tracer les données existantes en Python
Maintenant, nous pouvons d'abord tracer les valeurs de Average_Pulse contre Calorie_Burnage en utilisant la bibliothèque matplotlib.
La plot()
fonction est utilisée pour créer un graphique de regroupement hexagonal 2D de points x, y :
Exemple
import matplotlib.pyplot as plt
health_data.plot(x ='Average_Pulse',
y='Calorie_Burnage', kind='line'),
plt.ylim(ymin=0)
plt.xlim(xmin=0)
plt.show()
Exemple expliqué
- Importer le module pyplot de la bibliothèque matplotlib
- Tracez les données de Average_Pulse contre Calorie_Burnage
kind='line'
nous dit quel type de parcelle nous voulons. Ici, on veut avoir une ligne droite- plt.ylim() et plt.xlim() nous indiquent à quelle valeur nous voulons que l'axe commence. Ici, nous voulons que l'axe commence à zéro
- plt.show() nous montre la sortie
Le code ci-dessus produira le résultat suivant :
La sortie graphique
Comme nous pouvons le voir, il existe une relation entre Average_Pulse et Calorie_Burnage. Calorie_Burnage augmente proportionnellement avec Average_Pulse. Cela signifie que nous pouvons utiliser Average_Pulse pour prédire Calorie_Burnage.
Pourquoi la ligne n'est-elle pas entièrement tracée jusqu'à l'axe des y ?
La raison en est que nous n'avons pas d'observations où Average_Pulse ou Calorie_Burnage sont égaux à zéro. 80 est la première observation de Average_Pulse et 240 est la première observation de Calorie_Burnage.
Regardez la ligne. Qu'advient-il de la dépense calorique si le pouls moyen passe de 80 à 90 ?
Nous pouvons utiliser la ligne diagonale pour trouver la fonction mathématique permettant de prédire la dépense calorique.
Comme il s'avère:
- Si le pouls moyen est de 80, la dépense calorique est de 240
- Si le pouls moyen est de 90, la dépense calorique est de 260
- Si le pouls moyen est de 100, la dépense calorique est de 280
Il y a un modèle. Si le pouls moyen augmente de 10, la dépense calorique augmente de 20.