Science des données - Fonctions linéaires


Les fonctions mathématiques sont importantes à connaître en tant que data scientist, car nous voulons faire des prédictions et les interpréter.


Fonctions linéaires

En mathématiques, une fonction est utilisée pour relier une variable à une autre variable.

Supposons que nous considérions la relation entre la dépense calorique et le pouls moyen. Il est raisonnable de supposer qu'en général, la dépense calorique changera à mesure que le pouls moyen change - nous disons que la dépense calorique dépend du pouls moyen.

De plus, il peut être raisonnable de supposer qu'à mesure que le pouls moyen augmente, la dépense calorique augmentera également. La dépense calorique et le pouls moyen sont les deux variables considérées.

Comme la dépense calorique dépend du pouls moyen, nous disons que la dépense calorique est la variable dépendante et que le pouls moyen est la variable indépendante.

La relation entre une variable dépendante et une variable indépendante peut souvent être exprimée mathématiquement à l'aide d'une formule (fonction).

Une fonction linéaire a une variable indépendante (x) et une variable dépendante (y), et a la forme suivante :

y = f(x) = ax + b

Cette fonction est utilisée pour calculer une valeur pour la variable dépendante lorsque nous choisissons une valeur pour la variable indépendante.

Explication:

  • f(x) = la sortie (la variable dépendante)
  • x = l'entrée (la variable indépendante)
  • a = pente = est le coefficient de la variable indépendante. Il donne le taux de variation de la variable dépendante
  • b = intercept = est la valeur de la variable dépendante lorsque x = 0. C'est aussi le point où la ligne diagonale croise l'axe vertical.


Fonction linéaire avec une variable explicative

Une fonction avec une variable explicative signifie que nous utilisons une variable pour la prédiction.

Disons que nous voulons prédire la dépense calorique en utilisant le pouls moyen. Nous avons la formule suivante :  

f(x) = 2x + 80

Ici, les nombres et les variables signifient :

  • f(x) = La sortie. Ce nombre est l'endroit où nous obtenons la valeur prédite de Calorie_Burnage
  • x = L'entrée, qui est Average_Pulse
  • 2 = Pente = Spécifie de combien Calorie_Burnage augmente si Average_Pulse augmente de un. Il nous indique à quel point la ligne diagonale est "raide"
  • 80 = Interception = Une valeur fixe. C'est la valeur de la variable dépendante lorsque x = 0

Tracer une fonction linéaire

Le terme linéarité signifie une "ligne droite". Ainsi, si vous affichez graphiquement une fonction linéaire, la ligne sera toujours une ligne droite. La ligne peut être inclinée vers le haut, vers le bas et, dans certains cas, peut être horizontale ou verticale.

Voici une représentation graphique de la fonction mathématique ci-dessus :

Fonction linéaire

Explications du graphique :

  • L'axe horizontal est généralement appelé l'axe des abscisses. Ici, il représente Average_Pulse.
  • L'axe vertical est généralement appelé l'axe des ordonnées. Ici, il représente Calorie_Burnage.
  • Calorie_Burnage est une fonction de Average_Pulse, car Calorie_Burnage est supposé dépendre de Average_Pulse.
  • En d'autres termes, nous utilisons Average_Pulse pour prédire Calorie_Burnage.
  • La ligne bleue (diagonale) représente la structure de la fonction mathématique qui prédit la dépense calorique.