Nuage de points R


Nuages ​​de points

Vous avez appris du chapitre Plot que la plot()fonction est utilisée pour tracer des nombres les uns par rapport aux autres.

Un "nuage de points" est un type de graphique utilisé pour afficher la relation entre deux variables numériques et trace un point pour chaque observation.

Il a besoin de deux vecteurs de même longueur, un pour l'axe des x (horizontal) et un pour l'axe des y (vertical):

Exemple

x <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y <- c(99,86,87,88,111,103,87,94,78,77,85,86)

plot(x, y)

Résultat:

L'observation dans l'exemple ci-dessus devrait montrer le résultat de 12 voitures qui passent.

Cela peut ne pas être clair pour quelqu'un qui voit le graphique pour la première fois, alors ajoutons un en-tête et différentes étiquettes pour mieux décrire le nuage de points :

Exemple

x <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y <- c(99,86,87,88,111,103,87,94,78,77,85,86)

plot(x, y, main="Observation of Cars", xlab="Car age", ylab="Car speed")

Résultat:

Pour récapituler, l'observation dans l'exemple ci-dessus est le résultat du passage de 12 voitures.

L' axe des abscisses indique l'âge de la voiture.

L' axe des ordonnées indique la vitesse de la voiture lors de son passage.

Existe-t-il des relations entre les observations ?

Il semble que plus la voiture est récente, plus elle roule vite, mais cela pourrait être une coïncidence, après tout, nous n'avons enregistré que 12 voitures.


Comparer les parcelles

Dans l'exemple ci-dessus, il semble y avoir une relation entre la vitesse de la voiture et son âge, mais que se passe-t-il si nous traçons également les observations d'un autre jour ? Le nuage de points nous dira-t-il autre chose ?

Pour comparer le tracé avec un autre tracé, utilisez la points()fonction :

Exemple

Dessinez deux tracés sur la même figure :

# day one, the age and speed of 12 cars:
x1 <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y1 <- c(99,86,87,88,111,103,87,94,78,77,85,86)

# day two, the age and speed of 15 cars:
x2 <- c(2,2,8,1,15,8,12,9,7,3,11,4,7,14,12)
y2 <- c(100,105,84,105,90,99,90,95,94,100,79,112,91,80,85)

plot(x1, y1, main="Observation of Cars", xlab="Car age", ylab="Car speed", col="red", cex=2)
points(x2, y2, col="blue", cex=2)

Résultat:

Remarque : Pour pouvoir voir la différence de la comparaison, vous devez attribuer des couleurs différentes aux tracés (en utilisant le colparamètre ). Le rouge représente les valeurs du jour 1, tandis que le bleu représente le jour 2. Notez que nous avons également ajouté le cexparamètre pour augmenter la taille des points.

Conclusion de l'observation : En comparant les deux tracés, je pense qu'il est prudent de dire qu'ils nous donnent tous les deux la même conclusion : plus la voiture est récente, plus elle roule vite.