Tutoriel Python

Python ACCUEIL Introduction à Python Python pour commencer Syntaxe Python Commentaires Python Variables Python Types de données Python Nombres Python Casting Python Chaînes Python Booléens Python Opérateurs Python Listes Python Tuples Python Ensembles Python Dictionnaires Python Python Si... Sinon Boucles tant que Python Python pour les boucles Fonctions Python Python Lambda Tableaux Python Classes/Objets Python Héritage Python Itérateurs Python Portée Python Modules Python Dates Python Mathématiques Python PythonJSON Python RegEx PIP Python Python Essayer... Sauf Entrée utilisateur Python Formatage de chaîne Python

La gestion des fichiers

Gestion des fichiers Python Fichiers de lecture Python Python écrire/créer des fichiers Python Supprimer des fichiers

Modules Python

Tutoriel NumPy Procédure pas à pas Panda Tutoriel Scipy

Python Matplotlib

Introduction à Matplotlib Matplotlib Commencer MatplotlibPyplot Tracé Matplotlib Marqueurs Matplotlib Ligne Matplotlib Étiquettes Matplotlib Grille Matplotlib Sous-parcelles Matplotlib Matplotlib Scatter Barres Matplotlib Histogrammes Matplotlib Graphiques à secteurs Matplotlib

Apprentissage automatique

Commencer Mode médian moyen Écart-type Centile Diffusion des données Répartition normale des données Nuage de points Régression linéaire Régression polynomiale Régression multiple Échelle Former/Tester Arbre de décision

Python MySQL

MySQL Premiers pas Créer une base de données MySQL Créer une table MySQL Insertion MySQL Sélectionnez MySQL MySQL Où Trier MySQL par Supprimer MySQL Table de dépôt MySQL Mise à jour MySQL Limite MySQL Rejoindre MySQL

Python MongoDB

MongoDB Commencer MongoDB Créer une base de données Créer une collection MongoDB Insertion MongoDB Trouver MongoDB Requête MongoDB Tri MongoDB Supprimer MongoDB Collection de dépôt MongoDB Mise à jour MongoDB Limite MongoDB

Référence Python

Présentation de Python Fonctions intégrées Python Méthodes de chaîne Python Méthodes de liste Python Méthodes du dictionnaire Python Méthodes Python Tuple Méthodes d'ensemble Python Méthodes de fichier Python Mots-clés Python Exceptions Python Glossaire Python

Référence des modules

Module aléatoire Module de demandes Module Statistiques Module de mathématiques Module cMath

Python Comment

Supprimer les doublons de liste Inverser une chaîne Additionner deux nombres

Exemples Python

Exemples Python Compilateur Python Exercices Python Quizz Python Certificat Python

Apprentissage automatique - Nuage de points


Nuage de points

Un nuage de points est un diagramme dans lequel chaque valeur de l'ensemble de données est représentée par un point.

Le module Matplotlib a une méthode pour dessiner des nuages ​​de points, il a besoin de deux tableaux de même longueur, un pour les valeurs de l'axe des x et un pour les valeurs de l'axe des y :

x = [5,7,8,7,2,17,2,9,4,11,12,9,6]

y = [99,86,87,88,111,86,103,87,94,78,77,85,86]

Le xtableau représente l'âge de chaque voiture.

Le ytableau représente la vitesse de chaque voiture.

Exemple

Utilisez la scatter()méthode pour dessiner un diagramme de nuage de points :

import matplotlib.pyplot as plt

x = [5,7,8,7,2,17,2,9,4,11,12,9,6]
y = [99,86,87,88,111,86,103,87,94,78,77,85,86]

plt.scatter(x, y)
plt.show()

Résultat:

Nuage de points expliqué

L'axe des x représente les âges et l'axe des y représente les vitesses.

Ce que nous pouvons lire sur le diagramme, c'est que les deux voitures les plus rapides avaient toutes deux 2 ans et que la voiture la plus lente avait 12 ans.

Remarque : Il semble que plus la voiture est récente, plus elle roule vite, mais cela pourrait être une coïncidence, après tout, nous n'avons enregistré que 13 voitures.



Distributions de données aléatoires

Dans Machine Learning, les ensembles de données peuvent contenir des milliers, voire des millions, de valeurs.

Vous ne disposez peut-être pas de données réelles lorsque vous testez un algorithme, vous devrez peut-être utiliser des valeurs générées de manière aléatoire.

Comme nous l'avons appris dans le chapitre précédent, le module NumPy peut nous y aider !

Créons deux tableaux qui sont tous deux remplis de 1000 nombres aléatoires à partir d'une distribution de données normale.

Le premier tableau aura la moyenne fixée à 5,0 avec un écart type de 1,0.

Le deuxième tableau aura la moyenne définie sur 10,0 avec un écart type de 2,0 :

Exemple

Un nuage de points avec 1000 points :

import numpy
import matplotlib.pyplot as plt

x = numpy.random.normal(5.0, 1.0, 1000)
y = numpy.random.normal(10.0, 2.0, 1000)

plt.scatter(x, y)
plt.show()

Résultat:

Nuage de points expliqué

Nous pouvons voir que les points sont concentrés autour de la valeur 5 sur l'axe des x et 10 sur l'axe des y.

Nous pouvons également voir que la propagation est plus large sur l'axe des ordonnées que sur l'axe des abscisses.