Pandas Série
Qu'est-ce qu'une série ?
Une série Pandas est comme une colonne dans un tableau.
C'est un tableau unidimensionnel contenant des données de tout type.
Exemple
Créez une série Pandas simple à partir d'une liste :
import pandas as pd
a = [1, 7, 2]
myvar = pd.Series(a)
print(myvar)
Étiquettes
Si rien d'autre n'est spécifié, les valeurs sont étiquetées avec leur numéro d'index. La première valeur a l'indice 0, la deuxième valeur a l'indice 1, etc.
Cette étiquette peut être utilisée pour accéder à une valeur spécifiée.
Exemple
Renvoie la première valeur de la série :
print(myvar[0])
Créer des étiquettes
Avec l' index
argument, vous pouvez nommer vos propres étiquettes.
Exemple
Créez vos propres étiquettes :
import pandas as pd
a = [1, 7, 2]
myvar = pd.Series(a, index = ["x", "y", "z"])
print(myvar)
Lorsque vous avez créé des étiquettes, vous pouvez accéder à un élément en vous référant à l'étiquette.
Exemple
Renvoie la valeur de "y":
print(myvar["y"])
Obtenir une certification!
10 $ S'INSCRIRE
Objets clé/valeur en série
Vous pouvez également utiliser un objet clé/valeur, comme un dictionnaire, lors de la création d'une série.
Exemple
Créez une série Pandas simple à partir d'un dictionnaire :
import pandas as pd
calories = {"day1": 420, "day2": 380, "day3":
390}
myvar = pd.Series(calories)
print(myvar)
Remarque : Les clés du dictionnaire deviennent les libellés.
Pour sélectionner uniquement certains éléments du dictionnaire, utilisez l' index
argument et spécifiez uniquement les éléments que vous souhaitez inclure dans la série.
Exemple
Créez une série en utilisant uniquement les données de "jour1" et "jour2" :
import pandas as pd
calories = {"day1": 420, "day2": 380, "day3":
390}
myvar = pd.Series(calories,
index = ["day1", "day2"])
print(myvar)
DataFrames
Les ensembles de données dans Pandas sont généralement des tables multidimensionnelles, appelées DataFrames.
La série est comme une colonne, un DataFrame est la table entière.
Exemple
Créez un DataFrame à partir de deux séries :
import pandas as pd
data = {
"calories": [420, 380, 390],
"duration":
[50, 40, 45]
}
myvar = pd.DataFrame(data)
print(myvar)
Vous découvrirez les DataFrames dans le chapitre suivant .