Page 6 sur 8
Données, Pandas et quelques graphiques
Première approche des graphiques, nous aurons donc besoin en plus de la bibliothèque matplotlib.
Pour aller encore plus loin, voici de quoi passer l'horizon ;)
Lien pointant vers un site présentant les commandes de bases pour matplotlib |
Lien pointant vers la documentation officielle pandas.org: |
Tester puis comprendre
#ceci est un script
import pandas as pd
url="https://www.ipa-troulet.fr/cours/attachments/article/577/nat2019_simplifie.csv"
donnees = pd.read_csv(url, sep=";",encoding="utf-8")
#
print("les données sources")
print(donnees)
#
print(" Mon choix = INDY")
df=donnees.loc[donnees['preusuel']=="INDY",:]
print(df)
#
print("Je suppr les XXXX de annais")
df.drop( df[df['annais']=="XXXX"].index, inplace=True)
print(df)
print("Je suppr les colonnes sexe et preusuel")
del df['sexe'],df['preusuel']
print(df)
#
import matplotlib.pyplot as plt
df = df.set_index('annais')
df.plot(kind='bar', title='effectif du prénom')
plt.show()
Explication de texte du script
Les dernières lignes représentent graphiquement toutes les données numériques du dataframe, c'est pour cela que je supprime toutes les données pour ne garder que deux index: annais et nombre.
Evidement les prints ne sont là que pour comprendre...