Quand on lit des données depuis un fichier (comme un CSV), il est fréquent de vouloir conserver une copie intacte des données originales, même après avoir fait des traitements dessus.
Si on modifie accidentellement une variable contenant des données importantes, on risque de perdre des informations et de rendre le programme difficile à corriger.
En Python, il est d'usage d'écrire les noms des variables que l'on veut considérer comme constantes entièrement en majuscules.
Exemple :
DONNEES_ORIGINALES = ["Nom", "Prenom", "Age"]
Cela indique aux lecteurs du code (et à soi-même !) que cette variable ne doit pas être modifiée.
Un tuple est une structure immuable en Python : on ne peut pas modifier son contenu après création.
Ainsi, pour protéger un ensemble de valeurs fixes, il est préférable d'utiliser un tuple :
COLONNES_ATTENDUES = ("Nom", "Prenom", "Age")
Quand on traite des données (nettoyage, tri, typage...), il est utile de créer de nouvelles variables à chaque étape, avec des noms précis.
Par exemple :
data_csv = charger_csv("fichier.csv")
data_nettoyee = nettoyer(data_csv)
data_typage = typer(data_nettoyee)
Cela permet de :
| Astuce | Avantage |
|---|---|
| Majuscules pour constantes | Visuellement repérables dans le code |
| Utiliser un tuple | Protège contre les modifications accidentelles |
| Nommer les étapes clairement | Favorise la clarté et la sécurité |