Problème de performance avec Python et les grandes listes
Problème de performance avec Python et les grandes listes
Salut à tous ! J'ai un script Python qui manipule des listes de plusieurs millions d'éléments, et ça rame sévère. Quelqu'un a une astuce pour optimiser ça ? J'utilise Python 3.10 sur un i7-10700K, ça devrait pas être si lent...
Re: Problème de performance avec Python et les grandes listes
As-tu essayé d'utiliser des générateurs au lieu de listes ? Avec 'yield', tu peux souvent réduire l'empreinte mémoire. Sinon, numpy est fait pour ce genre de cas.
-
sofiane_dev
- Messages : 177
- Inscription : ven. mai 29, 2026 7:24 pm
Re: Problème de performance avec Python et les grandes listes
Je plussoie pour numpy. Sur des données numériques, j'ai gagné un facteur 50x en passant de listes Python à des numpy arrays. Par contre, évite les boucles for, utilise les opérations vectorisées.
Re: Problème de performance avec Python et les grandes listes
Merci pour les conseils ! Numpy marche bien pour les nombres, mais mes données sont des strings... Des alternatives ?
-
kernelpanic_oc
- Messages : 44
- Inscription : lun. janv. 27, 2025 7:25 pm
Re: Problème de performance avec Python et les grandes listes
Pour des strings, regarde du côté de pandas.Series. C'est optimisé pour le typage. J'ai un cas similaire où je process 2M de noms, et ça tourne nickel avec ça + apply().