PolyMetriX propose une bibliothèque Python unifiée qui couvre l’ensemble du flux de travail en chimie des polymères assistée par données, de l’accès aux jeux de données jusqu’à l’entraînement et l’évaluation des modèles. L’innovation clé réside dans une featurisation hiérarchique qui extrait des descripteurs au niveau du polymère complet, de l’ossature et des chaînes latérales, surmontant les limites des empreintes de type Morgan et améliorant la robustesse en extrapolation. La plateforme s’appuie sur un jeu de référence Tg et introduit des stratégies de découpe des données adaptées aux polymères (LOCOCV, splits fondés sur la propriété) qui testent la généralisation dans des scénarios proches de la découverte de matériaux. Conçue avec une API modulaire inspirée de matminer/scikit-learn, elle harmonise l’ingestion de données, la représentation chimique (RDKit, PSMILES) et l’intégration modèle, tout en prenant en charge des systèmes multi-composants (mélanges polymère-molécule) via des comparateurs de descripteurs cohérents. Les résultats indiquent des performances prédictives supérieures et plus stables que les approches usuelles, avec des vecteurs de caractéristiques plus compacts et interprétables. Au-delà de la recherche académique, l’écosystème offre des repères reproductibles pour l’évaluation industrielle (formulation, mise à l’échelle, criblage virtuel) et jette les bases d’une normalisation des pratiques en polymère-informatique. En articulant design de descripteurs, curation de données et protocoles d’évaluation réalistes, PolyMetriX établit un socle communautaire pour accélérer la découverte assistée par IA de polymères à propriétés maîtrisées.