img
img
  • Cadre

    R&D
  • Domaine

    Histopathologie numérique
  • Approche

    IA générative · POC
  • Objectif

    Évaluer l'apport d'images synthétiques

Contexte & problématique

L’histopathologie numérique constitue un terrain d’application privilégié pour l’apprentissage profond, mais reste fortement contrainte par la disponibilité et la diversité des données annotées. Les jeux de données sont coûteux à produire, hétérogènes et sensibles aux variations de protocoles de coloration et de numérisation, ce qui limite la robustesse des modèles de classification.

Ce projet explore l’apport réel de l’IA générative dans ce contexte, non pas sous un angle purement visuel, mais à travers une évaluation mesurable de son impact. L’objectif est de déterminer si des images histopathologiques synthétiques peuvent enrichir un pipeline de diagnostic et améliorer la généralisation des modèles, dans le cadre d’une preuve de concept rigoureuse.

img img

Analyse des données

La qualité des données constitue le plafond de performance de tout modèle génératif. Le travail s’appuie sur le dataset de référence NCT-CRC-HE, couvrant neuf classes tissulaires, avec une séparation stricte des domaines d’entraînement et de validation afin d’éviter toute fuite de données.

Préparation des données

 Un pipeline dédié a été mis en place pour normaliser les colorations, filtrer les images non informatives et garantir une base saine pour l’apprentissage. Cette étape conditionne la validité de l’ensemble des résultats obtenus par la suite.

img img

Approche comparative

La démarche repose sur une comparaison progressive de deux familles de modèles génératifs. Une première approche utilise des GANs conditionnels afin d’évaluer leur capacité à produire rapidement des images plausibles. Une seconde s’appuie sur des modèles de diffusion, plus coûteux mais mieux adaptés à la fidélité morphologique.

Choix techniques

Les modèles de diffusion sont adaptés au domaine histopathologique via une architecture hybride combinant Adapter et LoRA. Ce choix permet un fine-tuning ciblé, limitant le coût de calcul tout en améliorant la cohérence structurelle des images générées.

img img

Évaluation quantitative

L’évaluation combine des métriques perceptuelles et statistiques (FID, LPIPS) avec des indicateurs adaptés au contexte médical. Cette analyse permet de comparer objectivement les distributions réelles et synthétiques, au-delà d’une simple inspection visuelle.

Impact downstream

L’utilité des données générées est mesurée via une évaluation downstream, en intégrant les images synthétiques dans l’entraînement d’un classifieur de référence. Cette étape permet de relier qualité générative, performance et calibration du diagnostic.

img img

Résultats cGAN → UNI2h-Pixcell (figé)

• FID : ↓ [271→ 115]

• LPIPS : [0.41→ 0.47]

• Taux de faux négatifs (TUM) : ↓  [40→ 29]

Conclusion

Modèle par diffusion gagnant selon le cas d’usage.

• GAN : prototypage rapide / itérations

• Diffusion : fidélité + cohérence structurelle

• Reco : augmentation ciblée et multimodèle