Page d'extraction d'images

La page d'extraction d'images prend des images JPG en entrée et extrait des embeddings à l'aide d'un modèle sélectionné.

Le module d'extraction d'images est actuellement désactivé car il n'a pas passé tous les contrôles de stabilité.

Lorsque vous cliquez sur l'icône d'extraction d'images, vous devriez voir cette page :

1. Sélectionner les données JPG

La première étape de cette page consiste à sélectionner votre entrée, qui est un dossier contenant des dossiers contenant des images JPG. Les dossiers contenus dans le dossier principal doivent correspondre à des patients (un dossier par patient). Tous les fichiers JPG doivent se trouver au même niveau de profondeur de dossier. Une fois vos données importées, l'avertissement « Aucune donnée importée » sera remplacé par un message de succès « Données importées avec succès ».

2. Sélectionner un type d'extraction

Pour l'instant, seul le type d'extraction DenseNet est disponible.

2.1. DenseNet

Ce type d'extraction utilise le modèle DenseNet pré-entraîné de la bibliothèque Python TorchXRayVision : https://mlmed.org/torchxrayvision/models.html. TorchXRayVision est une bibliothèque de jeux de données et de modèles pour les radiographies thoraciques, par conséquent ce modèle est destiné à être utilisé sur la radiographie thoracique.

2.2.1. Sélectionner vos poids de modèle

La bibliothèque TorchXRayVision fournit sept poids différents pour le modèle DenseNet qui sont disponibles dans notre application. Par défaut, les poids du modèle sont réglés sur « densenet121-res224-chex ».

2.1.2. Sélectionner les caractéristiques que vous souhaitez générer

Le modèle DenseNet de TorchXRayVision fournit un vecteur de 1024 densefeatures et un vecteur de 18 prédictions pour les cibles suivantes : Atélectasie, Consolidation, Infiltration, Pneumothorax, Œdème, Emphysème, Fibrose, Épanchement, Pneumonie, Épaississement pleural, Cardiomegalie, Nodule, Masse, Hernie, Lésion pulmonaire, Fracture, Opacité pulmonaire, Cardiomegaly élargi (enlarged cardiomediastinum).

Vous pouvez choisir de générer uniquement les densefeatures, uniquement les prédictions ou les deux.

2.1.3. Formater le jeu de données en table maîtresse

Indépendamment des options sélectionnées, il y a un bouton bascule indiquant si vous souhaitez que vos embeddings générés soient compatibles avec la table maîtresse. Activer cette option générera des embeddings pouvant être utilisés dans le processus MEDprofiles du module d'entrée. Les tables générées pour le processus MEDprofiles peuvent contenir moins ou différentes informations que les tables originales.

Pour l'extraction d'images, activer cette option exigera un fichier CSV qui associe les noms de fichiers d'image (y compris l'extension .jpg) à une date/heure. De plus, vous devez indiquer quel niveau de dossier correspond aux identifiants des patients et il y a une case à cocher qui vous permet de convertir le nom du dossier d'identifiants des patients en entiers (par exemple si un nom de dossier est « p123 », il sera converti en « 123 » dans la table d'embeddings générée). Cette option est utile si vous souhaitez comparer les données d'images des patients à d'autres types de données où les identifiants des patients sont des nombres.

2.1.4. Préfixe du nom de colonne

Vous pouvez choisir d'attribuer un préfixe aux noms de colonnes des embeddings générés. Ceci est utile pour entrer dans le processus MEDprofiles du module d'entrée, en particulier pour créer des MEDclasses qui dépendent de ce nom de colonne préfixe. Le préfixe doit se composer uniquement de lettres et/ou de chiffres et ne peut pas être vide. Le préfixe par défaut est « img ».

3. Extraire les caractéristiques

Une fois toutes les étapes précédentes terminées, vous pouvez procéder à l'extraction des caractéristiques. Si un avertissement apparaît indiquant « Vous devez sélectionner des options appropriées pour la génération de caractéristiques », et que le bouton « Extraire les données » est désactivé, veuillez vérifier si vous avez fourni toutes les informations requises dans la section « Sélectionner un type d'extraction ».

Dans cette section, vous pouvez spécifier le nom de fichier sous lequel vous souhaitez enregistrer vos embeddings générés. Le nom de fichier doit être suivi de l'extension .csv, composé uniquement de lettres, de chiffres et/ou du caractère '_' et ne peut pas être vide. Le nom de fichier par défaut est « image_extracted_features.csv ». Le fichier sera enregistré sous DATA/extracted_features.

Enfin, vous pouvez lancer le processus d'extraction en cliquant sur le bouton « Extraire les données ». Cela peut prendre quelques minutes, et la progression sera affichée dans cette section et dans l'onglet de sortie.

4. Données extraites

Une fois le processus d'extraction terminé (ce qui peut prendre quelques minutes, mais vous pouvez suivre la progression dans l'onglet de sortie), un message apparaîtra en bas de la page indiquant où les caractéristiques ont été enregistrées. Vous pouvez examiner vos résultats dans la section « Données extraites » en activant l'interrupteur. Alternativement, vous pouvez ouvrir votre fichier CSV généré dans votre espace de travail.

PrécédentModule d'extraction SuivantPage d'extraction de texte

Mis à jour il y a 2 mois

hashtag1. Sélectionner les données JPG

hashtag2. Sélectionner un type d'extraction

hashtag2.1. DenseNet

hashtag2.2.1. Sélectionner vos poids de modèle

hashtag2.1.2. Sélectionner les caractéristiques que vous souhaitez générer

hashtag2.1.3. Formater le jeu de données en table maîtresse

hashtag2.1.4. Préfixe du nom de colonne

hashtag3. Extraire les caractéristiques

hashtag4. Données extraites

1. Sélectionner les données JPG

2. Sélectionner un type d'extraction

2.1. DenseNet

2.2.1. Sélectionner vos poids de modèle

2.1.2. Sélectionner les caractéristiques que vous souhaitez générer

2.1.3. Formater le jeu de données en table maîtresse

2.1.4. Préfixe du nom de colonne

3. Extraire les caractéristiques

4. Données extraites