# Page d’extraction d’images

{% hint style="warning" %}
Le module d'extraction d'images est actuellement désactivé car il n'a pas passé tous les contrôles de stabilité.
{% endhint %}

Lorsque vous cliquez sur l'icône d'extraction d'images, vous devriez voir cette page :

<figure><img src="https://2361277526-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FUO0RN9PzFLqAgLEwwaSn%2Fuploads%2FOnObq2CsPyCeXtqUn3Al%2Fextractionimg.png?alt=media&#x26;token=2efb2f00-d9de-48d7-a025-c20aa7db3f0f" alt=""><figcaption><p>Page d'extraction d'images</p></figcaption></figure>

## 1. Sélectionner les données JPG

La première étape de cette page consiste à sélectionner votre entrée, qui est un dossier contenant des dossiers contenant des images JPG. Les dossiers contenus dans le dossier principal doivent correspondre à des patients (un dossier par patient). Tous les fichiers JPG doivent être au même niveau de profondeur de dossier. Une fois vos données importées, l'avertissement « Aucune donnée importée » sera remplacé par un message de succès « Données importées avec succès ».

<figure><img src="https://2361277526-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FUO0RN9PzFLqAgLEwwaSn%2Fuploads%2FFCWN8IUq4jypyCNDwjLA%2Fselectjspg.png?alt=media&#x26;token=badbdcd1-87e0-4f66-a389-87b8ed912c8e" alt=""><figcaption><p>Sélectionner les données JPG</p></figcaption></figure>

## 2. Sélectionner un type d'extraction

{% hint style="info" %}
Pour le moment, seul le type d'extraction DenseNet est disponible.
{% endhint %}

### 2.1. DenseNet

Ce type d'extraction utilise le modèle DenseNet pré-entraîné de la bibliothèque Python TorchXRayVision : <https://mlmed.org/torchxrayvision/models.html>. TorchXRayVision est une bibliothèque de jeux de données et de modèles de radiographies thoraciques, par conséquent ce modèle est destiné à être utilisé sur la radiographie thoracique.&#x20;

#### 2.2.1. Sélectionnez vos poids de modèle

La bibliothèque TorchXRayVision fournit sept poids différents pour le modèle DenseNet qui sont disponibles dans notre application. Par défaut, les poids du modèle sont réglés sur « densenet121-res224-chex ».&#x20;

<figure><img src="https://2361277526-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FUO0RN9PzFLqAgLEwwaSn%2Fuploads%2FwdF9KLXeUpGq1XnjRRh5%2Fweights.png?alt=media&#x26;token=4dac86ee-4a81-4a17-a74f-17c946cf0d28" alt=""><figcaption><p>Sélectionnez vos poids de modèle</p></figcaption></figure>

#### 2.1.2. Sélectionnez les caractéristiques que vous souhaitez générer

Le modèle DenseNet de TorchXRayVision fournit un vecteur de 1024 densefeatures et un vecteur de 18 prédictions pour les cibles suivantes : Atélectasie, Consolidation, Infiltration, Pneumothorax, Œdème, Emphysème, Fibrose, Épanchement, Pneumonie, Épaississement pleural, Cardiomegalie, Nodule, Masse, Hernie, Lésion pulmonaire, Fracture, Opacité pulmonaire, Cardiomédiastin élargi.

Vous pouvez choisir de générer uniquement les densefeatures, uniquement les prédictions ou les deux.

<figure><img src="https://2361277526-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FUO0RN9PzFLqAgLEwwaSn%2Fuploads%2FE7mejQBch473NEOLRdHR%2Fcheckbox.png?alt=media&#x26;token=0ef7fdd5-881c-476d-aa80-93b5b5ddd822" alt=""><figcaption><p>Sélectionnez les caractéristiques que vous souhaitez générer</p></figcaption></figure>

#### 2.1.3. Formater le jeu de données en table maître

Quelle que soit l'option sélectionnée, il existe un bouton bascule indiquant si vous souhaitez que vos embeddings générés soient compatibles avec la table maître. Activer cette option générera des embeddings pouvant être utilisés dans le processus MEDprofiles du module d'entrée. Les tables générées pour le processus MEDprofiles peuvent contenir moins d'informations ou des informations différentes par rapport aux tables d'origine.&#x20;

Pour l'extraction d'images, activer cette option exigera un fichier CSV qui associe les noms de fichiers d'image (y compris l'extension .jpg) à une datetime. De plus, vous devez indiquer quel niveau de dossier correspond aux identifiants des patients et il y a une case à cocher qui vous permet de convertir le nom du dossier d'identifiants des patients en entiers (par exemple si un nom de dossier est « p123 », il sera converti en « 123 » dans la table d'embeddings générée). Cette option est utile si vous souhaitez comparer les données d'images des patients à d'autres types de données où les identifiants des patients sont des nombres.

<figure><img src="https://2361277526-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FUO0RN9PzFLqAgLEwwaSn%2Fuploads%2Fm9u9p3Rd3uWDysbObtkK%2Fmaster.png?alt=media&#x26;token=3e50aaae-cf66-42a6-8875-73f54b2dc5d1" alt=""><figcaption><p>Formater le jeu de données en table maître</p></figcaption></figure>

#### 2.1.4. Préfixe du nom de colonne

Vous pouvez choisir d'attribuer un préfixe aux noms des colonnes des embeddings générés. Ceci est utile pour entrer dans le processus MEDprofiles dans le module d'entrée, en particulier pour créer des MEDclasses qui dépendent de ce nom de colonne préfixe. Le préfixe doit être composé uniquement de lettres et/ou de chiffres et ne peut pas être vide. Le préfixe par défaut est « img ».&#x20;

<figure><img src="https://2361277526-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FUO0RN9PzFLqAgLEwwaSn%2Fuploads%2FTi6feKEu7eKbz5kVRJWU%2Fprefix.png?alt=media&#x26;token=80ccfc34-672a-40bc-84a8-f4184e371655" alt=""><figcaption><p>Préfixe du nom de colonne</p></figcaption></figure>

## 3. Extraire les caractéristiques

Une fois toutes les étapes précédentes terminées, vous pouvez procéder à l'extraction des caractéristiques. Si un avertissement apparaît indiquant « Vous devez sélectionner des options appropriées pour la génération des caractéristiques », et que le bouton « Extraire les données » est désactivé, veuillez vérifier si vous avez fourni toutes les informations requises dans la section « Sélectionner un type d'extraction ». &#x20;

Dans cette section, vous pouvez spécifier le nom de fichier sous lequel vous souhaitez enregistrer vos embeddings générés. Le nom de fichier doit être suivi de l'extension .csv, composé uniquement de lettres, de chiffres et/ou du caractère '\_' et ne peut pas être vide. Le nom de fichier par défaut est « image\_extracted\_features.csv ». Le fichier sera enregistré sous DATA/extracted\_features.&#x20;

Enfin, vous pouvez lancer le processus d'extraction en cliquant sur le bouton « Extraire les données ». Cela peut prendre quelques minutes, et la progression sera affichée dans cette section et dans l'onglet de sortie.

<figure><img src="https://2361277526-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FUO0RN9PzFLqAgLEwwaSn%2Fuploads%2FxhALcKPmyl5hLIwhgfo3%2Fextract.png?alt=media&#x26;token=0750b94e-1513-4ae7-9570-7c47fad129ae" alt=""><figcaption><p>Extraire les caractéristiques</p></figcaption></figure>

## 4. Données extraites

Une fois le processus d'extraction terminé (ce qui peut prendre quelques minutes, mais vous pouvez suivre la progression dans l'onglet de sortie), un message apparaîtra en bas de la page indiquant où les caractéristiques ont été sauvegardées. Vous pouvez consulter vos résultats dans la section « Données extraites » en activant l'interrupteur. Alternativement, vous pouvez ouvrir votre fichier CSV généré dans votre espace de travail.

<figure><img src="https://2361277526-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FUO0RN9PzFLqAgLEwwaSn%2Fuploads%2F0MUvwX20ZGYtQcic4odC%2Fextracted_data.png?alt=media&#x26;token=3e5cc17c-dbb3-4d79-bcec-02364e86bd99" alt=""><figcaption><p>Section Données extraites lorsque des caractéristiques ont été générées</p></figcaption></figure>
