# Page d’extraction de séries temporelles {% hint style="warning" %} Le module d'extraction des séries temporelles est actuellement désactivé car il n'a pas passé tous les contrôles de stabilité. {% endhint %} Lorsque vous cliquez sur l'icône d'extraction des séries temporelles, vous devriez voir cette page :

Page d'extraction des séries temporelles

## 1. Sélectionner les données CSV La première étape sur cette page consiste à sélectionner votre entrée, qui est un fichier CSV devant contenir au moins une colonne avec des identifiants de patients, une colonne avec des dates, une colonne avec des identifiants d'éléments, une colonne avec les poids associés aux éléments (qui peuvent être une date-heure ou une valeur numérique) et une colonne avec les valeurs associées aux éléments. ## 2. Données sélectionnées Une fois que vous avez sélectionné vos données, elles seront affichées dans la section « Données sélectionnées ». ## 3. Sélectionner un type d'extraction {% hint style="info" %} Pour l'instant, seul le type d'extraction TSfresh est disponible. {% endhint %} ### 3.1. TSfresh Ce type d'extraction utilise le paquet Python TSfresh, qui permet le calcul d'un large éventail de caractéristiques de séries temporelles : . #### 3.1.1. Calculer les caractéristiques par Vous disposez de plusieurs options d'extraction : * L'option par défaut '**Admission**' générera un vecteur d'encodage par admission du patient, calculé à partir de toutes les mesures associées à cette admission. * Si vous choisissez l'option '**Patient**', vous obtiendrez un vecteur d'encodage par patient, avec toutes les mesures associées à ce patient. * Si vous choisissez l'option '**Plage horaire**' option, vous obtiendrez un vecteur d'encodage pour chaque plage horaire sélectionnée par patient, calculé à partir de toutes les mesures prises dans la plage horaire spécifiée.

Quelle que soit l'option sélectionnée, il existe un bouton bascule indiquant si vous souhaitez que vos encodages générés soient compatibles avec la Master Table. Activer cette option générera des encodages pouvant être utilisés dans le processus MEDprofiles du module d'entrée. Les tables générées pour le processus MEDprofiles peuvent contenir moins d'informations que les tables d'origine. Le bouton bascule est désactivé si les deux formats (compatible Master Table ou non) sont exactement les mêmes pour l'option sélectionnée. #### 3.1.2. Sélectionner les colonnes correspondant à En fonction des options sélectionnées précédemment, vous devez choisir les colonnes du jeu de données correspondant aux informations nécessaires pour la génération des caractéristiques. La sélection des colonnes pour chaque information requise sera filtrée par types (par exemple, si l'information requise est le temps, seules les colonnes de votre table de données contenant des types date-heure seront affichées).

Sélection des colonnes pour la génération d'encodages par admission

#### 3.1.3. Caractéristiques à calculer Quelle que soit l'option sélectionnée précédemment, vous pouvez choisir entre trois méthodes de calcul des caractéristiques : Minimal, Efficace et Exhaustif. Ces options représentent des ensembles prédéfinis de caractéristiques fournis par le paquet TSfresh : . Plus précisément, les trois options sont définies comme suit : * **Minimal** : S'appuie sur `tsfresh.feature_extraction.settings.MinimalFCParameters` et n'inclut qu'une poignée de caractéristiques. Il est adapté pour des tests rapides. * **Exhaustif** : S'appuie sur `tsfresh.feature_extraction.settings.ComprehensiveFCParameters` et inclut toutes les caractéristiques sans paramètres et toutes les caractéristiques avec paramètres, chacune avec différentes combinaisons de paramètres. C'est l'option par défaut dans TSfresh. * **Efficace** : S'appuie sur `tsfresh.feature_extraction.settings.EfficientFCParameters` et inclut principalement les mêmes caractéristiques que dans `tsfresh.feature_extraction.settings.ComprehensiveFCParameters`, en excluant les caractéristiques marquées avec l'attribut 'high\_comp\_cost'. Cette option est utile si les performances d'exécution sont un facteur critique. L'option par défaut est définie sur 'Minimal' pour réduire le temps de calcul.

#### 3.1.4. Préfixe du nom de colonne Vous pouvez choisir un préfixe à attribuer aux noms de colonnes des encodages générés. Ceci est utile pour entrer dans le processus MEDprofiles du module d'entrée, notamment pour créer des MEDclasses qui dépendent de ce nom de colonne préfixe. Le préfixe doit se composer uniquement de lettres et/ou de chiffres et ne peut pas être vide. Le préfixe par défaut est 'ts'.

## 4. Extraire les caractéristiques Une fois toutes les étapes précédentes terminées, vous pouvez procéder à l'extraction des caractéristiques. Si un avertissement apparaît indiquant « Vous devez sélectionner des options appropriées pour la génération des caractéristiques », et que le bouton « Extraire les données » est désactivé, veuillez vérifier si vous avez fourni toutes les informations requises dans la section « Sélectionner un type d'extraction ». Dans cette section, vous pouvez spécifier le nom de fichier sous lequel vous souhaitez enregistrer vos encodages générés. Le nom de fichier doit être suivi de l'extension .csv, composé uniquement de lettres, de chiffres et/ou du caractère '\_' et ne peut pas être vide. Le nom de fichier par défaut est 'ts\_extracted\_features.csv'. Le fichier sera enregistré sous DATA/extracted\_features. Enfin, vous pouvez lancer le processus d'extraction en cliquant sur le bouton « Extraire les données ». Cela peut prendre quelques minutes, et la progression sera affichée dans cette section et dans l'onglet de sortie.

## 5. Données extraites Une fois le processus d'extraction terminé (ce qui peut prendre quelques minutes, mais vous pouvez suivre la progression dans l'onglet de sortie), un message apparaîtra en bas de la page indiquant où les caractéristiques ont été sauvegardées. Vous pouvez consulter vos résultats dans la section « Données extraites » en activant l'interrupteur. Alternativement, vous pouvez ouvrir votre fichier CSV généré dans votre espace de travail. {% hint style="info" %} Certaines options de caractéristiques peuvent générer des jeux de données trop volumineux pour être affichés sur la page d'extraction. Si tel est le cas, un message apparaîtra en bas de la page indiquant « Le jeu de données résultant est trop volumineux pour être affiché ici ». {% endhint %}