wpformsML avec données synthétiques

Cette preuve de concept démontre la capacité de la plateforme MEDomics à prendre en charge l'ensemble du flux de travail d'apprentissage automatique de bout en bout dans un contexte de santé, en utilisant des données synthétiques.

circle-check

À propos du jeu de données

Le jeu de données synthétique utilisé dans cette preuve de concept reproduit la structure des données réelles d'admission hospitalière tout en garantissant une confidentialité totale. Il simulate des profils de patients réalistes, des caractéristiques d'admission, des comorbidités et des schémas diagnostiques, offrant un environnement fiable pour développer et valider des modèles prédictifs. Il est accessible sur Zenodo sous ce lienarrow-up-right.

circle-info

Le jeu de données est accessible sur Zenodo au lien suivant : 👉 Accéder au jeu de données sur Zenodoarrow-up-right.

Objectif

Cette démonstration illustre comment la éditeur MEDomics plateforme peut être utilisée pour explorer un jeu de données hospitalier entièrement synthétique, de l'exploration des données à la modélisation prédictive. Nous utilisons des modules clés de MEDomics pour construire une chaîne prédictive de bout en bout. L'objectif est d'évaluer les performances du modèle dans ce contexte tout en présentant la capacité de MEDomics à gérer des données cliniques à grande échelle et à produire des résultats explicables et comparables. Ce flux de travail reproduit l'étude de référence disponible iciarrow-up-right. L'objectif final de l'étude est de prédire la mortalité à un an en utilisant les données démographiques, les caractéristiques d'admission, les comorbidités et les diagnostics d'admission via une classification binaire.

Étapes

Voici les étapes suivies dans cette démonstration :

1

Nous vous fournirons un extrait de code pour extraire le fichier "any_visit_homr.csv", qui sera les données utilisées dans les étapes suivantes. Ce fichier spécifique contient des visites aléatoires de chaque patient de nos données initiales. Cet outil peut être utilisé pour modifier la graine aléatoire.

2

Ce module est utilisé pour créer les balises AdmDemo et AdmDemoDx afin de former 2 catégories utilisées dans la prédiction, et pour partitionner les données en ensembles d'entraînement et de réserve.

3

Le module d'apprentissage représente l'étape principale de la démonstration. Il sera utilisé pour reproduire le pipeline de l'étude originale afin de former un modèle, l'entraîner et enregistrer un modèle final.

4

Dans ce module, nous utiliserons le modèle d'apprentissage automatique sauvegardé pour effectuer des prédictions sur l'ensemble de réserve et tenter d'interpréter et d'expliquer les choix du modèle.

5

Cette étape finale est similaire au déploiement du modèle, où nous utiliserons le modèle sauvegardé du module d'apprentissage pour générer des prédictions sur un patient non vu.

Mis à jour