# Superset

{% hint style="info" %}
[Qu’est-ce que Superset ?](https://medomicslab.gitbook.io/medomics-docs/v1-fr/tutorials/superset)
{% endhint %}

{% hint style="success" %}
*Veuillez vous assurer d’avoir* [*lancé et connecté à Superset dans MEDomics.*](https://medomicslab.gitbook.io/medomics-docs/v1-fr/tutorials/superset#launch-superset-button)
{% endhint %}

### Étapes initiales

1. **Importation de paris.db**

Une fois que vous êtes [connecté](https://medomicslab.gitbook.io/medomics-docs/v1-fr/tutorials/superset#launch-superset-button) et que vous avez accès au tableau de bord Superset, l’étape suivante consiste à téléverser la base de données PARIS. D’abord, vous devez télécharger cette base de données prête à l’emploi *exemples* base de données : [lien](https://mcgill-my.sharepoint.com/:u:/g/personal/mahdi_aitlhajloutfi_mail_mcgill_ca/IQB1YPlvgRa4RLYTzoElDazSAUMooE2Qe0hXZaHiW8Q7TXE?e=H3O9ny). Ensuite, cliquez sur *Paramètres*, puis sur *Connexions à la base de données*, et cliquez sur le bouton + DATABASE en haut à droite. Dans la fenêtre modale « Choisissez une base de données », sélectionnez SQLite. Saisissez l’URI SQLAlchemy en utilisant le chemin vers le fichier `paris.db` . Le chemin doit être préfixé par `sqlite:///` pour les utilisateurs Windows et par `sqlite:////`  pour les utilisateurs MacOS et Linux. Par exemple :

* *MacOS/Ubuntu : `sqlite:////Users/Download/paris.db`*
* *Windows : `sqlite:///C:\Users\Downloads\paris.db`*

Toutes les étapes sont résumées dans les figures ci-dessous :

<figure><img src="https://2361277526-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FUO0RN9PzFLqAgLEwwaSn%2Fuploads%2Fxln4kNP3x7KS2rWMV2GO%2FallowCSV1.png?alt=media&#x26;token=1d8129ce-fe3c-4647-8494-5025b81f7ec6" alt="" width="188"><figcaption><p>Fig. 1 - Étape 1 : ouvrir les connexions à la base de données</p></figcaption></figure>

<figure><img src="https://2361277526-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FUO0RN9PzFLqAgLEwwaSn%2Fuploads%2FF4hXQvoJKOgqbnjq4lRD%2FNewDB1.png?alt=media&#x26;token=1ce8f7d1-a148-4692-8ee9-67a451b9c6d9" alt=""><figcaption><p>Étape 1 : cliquez sur le bouton + DATABASE en haut à droite</p></figcaption></figure>

<figure><img src="https://2361277526-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FUO0RN9PzFLqAgLEwwaSn%2Fuploads%2FwHFkMpFsVNCkYke0yVeK%2FNewDB2.png?alt=media&#x26;token=9fac3142-e50a-4a54-a344-efe071f62552" alt="" width="375"><figcaption><p>Étape 2 : sélectionnez le type de base de données</p></figcaption></figure>

<figure><img src="https://2361277526-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FUO0RN9PzFLqAgLEwwaSn%2Fuploads%2FrnMR7ipkTY7atmDAhogv%2FNewDB3.png?alt=media&#x26;token=6205e458-85ed-43eb-8ab1-7b1031aec3e2" alt="" width="375"><figcaption><p>Étape 3 : définissez le chemin de la base de données et connectez-la</p></figcaption></figure>

2. **Création du jeu de données PARIS**

Importation du `paris.db` Le fichier ne crée pas automatiquement le jeu de données PARIS dans votre Superset ; vous devez le faire manuellement. D’abord, allez dans l’onglet Datasets et cliquez sur le bouton + Dataset en haut à droite. Puis sélectionnez SQLite comme DATABASE, main comme SCHEMA et PARIS\_SYNTH comme TABLE. Les étapes sont résumées dans la figure suivante :

<figure><img src="https://2361277526-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FUO0RN9PzFLqAgLEwwaSn%2Fuploads%2FElVsaMoxkTs1V1JgkQYt%2FCreateDataset.png?alt=media&#x26;token=dcc15dd1-fe4d-4bf7-a97b-b6ffea88972f" alt=""><figcaption><p>Importation de la table PARIS</p></figcaption></figure>

### Visualisation des données

#### *Création de graphiques*

Une fois votre table PARIS importée, vous pouvez choisir de créer parmi une variété de graphiques. Par exemple, nous pouvons créer un diagramme circulaire pour visualiser les différences de sexe parmi les participants à notre questionnaire. La figure ci-dessous montre les étapes à suivre :

<figure><img src="https://2361277526-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FUO0RN9PzFLqAgLEwwaSn%2Fuploads%2FXxE1OKj4ydZWV9DdtpEH%2FCreateNewPieChart.png?alt=media&#x26;token=7db494e0-c394-4dfa-9d48-a85a0f477717" alt=""><figcaption><p>Fig. 8 - Créer un nouveau diagramme circulaire</p></figcaption></figure>

Après avoir créé le graphique, nous sélectionnerons les informations que nous souhaitons visualiser. Pour ce faire, recherchez la colonne Sex et faites-la glisser dans la case Dimension. Ensuite, dans la case métrique, sélectionnez la métrique à afficher (COUNT). Enfin, cliquez sur « Create Chart » pour générer le graphique, qui devrait apparaître à droite de votre écran. Une fois que vous êtes satisfait de votre graphique final, vous pouvez cliquer sur « SAVE » pour l’enregistrer et l’ajouter à un tableau de bord.

<figure><img src="https://2361277526-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FUO0RN9PzFLqAgLEwwaSn%2Fuploads%2F6LLVgh2RGUPTJ6ONeRRH%2FSexPieChart.png?alt=media&#x26;token=18e2fe75-15f6-4056-afbf-fd8c282ae38f" alt=""><figcaption><p>Fig. 9 - Créer un diagramme circulaire pour la distribution du sexe</p></figcaption></figure>

Dans cette preuve de concept, nous suggérons de créer trois graphiques, en utilisant les configurations suivantes pour chacun d’eux :

* **Graphique du nombre total de participants**:&#x20;
  * Type de graphique : *GRAND NOMBRE*
  * Métrique : *COUNT*&#x20;

<figure><img src="https://2361277526-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FUO0RN9PzFLqAgLEwwaSn%2Fuploads%2FRMvu1ZbT49eD2NefRSpX%2FTotalParticipantsChart.png?alt=media&#x26;token=ae4e7dc4-4b9b-4086-a1ca-cd56ce746a3e" alt="" width="375"><figcaption><p>Fig. 10 - Définition des paramètres du graphique du nombre total de participants</p></figcaption></figure>

* **Graphique de la distribution de l’âge**:
  * Type de graphique : *GRAPHIQUE EN BARRES*
  * Axe X : *Âge*
  * Métrique : *COUNT*&#x20;

<figure><img src="https://2361277526-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FUO0RN9PzFLqAgLEwwaSn%2Fuploads%2FtozfgIYr0y0nFH2ZsRG6%2FAgeChart.png?alt=media&#x26;token=feb6cc5d-1efd-4012-ac17-9fac160130f5" alt="" width="375"><figcaption><p>Fig. 12 - Définition des paramètres du graphique de distribution de l’âge</p></figcaption></figure>

#### *Création de tableaux de bord*

Les tableaux de bord Superset sont des affichages interactifs de données visuelles, créés à l’aide des graphiques Superset. Par conséquent, les graphiques réalisés dans la section précédente peuvent être utilisés pour créer un tableau de bord unique permettant d’interagir avec nos données, de surveiller des indicateurs clés, des statistiques, etc. Pour créer un tableau de bord, suivez les étapes décrites dans la figure ci-dessous :

<figure><img src="https://2361277526-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FUO0RN9PzFLqAgLEwwaSn%2Fuploads%2F7Zn3D8jqUr7VKhYaJkzd%2FCreateDashboard.png?alt=media&#x26;token=cfe6d881-13e4-4f3a-8bc5-47d57435fc3a" alt=""><figcaption><p>Fig. 13 - Création d’un tableau de bord Superset et ajout de graphiques</p></figcaption></figure>

#### *Tableau de bord final*

{% hint style="info" icon="heart" %}
N’hésitez pas à créer un tableau de bord plus esthétique !
{% endhint %}

Une fois que tous vos graphiques ont été importés et organisés dans votre tableau de bord, vous devriez obtenir un résultat similaire :

<figure><img src="https://2361277526-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FUO0RN9PzFLqAgLEwwaSn%2Fuploads%2FVG6MbKyutltDyyWwJFuz%2Fimage.png?alt=media&#x26;token=09fbfd85-728e-4493-a357-a7b6e329198c" alt=""><figcaption><p>Fig. 14 - Tableau de bord final PARIS</p></figcaption></figure>

#### *Utilisation des filtres*

Dans les tableaux de bord Superset, vous pouvez utiliser des filtres pour explorer les données de manière dynamique. Ils permettent aux utilisateurs d’explorer les données affichées selon un critère, une métrique, etc. spécifiques, sans modifier les requêtes sous-jacentes.

Une partie de cette POC consiste à appliquer des filtres à notre tableau de bord final, afin d’aider à afficher les données selon des critères prédéfinis. Pour ce faire, suivez les instructions détaillées ci-dessous :

<figure><img src="https://2361277526-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FUO0RN9PzFLqAgLEwwaSn%2Fuploads%2FBIWoobpNAdRjLI4i1KuU%2FApplyFilters.png?alt=media&#x26;token=630b6120-bb92-41f6-9b20-9c39123d8e3b" alt=""><figcaption><p>Fig. 15 - Comment implémenter de nouveaux filtres dans votre tableau de bord</p></figcaption></figure>

Vous disposez désormais d’un tableau de bord interactif fonctionnel pour explorer les données de votre questionnaire. N’hésitez pas à ajouter de nouveaux graphiques, des filtres ou à créer de nouveaux tableaux de bord.&#x20;

Superset possède de nombreux outils utiles qui ne peuvent pas tous être couverts dans cette preuve de concept. Par conséquent, nous vous recommandons de consulter [la documentation de Superset](https://superset.apache.org/docs/intro/) pour obtenir davantage d’informations sur la manière d’utiliser cet outil pour explorer votre jeu de données.

#### Exporter les données vers l’espace de travail

{% hint style="info" %}
[Ignorez cette étape](https://medomicslab.gitbook.io/medomics-docs/v1-fr/preuves-de-concept/la-demo-paris/module-dexploration) si vous utilisez des données synthétiques.
{% endhint %}

Dans cette dernière étape, nous utiliserons Superset pour exporter vers notre espace de travail les données nécessaires au reste de la PoC. D’abord, dans SQL Lab de Superset, exécutez la commande suivante (voir figure ci-dessous) :

```sql
SELECT * FROM paris_ml; --change paris_ml to your dataset's name
```

Avant de cliquer sur Exécuter, modifiez la limite de lignes en fonction de la taille de votre jeu de données. Une fois la requête exécutée, vous pouvez cliquer sur Download to CSV et enregistrer les données récupérées dans votre dossier DATA sous votre Workspace (nous recommandons d’utiliser le nom `PARIS_ML.csv` par souci de cohérence avec le reste des étapes). Enfin, actualisez votre espace de travail et assurez-vous que votre fichier s’y trouve. Les instructions sont résumées dans la figure suivante :

<figure><img src="https://2361277526-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FUO0RN9PzFLqAgLEwwaSn%2Fuploads%2F8qgLRosV0uxpbv8xXoxG%2FsaveDatasetCSV.png?alt=media&#x26;token=a9d78aab-21b9-49d5-9f56-3596c72b6d16" alt="" width="563"><figcaption><p>Fig. 16 - Comment exporter votre jeu de données au format CSV</p></figcaption></figure>

Ceci conclut la première étape de cette PoC. Dans la suivante, nous approfondirons l’exploration du jeu de données à l’aide du module d’exploration.
