Créer ses propres outils linguistiques
Vous aimeriez vous créer un correcteur orthographique ou une banque de terminologie à partir de données fiables? Le gouvernement du Canada met à votre disposition l'intégralité des données de TERMIUM Plus® afin que vous puissiez concevoir votre propre outil linguistique.
Instructions
Pour savoir comment télécharger les données, suivez les instructions suivantes :
- Visitez le Portail des données ouvertes du gouvernement du Canada
- Dans le champ Effectuez une recherche dans le portail du gouvernement ouvert, tapez « TERMIUM Plus® ». Cliquez Trouvez
- Sélectionnez le jeu de données trouvé (TERMIUM Plus®, la banque de données terminologiques et linguistiques du gouvernement fédéral)
- À la page des données de TERMIUM Plus®, trouvez les domaines qui vous intéressent et cliquez sur le bouton Accès
- La fenêtre « Voulez-vous ouvrir ou enregistrer ce fichier? » s'affichera. Cliquez sur Enregistrer
- Une fois les dossiers compressés enregistrés dans l'ordinateur, il suffit de les ouvrir. Une liste de fichiers CSV s'affichera
- Copiez les fichiers CSV désirés dans le répertoire de votre choix
- Dans chaque fichier, vous devrez convertir les données pour être en mesure de les lire. Voici comment procéder :
- 8.1. Lancez un logiciel tableur (par exemple, Microsoft Excel, OpenOffice Calc,) et cliquez Ouvrir
- 8.2. Choisissez le répertoire où vous avez copié les fichiers CSV. Si vous ne voyez aucun choix de fichiers, choisissez l'option « Tous les fichiers » à côté de la fenêtre « Nom du fichier »
- 8.3. Ouvrez le fichier CSV désiré
- 8.4. Dans la fenêtre Assistant, choisissez l'option Délimité et cliquez Suivant
- 8.5. Dans la deuxième fenêtre, désélectionnez l'option Tabulation, cliquez sur l'option Virgule et cliquez sur Suivant
- 8.6. Dans la troisième fenêtre, vérifiez que le format sélectionné soit Standard et cliquez sur Terminer
- Vous verrez les données clairement réorganisées par colonne. Il ne reste plus qu'à jouer avec les colonnes pour tout voir l'ensemble des données de chacune
- À partir de ces données, vous pourrez créer divers outils linguistiques, tels qu'un correcteur orthographique ou une banque de données terminologiques