Corpus spécialisés

Description

Ce jeu de données propose des collections de corpus spécialisés constituées par les équipes Istex en vue d'une exploitation en traitement automatique des langues et en fouille de textes.
Les corpus sont composés de documents en texte intégral issus de la plateforme Istex et rassemblés autour d'une thématique (vieillissement) ou d'un domaine scientifique (astrophysique, orthophonie).

Financement
Ces collections de corpus s'inscrivent dans le cadre du projet Istex (2012-2018)
Organisme financeur
Agence Nationale pour la Recherche
Numéro de convention
10-IDEX-0004-02
Publication
Istex
Droits d'utilisation

L'utilisation de ces corpus est permise, à condition de les citer selon les modalités précisées dans leur instance correspondante.
A noter toutefois que l'accès aux textes intégraux composant chaque corpus est réservé aux ayants droit des organismes de l'Enseignement Supérieur et de la Recherche et, de ce fait, est soumis à authentification sur la plateforme Istex.
Les métadonnées des documents des corpus sont, quant à elles, placées sous le régime de la licence ouverte/open licence Etalab.
Pour plus de détails sur les droits d'utilisation, d'enrichissement et de diffusion des documents de ces corpus, de leurs métadonnées et des résultats de recherches issus de leur exploitation, veuillez consulter la licence Istex.

Licence Etalab
Liste des collections
Powered by Lodex 14.0.76