A strategic partnership created by Érudit and the Public Knowledge Project.

Services aux chercheurs

Accédez à la plus grande collection numériques de publications canadiennes et québécoises en plein texte à des fins de recherche.

 
CO-icones-ServicesChercheurs.png

Services aux chercheurs

Coalition Publica soutient les pratiques de recherche novatrices en sciences humaines et sociales, arts et lettres, par le développement de vastes ensembles de données textuelles, la curation de données bibliométriques et la mise à disposition de logiciels libres d’édition savante numérique.

 

 

Données textuelles

Donner accès à un véritable réservoir de données massives (big data) de nature textuelle 

Le texte joue un rôle central en sciences humaines et sociales, et en arts et lettres. Matière première de la recherche, le texte est aussi le véhicule privilégié de diffusion de ses résultats. Sous format numérique, et rassemblé en de vastes ensembles de publications en texte intégral, le texte devient une donnée de recherche dont le potentiel pour la génération de nouveaux savoirs est très grand.

Description de la collection : L’étendue des publications rassemblées fait de nos corpus de recherche une ressource de première importance pour la recherche dans de nombreux secteurs du savoir : histoire, sociologie, linguistique, économie, littérature et bien d'autres. Nos corpus soutiennent des travaux qui intègrent de façons variées le numérique : analyse du discours, traitement automatique de la langue, intelligence numérique ou encore fouille textuelle.   

  • Revues, quotidiens, magazines

    • Érudit, 239 revues, couverture de 1922 à 2021, 475 031 fichiers, 161 Go

    • Bibliothèques et Archives nationales du Québec, couverture à partir du 18e siècle, 3 614 971 fichiers, 11 To

    • Canadiana/RCDR, couverture à partir du 18e siècle jusqu’à 1930, 80 085 fichiers, 405 Go

    • Bibliothèque et Archives Canada, 3 publications, couverture de 1820 à 1917, 789 fichiers, 5 Go

  • Débats parlementaires

    • Conclusion du Cabinet, couverture de 1944 à 1979, 41 249 fichiers, 10 Go

    • Gazette du Canada, couverture de 1842 à 1997, 14 560 fichiers, 206 Go

    • Journal des débats de l’Assemblée nationale du Québec, couverture de 1908 à 2019, 33 339 fichiers, 31 Go 

  • Rapports gouvernementaux

    • Rapports des peuples autochtones


Données bibliométriques 

Stimuler l’étude de l’écosystème de la recherche

Envisagées comme objets intellectuels portant les traces de l’évolution conceptuelle, sociale ou historique de la science, les publications scientifiques sont une ressource unique pour qui étudie la science comme objet social, questionnant comment la recherche se constitue, se communique, se relaie, ou encore comment l’écosystème de la recherche est structuré et comment les connaissances scientifiques se développent. 

Description de la collection : la collection de données bibliométriques couvrent les revues diffusées sur erudit.org

  • Métadonnées et texte intégral balisé sémantiquement (toute la collection)

    • 128 revues, numéros d’archives et numéros courants, métadonnées et plein texte balisés en XML EruditArticle, compatible avec JATS XML, mise à jour annuelle

    • Pour un aperçu de la structuration du corpus, voir le schéma XML EruditArticle, et consulter notre documentation

  • Métadonnées enrichies (articles publiés de 2015 à 2020)

    • Métadonnées enrichies de 21 298 articles savants publiés de 2015 à 2020 sur erudit.org : nombre d’auteurs, ordre d’apparition, genre du premier auteur, affiliation, type d'accès, etc.

    • Pour la liste complète des métadonnées colligées ainsi que leur description, vous pouvez nous joindre à l’adresse suivante : corpus@erudit.org.


Modalités d’accès aux données 

Données textuelles et bibliométriques : l’accès aux corpus est réservé à des fins de recherche et d’enseignement. Il est soumis à la loi canadienne sur le droit d’auteur. Les chercheurs et étudiants qui accèdent aux corpus s'engagent à ne pas diffuser ni commercialiser les publications des corpus. La marche à suivre est la suivante : 

  1. Complétion et transmission d’un formulaire de description de projet (contactez nous à corpus@erudit.org pour demander le formulaire)

  2. Évaluation du projet sur la base des critères suivants : la personne demanderesse est rattachée à une institution d’enseignement; elle confirme que les corpus ne seront pas utilisés à des fins commerciales ni diffusés dans leur intégralité 

  3. Signature d’un contrat d’utilisation

  4. Création d’un compte sur Calcul Canada

  5. Téléchargement (clé SSH, l’outil de transfert Globus). 

Métadonnées enrichies : les métadonnées enrichies sont disponibles pour téléchargement sur Dataverse. Elles sont accessibles sous licence CC0. À des fins de suivi, il est demandé aux usagers de s’identifier lors du téléchargement.

Formations : Pour en apprendre plus sur les possibilités de recherche qu’offrent ces corpus et sur les façons de les utiliser, nous vous recommandons de consulter le programme des formations offertes par Calcul Québec et l’Alliance de recherche numérique du Canada. Vous pouvez aussi vous inscrire à l’infolettre de Calcul Québec afin d’être au courant des prochains événements.

Contact : une équipe d’experts vous guide pour un accès rapide et efficace aux données textuelles et bibliométriques de notre dépôt de recherche. Si vous avez des questions ou des commentaires, vous pouvez nous joindre à l’adresse suivante : corpus@erudit.org.

 

 

Logiciels ouverts d’édition scientifique 

Soutenir l’avancement technologique des systèmes de production et de diffusion d’information scientifique 

Les logiciels libres et les standards ouverts d’édition scientifique résultent de recherches appliquées sur les systèmes de production et de diffusion d’information. Ils assument par ailleurs un rôle de vecteur de recherche additionnelle dans le secteur de l’édition scientifique numérique : les logiciels libres peuvent être utilisés, étudiés, modifiés ou encore dupliqués par quiconque le souhaite, en fonction de la licence qui leur est attribuée et des besoins des communautés. 

Description du logiciel : Open Journal Systems (OJS) est un logiciel de gestion éditoriale dédié aux revues savantes numériques hautement flexible. OJS peut être téléchargé gratuitement et installé sur un serveur Web local. OJS utilise PHP et JavaScript ainsi que MySQL/MariaDB comme base de données de stockage. OJS peut être exécutée sur des environnements de serveurs Linux/Mac et il est sous licence GNU GPL v3. L'intégration avec la plateforme erudit.org, ainsi qu’avec les services de plusieurs organisations et infrastructures oeuvrant à l’interopérabilité des systèmes et des contenus - tels que Crossref, ORCID, SWORD, etc. - est facilitée par l'utilisation de plugins, disponibles sous licences ouvertes.

Modalités d’accès et services : Les logiciels développés sont disponibles gratuitement sur la plateforme GitHub. Vous pouvez trouver la documentation OJS dans le centre de documentation de PKP, et pour contribuer à la documentation, lisez nos directives pour les contributeurs, contactez-nous, ou participez à un sprint de documentation virtuel. Nous encourageons les contributions au développement de notre logiciel, et fournissons de la documentation sur la façon d'écrire des plugins et d'étendre le logiciel (entre autres choses). Abonnez-vous à notre bulletin d'information pour les développeurs. Le personnel de PKP fournit un soutien gratuit dans le forum de la communauté PKP. PKP fournit également un soutien consultatif payant, directement par les développeurs et les techniciens de PKP, au cas par cas par le biais des services d'édition de PKP, et dans certains cas, entreprendra le développement sponsorisé de nouvelles fonctionnalités dans OJS, s'il existe un besoin démontré de la communauté.

 

Des questions? 

Pour toute question concernant les services aux chercheurs, vous pouvez communiquer avec notre équipe à l’adresse corpus@erudit.org