Centre de Ressources pour la Description de l'ORAL (CRDO)
Le groupe parisien "Gestion documentaire et réservoir de données"
Les centres de ressources numériques (CRN) sont une initiative conjointe de la Direction de l'Information Scientifique et du département Sciences Humaines et Sociales - SHS.
Le Centre de Ressources sur la Description de l'Oral (CRDO) est le Centre de Ressources Numériques centré sur les ressources orales. Il a été composé à partir de deux propositions portées respectivement par les deux laboratoires Lacito et LPL.
Le groupe parisien du CRDO correspond à la proposition portée par le Lacito et à laquelle sont associés différents laboratoires membres. Ce groupe est plus particulièrement centré sur la gestion documentaire des ressources orales et la constitution d'un réservoir de données.
L'archive ouverte
Rôle d'une archive ouverte
Une archive ouverte est un réservoir dans lequel le dépôt des données est effectué par l'auteur lui-même ou bien par une personne ou une institution, à partir du moment où celle-ci peut garantir qu'elle détient les droits ou l'autorisation des ayants-droits pour disposer des données de la sorte. Le dépositaire doit documenter son dépôt par l'intermédiaire d'un formulaire en-ligne. Une fois ce formulaire rempli et les données transmises, et après avoir passé un contrôle qualité, ces ressources sont entreposées dans un serveur qui en assure un stockage sécurisé, et qui en permet l'acces. La description du document vient alors enrichir un catalogue qui permettra de faire connaitre son existence à tous (ou juste à un groupe dans le cas d'un dépôt soumis a un contrôle d'accès) et surtout de pouvoir le retrouver parmi l'ensemble des autres documents. Le rôle d'une archive ouverte se cantonne principalement à la sauvegarde, au référencement et à l'accessibilité des documents. Pour chaque dépôt public, un identifiant unique et permanent (identifiant oai) sera communiqué au dépositaire ainsi qu'une URL qu'il pourra utiliser dans ses pages web pour citer ce document.Le type de documents autorisés
L'archive créé ici ne concerne que les ressources orales. Ne sont concernés que les enregistrements de parole et leurs annotations directes. Des contraintes de formats et de codages doivent être respectées pour déposer dans l'archive. Ces contraintes sont dues principalement à une préoccupation de maintenance et de conservation. Nous ne pouvons garantir la maintenance que des seules fichiers dont le codage et le format sont connus, publics et ne sont pas soumis à des restrictions de droits (brevets ou autres). Une liste des formats et des codages sera disponible et commentée sur ce site.La valorisation des corpus
L'accés aux données offert par l'archive ouverte consiste en une simple restitution des données déposées dans un format qui en permet l'exploitation, c'est-à-dire un format standard ouvert et libre que ce soit le format d'origine du dépôt ou un nouveau format en cas d'obsolescence du format d'origine. Pour les corpus respectant certaines contraintes de structure, une interface minimale sera fournie sur le site web du Centre de Ressources. Hormis cette restitution, les documents peuvent faire l'objet d'une valorisation, comme par exemple dans le cas de la constitution d'une collection. Il est aussi possible dans le cadre de projets de définir des interfaces et des outils de recherche spécifiques pour des corpus particuliers. Bien sur il est aussi possible de mettre en place des interfaces et des outils d'interrogation à l'extérieur et de manière indépendante du centre.
Actualité...
Statistiques:
Actuellement sont consultables dans l'archive: 1644 enregistrements public et 2653 en accès protégé pour un total de 90 langues différentes.
Actuellement sont consultables dans l'archive: 1644 enregistrements public et 2653 en accès protégé pour un total de 90 langues différentes.
Publication du guide Écrire un cahier des charges de numérisation de collections sonores, audiovisuelles et filmiques, Paris, Ministère de la Culture et de la Communication, comité de pilotage numérisation, Bibliothèque nationale de France, 2009, 33 p...(en savoir plus) 

Annonce du colloque CatCod 2008 "Premières rencontres internationales pour le Catalogage et le Codage de corpus oraux" les 4-5 Décembre 2008 à l'Université d'Orléans, France http://www.catcod.org/ 

Le TGE-Adonis lance une expérimentation sur le stockage, la conservation et l'accès à des données orales. Cette expérimentation devrait relier le CRDO, le centre de calcul de l'IN2P3 et le CINES dans une organisation sur le modèle de la norme OAIS... (en savoir plus) 

Les deux fédérations de recherche en linguistique (ILF et TUL) et le CRDO ont le plaisir d'annoncer l'ouverture publique du portail sur le "français et les langues de France" du Ministère de la Culture et de la Communication.... (en savoir plus) 

Deux ans après leur création, les centres de ressources numériques CN2SV, CRDO et TELMA ont réfléchi ensemble à l'avenir... (en savoir plus) 









