Bibliothèque numérique : référencer… quoi ?

Réflexion en cours sur la façon d’articuler une bibliothèque numérique (ici, ). Tentative de trouver une nouvelle façon de référencer les documents, d’éviter les protocoles extérieurs (DOI), de ne pas se perdre dans la multiplicité des formats (papier/ISBN, numérique/epub-html-xml-pdf-doc-pff!).

N’ai pas trouvé de réponse. (Pas encore ?)

Quelques explications supplémentaires. Mon intérêt pour Zotero est fragilisé par la difficulté de renseigner tous les champs, par son (actuel) confinement à Firefox, par une interface qui me semble toujours trop directement héritée des Endnote de ce monde (quelle horreur). Mon problème : comment gérer à la fois des pdf d’articles, des epubs d’œuvres, des scans maison d’articles et de chapitres de collectifs, des pdf d’entrées de blog, des documents transmis par des collègues, le tout sur plusieurs plateformes (tablettes, portables, nuages) ? Quel mode de référencement permettrait de ne pas alourdir la gestion (pas question de tout coter à la Dewey !) tout en tenant compte des nouveaux modes de lecture, des éparpillements sur plusieurs appareils ?

Cette problématique m’a conduit à tenter de sérier les paramètres de référencement en contexte numérique. Point de départ (point de référence) : le fichier informatique. Comment le référence-t-on, de la façon la plus simple ? On donne son titre de fichier, son type (pdf, doc, epub, odt, xls…) et son emplacement (où se trouve-t-il, sur quel volume, à quelle hiérarchie ?). Ainsi référencé, le fichier peut être parfaitement désigné dans le monde informatique : pas d’erreur entre deux entités portant le même nom mais pas la même extension (.doc vs .pdf, fichier simple vs dossier, etc.) ; identité basée sur le titre ; possibilité de confusion limitée à l’emplacement où il se trouve (le path indiquant clairement une autre variable d’identité : dans le dossier X, dans le sous-dossier Y). Petite synthèse partielle :

Cette préoccupation de localisation et d’identité est toutefois propre à une logique informatique. Si l’on tente de restreindre plus spécifiquement à un document numérique, perçu comme modalité de transmission d’un contenu, peut-on en arriver à une lecture différente de ces paramètres ? Inspiration, pour ce déplacement, de l’article d’Hubert Guillaud sur « L’industrialisation numérique », mais en particulier le commentaire de Karl Dubost qu’Hubert reprend dans son article :

Le format est un conteneur du texte. La capacité à modifier ces documents, à l’interactivité, etc. ne dépend pas du conteneur, mais du moteur de rendu (navigateur, logiciel client, etc.) Que le texte soit en XML, en html, en DB, en texte seul, importe peu.

Le fichier n’est pas intéressant en lui-même ; l’intérêt est porté sur l’expérience du fichier. De la sorte, pour l’utilisateur lambda, le référencement est possible par ce qu’il perçoit. Non pas un titre de fichier mais un titre affiché. Non pas un type de fichier (qui est donc un « conteneur ») mais le cadre dans lequel le document est intégré / objet d’un processus d’affichage (le « moteur de rendu »). L’emplacement exact du fichier importe peu, c’est la logique développée par toutes les applications de bibliothèque qui a préséance (sur OS X, pour ne prendre que cet exemple : on se moque où sont rangées nos photos classées dans iPhoto, on perd de vue où sont stockées les pièces musicales gérées par iTunes). Ce qui prend de l’importance, me semble-t-il, c’est la temporalité de l’expérience : ce cadre de lecture associé à un moment donné. Sans trop savoir comment l’app Kindle gère les lectures des œuvres qu’elle supporte, on peut prétendre que c’est la combinaison d’un paramètre spatial interne (à quelle page) et d’un paramètre temporel (à quel moment), pour synchroniser les lectures et s’assurer que le lecteur retrouve l’espace-temps de sa dernière lecture.

Depuis l’expérience de lecture du document numérique, les paramètres déterminants semblent bien différents des logiques hiérarchiques et binaires du filesystem-type en informatique.

Il n’en reste pas moins qu’aux yeux de tout un chacun (je peux servir d’échantillon) il y a une distance entre ce qui est affiché (donc tous les artifices de l’affichage : mise en page, typo, graphisme, fonctions annexes) et le contenu pour ce qu’il est, le texte lui-même. En ce sens, il existerait une troisième incarnation possible, plus minimale que le document numérique et le fichier informatique. Y a-t-il possibilité de s’y référer également ? L’identité reposerait ainsi sur le titre du texte, tel qu’il figure dans le texte même. Le type renverrait à la syntaxe du texte : à la fois la syntaxe déterminée par un code linguistique et la mise en ordre du texte (disposition recueillistique, assemblage des chapitres ou des fragments) ; à la fois la nature de cette organisation et sa qualité (style, richesse, réussite). Le référencement hiérarchique ou temporel, dans cette troisième incarnation, ne peut être autre que le code lui-même, l’écriture du texte : lorsqu’on se reporte au texte lui-même et que son encodage importe peu, c’est la lettre qui nous importe — d’où ces requêtes pour une séquence exacte de lettres et de mots, inscrites entre guillemets dans notre moteur de recherche favori. L’identité du texte réside dans cette combinaison unique de caractères, de ponctuation et d’espaces, comme Borges l’avait bien pressenti dans sa « Bibliothèque de Babel ».

Ainsi placées, ces incarnations se démarquent par leur relation plus ou moins étroite avec le support, avec le code, avec l’interface. Le fichier informatique semble se cantonner à la stabilité d’une relation contenu-contenant : on pourrait décrire celle-ci comme une incarnation donnée. Par opposition, le document numérique serait toujours inscrit dans une expérience, d’où cette temporalité et la possibilité de couches de sens superposées mais singulières (les annotations, principalement) ; la relation serait celle d’une occurrence. En revanche, revenir à la lettre du texte, c’est révéler sa nature d’artefact (une relation immanente ?), où la dimension construite, produite du texte se donne comme principale caractéristique (comme dénominateur commun en regard d’autres textes).

Les fondamentalistes informatiques diront que le filesystem a toujours préséance (même s’il est dissimulé) ; les littéraires diront que le texte importe plus que ses incarnations ; les fervents de culture numérique prôneront une mise en valeur de l’expérience numérique. Positions irréconciliables ? Sûrement pas, parce qu’elles parlent des facettes d’une expérience complexe et en décrivent les visages multiples mais complémentaires.

Reste à imaginer comment construire sa bibliothèque — en restreignant à un mode d’incarnation ? en documentant les trois visages à la fois ? Les usages varient sûrement d’une discipline à l’autre, d’un usage à l’autre… Mais les trois modes d’accès doivent pouvoir cohabiter.

Share

Pour une véritable bibliothèque numérique personnelle

porte« À travers la porte vitrée de la salle d’attente… »

Les nuages fragmentés en différents lieux

J’aime bien les nuages. Ils sont souvent jolis, parfois pratiques. Mais je reste fondamentalement attaché à l’inscription de mes documents sur un disque dur local, que ce soit par sécurité, par souhait de les manipuler quand/où/comment je veux. Parfait pour la synchronisation, pour les copies de sauvegarde, pour des accès distants occasionnels.

Mais voilà, pour moi, les plateformes mobiles ne sont pas des accès distants occasionnels. Ils font partie de mon quotidien, et la frontière entre les appareils est un irritant. On compose bien maintenant avec le courriel, l’agenda, les contacts. Qu’en sera-t-il pour nos livres numériques ?

D’abord, il y a multiplication des applications : Kobo, Kindle, Ibooks, Stanza, eReader, La Hutte, Wattpad, pour ne nommer que celles que j’ai essayées. Chacune d’entre elles stocke à l’interne les fichiers qu’elle permet de télécharger, et chacune ne peut afficher que ses propres fichiers… C’est sans compter les documents transférés manuellement, stockés dans des applis de transfert comme l’excellent GoodReader (mais interlogiciellement trop limité, malheureusement). Ensuite : comment savoir où se trouve ma copie numérique de Madame Bovary ? Par déduction, je peux éliminer quelques applis (toutes ne donnent pas accès à des œuvres en français), ce qui limite le nombre d’applications à ouvrir pour vérifier — sympathique démarche, s’il en est une. Et totalement ridicule.

Jusqu’à maintenant, la gestion de mes documents numériques était relativement simple. En local, utilisation de Zotero pour référencer une bibliothèque sur mon poste de travail : articles scientifiques obtenus par des banques de données, oeuvres de publie.net que je veux pouvoir consulter hors ligne, documents téléchargés, textes de mes communications, tables des matières numérisés d’ouvrages papier… En ligne, c’est Diigo qui me sert à retenir des pages, des articles en ligne et plusieurs highlights. Mais la frontière tend à s’estomper (je télécharge le Remix de Lessig et le référence dans Zotero ou je le pointe en ligne avec Diigo ?). Et c’est sans compter l’intrusion du iPad, qui fragilise le statut jusque là stable de la bibliothèque locale… Quelle solution pour gérer cette écologie documentaire complexe ?

Une bibliothèque personnelle rassembleuse

Une porte d’entrée unique : voilà ce qui (me) manque. Une porte vitrée, qui me donne simplement à voir. Naïvement, ça me semble possible :

– une application qui pompe les métadonnées des fichiers que je lui pointe (ou des fichiers contenus dans des dossiers) : nul besoin d’un système de tracking des fichiers, simplement une mise à jour à intervalles réguliers qui donne l’état des lieux de mes fichiers ;

– une application qui soit limitée à un support, ce serait déjà bien, mais qui puisse me tenir informé de mes fichiers sur mon poste, sur mes appareils mobiles, sur mes stockages distants ;

– l’application moissonnerait les métadonnées souvent incluses dans les fichiers achetés et permettrait d’en ajouter une couche — pour la description des fichiers non renseignés, pour l’augmentation de la description de façon personnelle (tags, formes de classement).

Forme éclatée ? Pourtant, c’est déjà l’allure actuelle des catalogues de bibliothèques, qui pointent autant des références physiquement rassemblées en un lieu que des ressources en ligne, hors les murs de la bibliothèque… Et ce serait diablement au service des usages, plutôt qu’un gadget jetant de la poudre aux yeux. Un maillon qui ferait de nos quincailleries informatiques des outils pleinement organisables en fonction de nos besoins, et non des béquilles qui nous aident certes à marcher, mais qui nous font claudiquer.

Share

La diffusion du discours savant en évolution : livre, articles, web… (ou la fable des six aveugles indiens)

Ben Vershbow, sur if:book, fait écho et commente les réflexions de Thomas Mann, un bibliothécaire qui s’interroge sur le rôle que ses collègues et lui pourront tenir dans la recherche scientifique. Son prétexte: à partir d’une question posée par un étudiant (sur la guerre du Péloponnèse), il tente d’évaluer la pertinence et l’efficacité d’une recherche en bibliothèque et d’une recherche sur Internet. C’est toute la problématique de la recherche documentaire qui émerge : cohérence des résultats, liens à établir entre les pièces trouvées, hiérarchisation des résultats, validation, etc. [Il y a là matière à un bel exposé sur les principes de la recherche documentaire, sur sa logique et son fonctionnement…]

La fable des six aveugles indiens (l’un décrivant l’éléphant dont il touche la patte comme un arbre, l’autre effleurant le flanc le figurant comme un mur…) sert à montrer comment l’entrelacs des données (toutes partielles) est fondamental dans la perception de la complexité d’une question (toutes les descriptions des aveugles étant insuffisantes pour donner un aperçu satisfaisant de la structure d’ensemble de l’éléphant). Mann aborde également la question des folksonomies, qu’il replace fort à propos dans son contexte (outil complémentaire aux catalogages classiques et non panacée).

Vershbow termine son article sur la question de l’avenir du discours savant : qu’arrivera-t-il si les chercheurs délaissent les formats conventionnels (monographies, ouvrages offrant des synthèses) au profit de formats mieux adaptés aux TIC, aux médias électroniques ? Et donc, à quoi serviront les bibliothécaires ?

True, librarians have gotten very good at organizing books over time, but that’s not necessarily how scholarship will be produced in the future.

C’est toute la question de l’innovation qui rejaillit, celle permettant de se coller aux besoins exprimés par les chercheurs.

La question est ouverte, est nécessaire, mais reste bien peu cadrée : les enjeux sont légion, et il importerait de les identifier, de les interroger. Conceptualisation et rédaction de discours scientifiques appuyés par de nouvelles structures logicielles; validation des contenus, édition, distribution, pérennité; indexation, catalogage, tagging… Voilà autant de balises (d’obstacles diront certains, de défis diront d’autres) qu’il faut prendre en considération dans cette volonté de s’ouvrir à de nouvelles voies pour le discours savant.

Share