Bibliothèque numérique : référencer… quoi ?

Réflexion en cours sur la façon d’articuler une bibliothèque numérique (ici, ). Tentative de trouver une nouvelle façon de référencer les documents, d’éviter les protocoles extérieurs (DOI), de ne pas se perdre dans la multiplicité des formats (papier/ISBN, numérique/epub-html-xml-pdf-doc-pff!).

N’ai pas trouvé de réponse. (Pas encore ?)

Quelques explications supplémentaires. Mon intérêt pour Zotero est fragilisé par la difficulté de renseigner tous les champs, par son (actuel) confinement à Firefox, par une interface qui me semble toujours trop directement héritée des Endnote de ce monde (quelle horreur). Mon problème : comment gérer à la fois des pdf d’articles, des epubs d’œuvres, des scans maison d’articles et de chapitres de collectifs, des pdf d’entrées de blog, des documents transmis par des collègues, le tout sur plusieurs plateformes (tablettes, portables, nuages) ? Quel mode de référencement permettrait de ne pas alourdir la gestion (pas question de tout coter à la Dewey !) tout en tenant compte des nouveaux modes de lecture, des éparpillements sur plusieurs appareils ?

Cette problématique m’a conduit à tenter de sérier les paramètres de référencement en contexte numérique. Point de départ (point de référence) : le fichier informatique. Comment le référence-t-on, de la façon la plus simple ? On donne son titre de fichier, son type (pdf, doc, epub, odt, xls…) et son emplacement (où se trouve-t-il, sur quel volume, à quelle hiérarchie ?). Ainsi référencé, le fichier peut être parfaitement désigné dans le monde informatique : pas d’erreur entre deux entités portant le même nom mais pas la même extension (.doc vs .pdf, fichier simple vs dossier, etc.) ; identité basée sur le titre ; possibilité de confusion limitée à l’emplacement où il se trouve (le path indiquant clairement une autre variable d’identité : dans le dossier X, dans le sous-dossier Y). Petite synthèse partielle :

Cette préoccupation de localisation et d’identité est toutefois propre à une logique informatique. Si l’on tente de restreindre plus spécifiquement à un document numérique, perçu comme modalité de transmission d’un contenu, peut-on en arriver à une lecture différente de ces paramètres ? Inspiration, pour ce déplacement, de l’article d’Hubert Guillaud sur « L’industrialisation numérique », mais en particulier le commentaire de Karl Dubost qu’Hubert reprend dans son article :

Le format est un conteneur du texte. La capacité à modifier ces documents, à l’interactivité, etc. ne dépend pas du conteneur, mais du moteur de rendu (navigateur, logiciel client, etc.) Que le texte soit en XML, en html, en DB, en texte seul, importe peu.

Le fichier n’est pas intéressant en lui-même ; l’intérêt est porté sur l’expérience du fichier. De la sorte, pour l’utilisateur lambda, le référencement est possible par ce qu’il perçoit. Non pas un titre de fichier mais un titre affiché. Non pas un type de fichier (qui est donc un « conteneur ») mais le cadre dans lequel le document est intégré / objet d’un processus d’affichage (le « moteur de rendu »). L’emplacement exact du fichier importe peu, c’est la logique développée par toutes les applications de bibliothèque qui a préséance (sur OS X, pour ne prendre que cet exemple : on se moque où sont rangées nos photos classées dans iPhoto, on perd de vue où sont stockées les pièces musicales gérées par iTunes). Ce qui prend de l’importance, me semble-t-il, c’est la temporalité de l’expérience : ce cadre de lecture associé à un moment donné. Sans trop savoir comment l’app Kindle gère les lectures des œuvres qu’elle supporte, on peut prétendre que c’est la combinaison d’un paramètre spatial interne (à quelle page) et d’un paramètre temporel (à quel moment), pour synchroniser les lectures et s’assurer que le lecteur retrouve l’espace-temps de sa dernière lecture.

Depuis l’expérience de lecture du document numérique, les paramètres déterminants semblent bien différents des logiques hiérarchiques et binaires du filesystem-type en informatique.

Il n’en reste pas moins qu’aux yeux de tout un chacun (je peux servir d’échantillon) il y a une distance entre ce qui est affiché (donc tous les artifices de l’affichage : mise en page, typo, graphisme, fonctions annexes) et le contenu pour ce qu’il est, le texte lui-même. En ce sens, il existerait une troisième incarnation possible, plus minimale que le document numérique et le fichier informatique. Y a-t-il possibilité de s’y référer également ? L’identité reposerait ainsi sur le titre du texte, tel qu’il figure dans le texte même. Le type renverrait à la syntaxe du texte : à la fois la syntaxe déterminée par un code linguistique et la mise en ordre du texte (disposition recueillistique, assemblage des chapitres ou des fragments) ; à la fois la nature de cette organisation et sa qualité (style, richesse, réussite). Le référencement hiérarchique ou temporel, dans cette troisième incarnation, ne peut être autre que le code lui-même, l’écriture du texte : lorsqu’on se reporte au texte lui-même et que son encodage importe peu, c’est la lettre qui nous importe — d’où ces requêtes pour une séquence exacte de lettres et de mots, inscrites entre guillemets dans notre moteur de recherche favori. L’identité du texte réside dans cette combinaison unique de caractères, de ponctuation et d’espaces, comme Borges l’avait bien pressenti dans sa « Bibliothèque de Babel ».

Ainsi placées, ces incarnations se démarquent par leur relation plus ou moins étroite avec le support, avec le code, avec l’interface. Le fichier informatique semble se cantonner à la stabilité d’une relation contenu-contenant : on pourrait décrire celle-ci comme une incarnation donnée. Par opposition, le document numérique serait toujours inscrit dans une expérience, d’où cette temporalité et la possibilité de couches de sens superposées mais singulières (les annotations, principalement) ; la relation serait celle d’une occurrence. En revanche, revenir à la lettre du texte, c’est révéler sa nature d’artefact (une relation immanente ?), où la dimension construite, produite du texte se donne comme principale caractéristique (comme dénominateur commun en regard d’autres textes).

Les fondamentalistes informatiques diront que le filesystem a toujours préséance (même s’il est dissimulé) ; les littéraires diront que le texte importe plus que ses incarnations ; les fervents de culture numérique prôneront une mise en valeur de l’expérience numérique. Positions irréconciliables ? Sûrement pas, parce qu’elles parlent des facettes d’une expérience complexe et en décrivent les visages multiples mais complémentaires.

Reste à imaginer comment construire sa bibliothèque — en restreignant à un mode d’incarnation ? en documentant les trois visages à la fois ? Les usages varient sûrement d’une discipline à l’autre, d’un usage à l’autre… Mais les trois modes d’accès doivent pouvoir cohabiter.

Share

Veille de la culture numérique : des pour, des contre

L’ambition d’étudier la culture numérique est à la fois démesurée et nécessaire. Tentaculaire, la culture numérique vient rejoindre des dimensions multiples des pratiques artistiques et culturelles d’aujourd’hui, qu’elles soient totalement ancrées dans le champ numérique ou seulement en marge.

Comment dès lors contribuer à cette saisie ? Les regroupements scientifiques, les chercheurs de tous ordres et les observateurs de la culture s’y plongent, avec une frilosité ou un inconfort très variables. Leur prise en charge de ces réalités sera rapide / documentée / cadrée / approfondie en fonction de leur posture, en fonction également des moyens et perspectives disponibles (quels cadres conceptuels nous aident à rendre compte de la culture numérique ? peut-on étudier les pratiques numériques sans s’engager massivement dans les bouleversements indus par le recours à la technologie ? etc.).

La porte d’entrée consiste néanmoins à faire état du champ lui-même : qui, quoi, comment (étudier la culture numérique) ? Il paraît important, pour soutenir le développement du champ d’étude, d’opérer une veille. À titre de déblayage, quelques pour et contre l’idée d’un carnet de veille de la culture numérique :

Pour :

  • identifier les intervenants actuels du champ, éventuellement les mettre en réseau ;
  • faire connaître des travaux récemment disponibles (articles, dossiers de revue, thèses, monographies, outils) ;
  • publiciser des événements (conférences, camps, colloques, rencontres) ;
  • démontrer la masse critique de travaux dans le champ et légitimer l’objet d’étude ;
  • favoriser une distance critique permettant une étude plus objective, moins ancrée dans les mouvements infléchis par les effets de mode technologiques (nouveaux appareils, nouvelles fonctions, popularité contextuelle de modes de transmission ou de modalités de mise en réseau) ;

Contre :

  • se mettre en position passive par rapport au champ ;
  • perpétuer le décalage souvent reproché au monde académique en regard des pratiques actuelles ;
  • créer un ensemble indéterminé de manifestations, références, objets… qui ne donne pas une idée claire des lignes de force du champ ;
  • être trop en phase avec la seule actualité des travaux ;
  • avoir une perspective trop restreinte sur ce que désigne l’expression « culture numérique » ;

Alors, ces objections sont-elles fondées ? (et susceptibles d’éteindre ce projet ?) Quelques réponses possibles :

Contre-contre :

  • passivité et décalage : un carnet de veille peut recenser passivement les traces de ce champ d’étude, mais il peut également contribuer à ce dernier par des articles de synthèse, par des regards critiques (forme d’éditoriaux, de coups de gueule, d’analyses), voire des contenus inédits publiés par cette voie ;
  • ensemble indéterminé : il paraît important de tenter, dès l’étape de la veille, de saisir comment se développent la culture numérique elle-même autant que le champ d’étude qui la chapeaute ; une diversité de collaborateurs peut d’emblée offrir des visions complémentaires, par un outil qui répercutera ces sous-ensembles, ces cristallisations possiblement nouvelles en regard des silos disciplinaires actuellement connus ;
  • actualité : les regards critiques, autant que les archives du carnet et les intuitions des collaborateurs, permettent de ne pas rester en seule perspective testimoniale ;
  • perspective restreinte : chaque individu a ses zones de confort et d’intérêt ; si l’on multiplie le nombre de ces individus, on en arrive à une vision plus complexe et nécessairement plus étoffée du champ.

Œuvre collective, ouverte à une perspective critique, à de possibles contradictions internes, à une évolution de l’objet mis en veille : définition pragmatique de ce carnet. Reste à accoucher.

(photo : « Digital Basquort », kygp, licence CC)

Share

Étudier la culture numérique

Après avoir poussé un soupir en fin d’année dernière, j’ai tout laissé décanter. Les derniers mois, du point de vue littérature+technologie, ont été le lieu d’un bouillonnement intense, ce qui m’a conduit à un éparpillement dans diverses pistes toutes plus intéressantes/stimulantes les unes que les autres. Difficile de ne pas être fasciné par l’émergence concrète des livres électroniques, par la montée des digital humanities, par la diffusion numérique des œuvres littéraires, par les moyens qu’offre la technologie à l’exercice des études littéraires…

J’essaie, pour moi-même d’abord et avant tout, de faire un peu de ménage dans tout ça. Quelques observations et questions commencent à émerger :

  • les champs d’intervention regroupés sous l’étiquette du « numérique » sont infiniment larges et multiples et ne peuvent être fondus en une seule approche ou problématique générale ;
  • les acteurs impliqués dans ces champs se parlent a priori très peu (les bulles sont assez incroyablement résistantes, surtout lorsqu’elles calquent les silos pré-numériques : libraires, éditeurs, directeurs de revues scientifiques, auteurs/créateurs, distributeurs, universitaires (de champs disciplinaires divers), programmeurs, graphistes…) ;
  • du point de vue du chercheur universitaire, il est difficile de se mailler aux réflexions de terrain : c’est sûrement le lieu d’une observation directe sur les mutations en cours (je pense notamment aux bookcamps), mais quel apport possible à cette mouvance souvent ancrée dans des impératifs commerciaux ou techniques ?
  • pour avoir récemment suivi d’un peu plus près les initiatives du champ des digital humanities (à titre d’exemple plus inscrit dans le temps : la rédaction et la diffusion du manifeste des DH dans le sillage du ThatCAMP Paris, en mai dernier), je reste aujourd’hui avec une certaine insatisfaction (merci à Louis É. pour le dialogue qui m’a aidé à mettre le doigt sur ce qui m’irritait) : l’exercice des DH est présentement marqué par une fascination techniciste qui fait souvent perdre de vue les objets au profit de la méthode, qui permet aux techniques d’escamoter les faits culturels… mais loin de moi de vouloir jeter le bébé avec l’eau du bain, car l’avancement de ces méthodes est précieux! il faut dire que ce type de décentrement est courant lors de la mise en place de nouvelles approches, de nouvelles méthodologies — mais le renouvellement constant de la technologie me fait craindre le report constant d’une bascule inverse vers les objets, où les méthodes informatiquement assistées reprendront leur rôle d’appui à la recherche.

    Alors quoi maintenant ? Se réfugier dans les terres confortables ? Très peu pour moi. Plutôt essayer, se tromper, moduler, travailler à comprendre. Réflexe de chercheur, évidemment (comme celui de faire des tableaux, cf. plus bas), mais qui est conséquent de la distance que j’ai par rapport aux objets.

    Donc se lancer : comment organiser toutes ces alvéoles de la question numérique concernant la culture ? je n’ai pas la prétention de tout saisir. À tout le moins commencer par ce qui m’est davantage connu. Première tentative (cliquer sur l’image) :

    Premier effort : tenter de distinguer où s’insère le numérique… dans les outils pour parler de la culture ou dans les manifestations culturelles elles-mêmes. En émerge un postulat fondateur (le mien, à tout le moins) : la culture numérique, c’est autant la culture étudiée par le numérique (l’étude numérique de la culture) que l’étude de la culture en contexte numérique (la culture empreinte par le numérique).

    Deuxième effort : distinguer ce qui retient l’attention. D’où cet appel aux catégories canoniques de la création, de l’œuvre et de sa réception (qui sont peu conséquentes, je le concède, du brouillage actuel entre écriture et lecture, dans un processus qui n’est plus aussi rectiligne, cela va de soi <tentative d’éviter les rebuffades>). Découpage imparfait, mais qui permet de mettre en lumière que certains champs ont une amplitude très grande, d’autres qui ont un focus très restreint.

    Commentaires liés :

    • Évidemment, la séparation en six sous-domaines est contingente… C’est ma vision, pas nécessairement légitime (à titre d’exemple : mon intérêt pour la diffusion des contenus de la recherche me fait joindre la case du milieu, colonne de droite, qui n’a pas de lien très justifiable avec le portrait du volet littérature que je prétends dresser).
    • Découpage : il est imparfait parce que les sous-domaines se chevauchent inévitablement… Faire une catégorie avec les liseuses, c’est restreindre à une dimension technique qui est intimement liée à l’examen des modalités de sociabilité qui entourent la lecture en contexte numérique, qui est aussi liée à l’édition numérique (entendue ici comme la distribution numérique d’œuvres qui ne sont pas marquées par des fonctionnalités hypermédiatiques), etc.
    • Comme je parle avec la lunette du chercheur, le regard distant (l’étude sur…) est nécessaire dans tous les cas de figure. Et corollairement, cette flèche pourrait être en bleu dans les six schémas : la diffusion des études est toujours possible numériquement. J’ai simplement voulu montrer en quoi le processus d’étude était d’emblée numériquement déterminé.

      À quoi cela me servira-t-il ? À me rappeler que ces vases sont communicants, d’une façon ou d’une autre, mais que les déterminants internes sont forts et contraignants. À jeter un regard englobant sur l’ensemble du champ, aussi éclaté soit-il. À affirmer l’existence d’une culture numérique, qu’il faut repérer, saisir et étudier. Individuellement et collectivement (volontaires, manifestez-vous !).

      Share

      Bibliothèque numérique, suite : extraction

      La réflexion sur l’organisation de la documentation numérique se poursuit tranquillement, au hasard des lectures et découvertes. Persiste, de plus en plus fort, le sentiment que la joute de la culture numérique passe par cette saisie des ensembles documentaires qui nous entourent. Apple a gagné une partie de la manche, pour ceux qui adoptent le modèle. Sinon, avec last.fm, avec spotify, avec des logiciels concurrents, comment les gens gèrent-ils leurs bibliothèques musicales ? Les multiplient-ils volontiers ? Comment les utilisent-ils ? Comment s’y retrouvent-ils ?

      Dans le travail à faire pour rassembler les données liées aux documents numériques que je possède, la tâche la plus fastidieuse est certainement le renseignement des champs de métadonnées. Pas pour utiliser les fonctions de citation automatique (dans Word, dans OpenOffice) — le volume de citations dans mes travaux n’est pas à ce point élevé —, mais plutôt pour ne pas perdre ces références et pouvoir les retrouver. La lecture d’un article de ProfHacker sur Mendeley attire mon attention sur un test (non scientifique, mais pragmatique !) d’importation des citations depuis un lot de pdfs. C’est un point de départ…

      Let me stress again, this is a test I did out of curiosity. A sample of 15 articles clearly isn’t enough to provide anything but my subjective impressions. For one thing it covers only articles mostly from ScienceDirect, Wiley and ACM Digital Library. Results will differ in particular if you get papers from say JSTOR.

      Also due to the search topic used, understandably the articles pulled up are all new (2005 and after), the results will probably differ a lot if articles used were say from the 90s or even older, as the pdfs available would be different (no metadata embeded or worse just scanned pdfs).

      Investigation à poursuivre, donc : quel procotole de description des métadonnées ces BD utilisent-elles ? quelle force déductive les moteurs d’extraction des pdfs ont-ils vraiment ? Plus encore : qu’arrive-t-il de cette performance avec de la documentation non scientifique comme des livres numériques ? Un test à faire… (je me le promets éventuellement dans Zotero et Mendeley ; Endnote d’aucun intérêt pour moi)

      Fonction corollaire : les dossiers surveillés, qui importent automatiquement les fichiers qui y sont placés. Possibilité d’avoir accès aux dossiers d’un iPad pour recenser les livres téléchargés (en dehors d’une version jailbreakée) ? Difficile d’imaginer fonctionner autrement, puisque les fichiers sont bloqués à l’intérieur des applications (ou laborieusement re-déposables (?), si certaines rares applications comme Stanza permettent l’exportation et l’importation via iTunes). À défaut du filesystem accessible, est-ce que la fonction de recommandation de ces applications (mail, twitter, fb) pourrait transporter les métadonnées correctement structurées avec elle ?

      Je ne peux pas croire que l’on laissera tous les non-geeks se perdre dans leurs téléchargements épars, leurs boîtes de transfert, leurs documents transmis en pièce jointe… et leur donner raison sur le fait que tout ceci est un foutoir monumental.

      Share

      Pour une véritable bibliothèque numérique personnelle

      porte« À travers la porte vitrée de la salle d’attente… »

      Les nuages fragmentés en différents lieux

      J’aime bien les nuages. Ils sont souvent jolis, parfois pratiques. Mais je reste fondamentalement attaché à l’inscription de mes documents sur un disque dur local, que ce soit par sécurité, par souhait de les manipuler quand/où/comment je veux. Parfait pour la synchronisation, pour les copies de sauvegarde, pour des accès distants occasionnels.

      Mais voilà, pour moi, les plateformes mobiles ne sont pas des accès distants occasionnels. Ils font partie de mon quotidien, et la frontière entre les appareils est un irritant. On compose bien maintenant avec le courriel, l’agenda, les contacts. Qu’en sera-t-il pour nos livres numériques ?

      D’abord, il y a multiplication des applications : Kobo, Kindle, Ibooks, Stanza, eReader, La Hutte, Wattpad, pour ne nommer que celles que j’ai essayées. Chacune d’entre elles stocke à l’interne les fichiers qu’elle permet de télécharger, et chacune ne peut afficher que ses propres fichiers… C’est sans compter les documents transférés manuellement, stockés dans des applis de transfert comme l’excellent GoodReader (mais interlogiciellement trop limité, malheureusement). Ensuite : comment savoir où se trouve ma copie numérique de Madame Bovary ? Par déduction, je peux éliminer quelques applis (toutes ne donnent pas accès à des œuvres en français), ce qui limite le nombre d’applications à ouvrir pour vérifier — sympathique démarche, s’il en est une. Et totalement ridicule.

      Jusqu’à maintenant, la gestion de mes documents numériques était relativement simple. En local, utilisation de Zotero pour référencer une bibliothèque sur mon poste de travail : articles scientifiques obtenus par des banques de données, oeuvres de publie.net que je veux pouvoir consulter hors ligne, documents téléchargés, textes de mes communications, tables des matières numérisés d’ouvrages papier… En ligne, c’est Diigo qui me sert à retenir des pages, des articles en ligne et plusieurs highlights. Mais la frontière tend à s’estomper (je télécharge le Remix de Lessig et le référence dans Zotero ou je le pointe en ligne avec Diigo ?). Et c’est sans compter l’intrusion du iPad, qui fragilise le statut jusque là stable de la bibliothèque locale… Quelle solution pour gérer cette écologie documentaire complexe ?

      Une bibliothèque personnelle rassembleuse

      Une porte d’entrée unique : voilà ce qui (me) manque. Une porte vitrée, qui me donne simplement à voir. Naïvement, ça me semble possible :

      – une application qui pompe les métadonnées des fichiers que je lui pointe (ou des fichiers contenus dans des dossiers) : nul besoin d’un système de tracking des fichiers, simplement une mise à jour à intervalles réguliers qui donne l’état des lieux de mes fichiers ;

      – une application qui soit limitée à un support, ce serait déjà bien, mais qui puisse me tenir informé de mes fichiers sur mon poste, sur mes appareils mobiles, sur mes stockages distants ;

      – l’application moissonnerait les métadonnées souvent incluses dans les fichiers achetés et permettrait d’en ajouter une couche — pour la description des fichiers non renseignés, pour l’augmentation de la description de façon personnelle (tags, formes de classement).

      Forme éclatée ? Pourtant, c’est déjà l’allure actuelle des catalogues de bibliothèques, qui pointent autant des références physiquement rassemblées en un lieu que des ressources en ligne, hors les murs de la bibliothèque… Et ce serait diablement au service des usages, plutôt qu’un gadget jetant de la poudre aux yeux. Un maillon qui ferait de nos quincailleries informatiques des outils pleinement organisables en fonction de nos besoins, et non des béquilles qui nous aident certes à marcher, mais qui nous font claudiquer.

      Share