lundi 15 juin 2009

Les coûts réels de la numérisation au sein d’une université

La Digithèque des Archives & Bibliothèques de l’ULB matérialisent (une partie de !) nos projets de numérisation de documents de nos collections. Lancée le 15 novembre 2005 avec les Annales chronologiques, littéraires et historiques de la maçonnerie des Pays-Bas à dater du 1er janvier 1814 d’Auguste de Wargny, la Digithèque s’est enrichie, progressivement, d’une Digithèque consacrée à Henri Pirenne, brillant historien qui fit (une partie de sa) carrière à l’ULB, d’une Digithèque réalisée en partenariat avec les Editions de l’Université de Bruxelles et d’une Digithèque de l’égyptologue Pierre Gilbert ; elle compte aujourd’hui presque 56800 pages au format PDF texte sous image (en savoir plus ? Voir : OCR : et après ? Discussion autour des formats de sorties…) ou PDF image.A l’occasion de la mise en place d’un service de numérisation de taille comparable au notre, il arrive qu’on nous demande combien coûte une page numérisée chez nous... voici donc quelques éléments de réponse, précédés de leurs pré-requis :
  • pas d’économie d’échelle possible : nous numérisons un livre à la fois, sans pouvoir constituer des lots de documents semblables pour lesquels il serait possible d’automatiser le processus ;
  • pas de numérisation de masse (nous disposons d’un scanner de livres qui les préserve… les pages sont tournées par un humain) : un prestataire s’équipe généralement de scanners automatisés (avaleur, robot tourneur de page, etc.) qu’il rentabilise par le grand nombre de pages traitées ;
  • numérisation de qualité : nous compensons le faible nombre d’ouvrages traités (car nous ne disposons que d’un petit mi-temps pour cela) par une exigence de qualité d’image relativement élevée pas forcément d’application dans des projets à plus grande échelle. Du coup, notre rendement ‘nombre de pages traitées par heure’ est moindre que si nous sacrifiions la qualité à une plus grande quantité de documents traités ;
  • des ressources humaines au coût ‘élevé’ : les personnes qui traitent nos ouvrages sont des employés des bibliothèques. Chez les prestataires de service, il s’agit généralement de personnes à contrats de travail particuliers (entreprises à but social ; voir p.e. , Village n°1 en Belgique, etc. dont la rémunération est souvent en partie subsidiée ou détaxée) ou délocalisées / du Sud (voir p.e. Infotechnique qui travaille en partie à Madagascar et ailleurs où le coût des ressources humaines est beaucoup plus faible).

Ceci étant dit, nous estimons aux bibliothèques, traiter (i.e. numérisation, traitements d’image, binarisation, sauvegarde des fichiers couleurs et création du PDF) 4min/p (soit un peu plus de 6h30 pour traiter complètement un ouvrage de 100p). Nous avons également estimé le temps nécessaire pour océriser une page (sans vérification manuelle) : 1min/p (soit un peu plus d’1h30 pour un ouvrage de 100p ; l’océrisation pouvant en général être effectuée en tâche de fond automatique sur un ordinateur dédié)… il suffit de (dé)multiplier ce temps par le coût horaire de l’opérateur pour obtenir le coût de numérisation d’une page.

Les Bibliothèques ont obtenu un financement pour un projet de numérisation ; nous en avons donc profité pour faire appel à un prestataire extérieur pour le traiter (voir notre billet Digithèque des EUB : du texte sous les images !). Le coût facturé par celui-ci, pour la numérisation et l’océrisation a été de 0.344 euro/page… auquel il convient d’ajouter le coût du travail que nous avons réalisé : préalablement (cahier des charge, récolement des fonds pour constituer l’ensemble de documents à traiter) et a posteriori (contrôle qualité et feedback vers l’opérateur, finalisation des PDFs, alimentation du site web, modification des notices du catalogue), que nous estimons à 0.486 euro/p ; un total donc de 0.83 euro/page.

De cette expérience, nous tirons la leçon suivante : il est particulièrement pertinent de faire appel à un prestataire extérieur lorsque le lot à traiter représente un certain volume (économie d’échelle pour le transport des ouvrages et leur traitement), et ceci est d’autant plus ‘rentable’ que le lot est homogène et qu’il nécessite peu ou pas d’intervention manuelle de l’opérateur.De fait, le coût de numérisation proposé par les prestataires va varier considérablement en fonction du volume, de l’état, de la fragilité et rareté du type de fonds à traiter, de la qualité attendue, des délivrables demandés (qui sont donc fonction des besoins : préservation à long terme, consultation, sauvegarde uniquement, etc.).

Aucun commentaire: