SOMMAIRE

ABU

Qu'est-ce que l'ABU ?

l'Association des Bibliophiles Universels, ou ABU (prononcer "abou") est une association loi de 1901 fondée en Avril 1993. L'association a pour objet le développement et la promotion des supports numériques permettant la libre manipulation de l'information, l'application de ces techniques à la diffusion des travaux de recherche des membres et d'informations du domaine public. Pour plus de détails, consultez nos statuts. L'Internet est devenu en quelques années un formidable outil de diffusion de la connaissance. ABU se propose de maintenir sur ce réseau un corpus le plus vaste possible de textes numérisés en français du domaine public, représentatifs de la culture francophone.

Qu'est-ce qu'un texte du domaine public ?

Le droit de la propriété littéraire est complexe. En gros, un texte tombe dans le domaine public lorsque son auteur est décédé depuis 70 ans. Les années de guerre (1914-19 et 1938- 48) comptent double. Lorsqu'un texte est dans le domaine public, tout le monde est libre de le reproduire et de le rediffuser. Cela n'autorise pas pour autant une mutilation ou une déformation de l'oeuvre: le droit moral de l'auteur (respect de l'oeuvre, paternité) est, lui, intemporel.

Attention! le fait qu'un texte soit dans le domaine public ne signifie pas qu'une édition donnée de celui-ci soit libre de reproduction! C'est le cas par exemple des éditions actuelles (et bien meilleures) de grands auteurs classiques établies à partir de manuscrits, ou de nouvelles traductions (du latin, souvent). L'appareil critique (notes, préface, ...) et éditorial (tables, index, pagination?) ne peut être reproduit.

La limite des 70 ans oblige donc des services comme ABU à appliquer, comme cela a souvent été dit, "une technologie du XXIème siècle à des éditions du XIXème"... Mais il faut bien que les auteurs (et leurs éditeurs) vivent! Cela étant dit, le domaine public francophone est IMMENSE et de très nombreux textes sont à exhumer, pour le plus grand bien des chercheurs, des enseignants et des curieux.

Pour en savoir plus: André Françon "La propriété littéraire et artistique" Que-Sais-Je? 1388.

Qu'est qu'un texte numérisé ?

Il s'agit tout bêtement d'un fichier tel que peuvent les produire les traitements de texte (Word et autres). Deux solution pour l'obtenir: retaper le texte original, ou utiliser un numériseur ("scanner" en anglais) et un logiciel de reconnaissance optique de caractères (ROC, OCR en anglais). S'ensuit dans les deux cas une phase laborieuse de relecture. En pratique, il faut compter une bonne journée de travail pour produire l'equivalent d'un petit livre de poche. Exemple de configuration (la mienne) : Macintosh SE30 (8Mo RAM, 1Go Disque), numériseur noir et blanc ScanJet IIp Hewlett Packard, logiciel de ROC OmniPage Direct, traitement de texte Word 5.0 avec un (mauvais) correcteur orthographique.

Pourquoi ce nom ABU ?

Il y a deux brillantes astuces dans cette dénomination :

Si un tel nom vous paraît fantaisiste, nous sommes prêt à étudier toute dénomination un peu ronflante :-)

Puis-je vous aider ?

OUI!!! Nous avons besoin de vous pour beaucoup de chose :

Qui fait partie de l'ABU ?

L'ABU compte au 1/12/95 32 membres, de plusieurs pays (Belgique, Canada, Etats-Unis, France, Portugal, Suisse) et de plusieurs professions (bibliothécaires, enseignants, étudiants, ingénieurs).

Comment faire partie de l'ABU ?

Il suffit de remplir le formulaire de demande d'adhesion et de motiver sa demande. La possession d'une adresse e-mail est indispensable, ainsi qu'une certaine connaissance des outils de l'Internet. L'adhésion en tant que telle doit être acceptée par les membres. Il n'y a pas (encore) de frais d'adhésion. Une demande d'adhésion ne se justifie que si vous souhaitez vraiment contribuer à l'accroissement du corpus de textes francophones disponibles en libre accès sur l'Internet. Il n'est pas nécessaire d'être membre de l'association pour utiliser les fichiers.

Qui paye?

L'ABU ne reçoit à ce jour aucune aide financière de quelque organisme que ce soit. Aucune aide n'a été sollicitée à ce jour. Tout le travail de l'association s'effectue de manière bénévole par les membres. Les pages que vous êtes en train de lire sont hébergées grâce à la collaboration du Centre de ressources informatiques du CNAM. La charge induite par ABU sur le serveur du CNAM est considérée comme négligeable.

Comment fournir un texte à ABU ?

Lorsque votre texte est bien relu, envoyez-nous un courrier électronique (www@abu.org) signalant le titre exact de l'oeuvre, son auteur et surtout l'edition du domaine public que vous avez utilisé (voir plus haut). L'ABU se réserve le droit de le refuser. Vous devrez ensuite mettre le texte à la "norme ABU" (voir plus bas). Enfin, nous conviendrons du transfert (par FTP si vous le pouvez). Surtout, ne m'envoyez pas de fichiers par courrier électronique sans me prévenir!

Que dois-je entendre par "norme ABU" ?

Il n'existe pas en matière de balisage de texte de norme ou de standard universellement connu et utilisable sur tous les ordinateurs de l'Internet. C'est bien le but de SGML, mais il est mal diffusé et encore faudrait-il s'entendre sur une DTD commune... En attendant ce grand jour, les textes d'ABU sont transcrits sous une forme très fruste, mais simple et robuste. Notez qu'HTML (utilisé avec l'ISO Latin) pourrait tout-à-fait jouer ce rôle. La conversion entre le format d'ABU et HTML est d'ailleurs facile à faire automatiquement. Voici les règles essentielles:

  1. Format "texte seul avec saut de ligne". *Pas* de mise en page! Les lignes doivent faire environ 70 caractères (sauf pour les vers ou des titres)
  2. Un saut de ligne avant chaque paragraphe, même pour les dialogues:
    
          Ceci est un premier paragraphe dans lequel l'auteur décrit les personnages
          et le lieu de l'action.
    
          -- Alors, dis le premier personnage, tu avances?
    
          -- De quoi, dit l'autre, tu me cherches?
    
        L'auteur énumère ensuite en détail les conséquences de cette altercation.
    
  3. Le tiret long est transcrit par deux tirets --.
  4. Les titres, noms de chapitres, sections, etc.. sont en majuscule et précédés d'un saut de ligne. On a coutume de les "souligner" de cette manière:
          CHAPITRE 1 - Hymne à ma province natale
          ---------------------------------------
    
  5. Les mots en italique dans l'original sont encadrés par des blancs soulignés:
            Les conducteurs parisiens sont _a priori_ grossiers.
    
  6. Pas de tabulations, mais des blancs (usage modéré).
  7. Les notes de l'auteur sont à mettre dans le corps du texte, à l'endroit de l'appel de note et entre crochets:
         Les parisiens sont grossiers [Mais la réciproque n'est pas
         toujours vraie.]. Voilà qui ajoute aux charmes de la province.
    
  8. On peut également indiquer la pagination de l'édition originale entre crochets.
  9. Encodage final en ISO Latin 1. Cette norme permet de s'affranchir des choix des divers constructeurs (IBM PC, Macintosh, etc...) pour les caractères composés. De nombreux convertisseurs existent, voyez la FAQ du groupe de News fr.usenet.8bits.
Un texte plus précis est en cours d'élaboration par les membres de l'ABU. En attendant, le mieux est encore de consulter nos fichiers.

Pourquoi les fichiers d'ABU ne sont-ils pas mis en page ?

Parce que ce n'est pas satisfaisant. Il n'existe pas de traitement de texte disponible pour *tous* les types de machines connectées à l'Internet. Il n'y a pas non plus de mise en page idéale qui puisse satisfaire les goûts esthétiques de chacun. Le texte électronique n'est pas vraiment fait pour être imprimé (au prix d'une page imprimée par une laser, il vaut mieux acheter un livre de poche...). Rien n'empêche d'ailleurs de faire pour ses besoins propres une mise en page à partir d'un fichier en texte brut. Le contraire n'est pas vrai, puisqu'il faut disposer du logiciel ad hoc. Enfin, une belle mise en page prend du temps - temps beaucoup plus utilement consacré à la numérisation de nouveaux textes.