Home
  By Author [ A  B  C  D  E  F  G  H  I  J  K  L  M  N  O  P  Q  R  S  T  U  V  W  X  Y  Z |  Other Symbols ]
  By Title [ A  B  C  D  E  F  G  H  I  J  K  L  M  N  O  P  Q  R  S  T  U  V  W  X  Y  Z |  Other Symbols ]
  By Language
all Classics books content using ISYS

Download this book: [ ASCII | HTML | PDF ]

Look for this book on Amazon


We have new books nearly every day.
If you would like a news letter once a week or once a month
fill out this form and we will give you a summary of the books for that week or month by email.

Title: 40 years / 40 años / 40 ans
Author: Lebert, Marie
Language: English
As this book started as an ASCII text book there are no pictures available.
Copyright Status: Not copyrighted in the United States. If you live elsewhere check the laws of your country before downloading this ebook. See comments about copyright issues at end of book.

*** Start of this Doctrine Publishing Corporation Digital Book "40 years / 40 años / 40 ans" ***

This book is indexed by ISYS Web Indexing system to allow the reader find any word or number within the document.



40 YEARS / 40 AÑOS / 40 ANS

MARIE LEBERT

Copyright © 2010 Marie Lebert


---
A trilingual ebook to celebrate
the 40 years (1971-2011)
born on July 4, 1971,
with celebrations
during the whole year 2011.

---
Un ebook trilingüe para celebrar
los 40 años (1971-2011)
nacido el 4 de julio de 1971,
con celebraciones
durante todo el año 2011.

---
Un ebook trilingue pour célébrer
les 40 ans (1971-2011)
né le 4 juillet 1971,
avec des célébrations
pendant toute l'année 2011.

---



TABLE OF CONTENTS / ÍNDICE / TABLE


[en] Overview
[es] Sumario
[fr] Sommaire

[en] From the past to the future
[es] Desde el pasado hacia el futuro
[fr] Du passé vers l'avenir

[en] Acknowledgements
[es] Agradecimientos
[fr] Remerciements



OVERVIEW [EN]


The first ebook was available on July 4, 1971, as eText #1 of Project
electronic versions of literary works and disseminate them worldwide.
boost with the invention of the web in 1990, and its second boost with
by the tens of thousands every day, and websites in the United States,
in Australia, in Europe, and in Canada, with 40 mirror sites worldwide.

This trilingual (English, Spanish, French) ebook is meant to celebrate
# From the past to the future

About the author > Marie Lebert is a researcher and journalist
specializing in technology for books and languages. Her books are
ManyBooks.net , in various formats for any
electronic device (computer, PDA, mobile phone, smartphone, ebook
reader).



SUMARIO [ES]


El primer libro digital remonta al 4 de julio de 1971. Se trata del
eText #1 del Proyecto Gutenberg, un proyecto visionario lanzado por
Michael Hart con el fin de crear versiones electrónicas gratuitas de
obras literarias y de difundirlas por el mundo entero. En el siglo 16,
Gutenberg había hecho posible para todos tener libros impresos por un
precio relativamente módico. En el siglo 21, el Proyecto Gutenberg iba
a permitir a cada uno disponer de una biblioteca digital gratuita. Este
proyecto cobra nuevo aliento y alcanzó una difusión internacional con
la aparición de la web en 1990, y luego con la creación de Distributed
Proofreaders en 2000, cuya meta es compartir la revisión de los libros
entre centenares de voluntarios. En 2010, el Proyecto Gutenberg cuenta
con más de 33.000 ebooks de alta calidad y decenas de milles de
descargas al día. Tiene sitios web en los Estados Unidos, en Australia,
en Europa y en Canadá, con 40 sitios espejo repartidos por todo el
planeta.

Este ebook trilingüe (inglés, español, francés) tiene como meta
celebrar los 40 años del Proyecto Gutenberg, con quatro partes:
# El Proyecto Gutenberg tiene 40 años
# Desde el pasado hacia el futuro
# El Proyecto Gutenberg y los idiomas
# Distributed Proofreaders tiene 10 años

Sobre la autora > Marie Lebert, investigadora y periodista, se interesa
por las tecnologías para el libro y los idiomas. Sus libros están
y en ManyBooks.net , en varios formatos para
lectura en un ordenador, un PDA, un teléfono móvil, un smartphone o una
tableta. Muchas gracias a Anna Álvarez por su ayuda para varios textos
en español.



SOMMAIRE [FR]


Le premier livre numérique date du 4 juillet 1971. Il s'agit de l'eText
#1 du Projet Gutenberg, un projet visionnaire lancé par Michael Hart
pour créer des versions électroniques gratuites d'oeuvres littéraires
et les diffuser dans le monde entier. Au 16e siècle, Gutenberg avait
permis à chacun d'avoir des livres imprimés pour un prix relativement
modique. Au 21e siècle, le Projet Gutenberg permettrait à chacun
d'avoir une bibliothèque numérique gratuite. Ce projet trouve un second
souffle et un rayonnement international avec l'apparition du web en
1990, puis la création de Distributed Proofreaders en 2000 pour
partager la relecture des livres entre des centaines de volontaires. En
2010, le Projet Gutenberg compte plus de 33.000 ebooks de grande
qualité ainsi que des dizaines de milliers de téléchargements par jour.
Il dispose de sites web aux États-Unis, en Australie, en Europe et au
Canada, avec 40 sites miroirs répartis sur toute la planète.

Cet ebook trilingue (anglais, espagnol, français) a pour but de
célébrer les 40 ans du Projet Gutenberg, avec quatre parties:
# Le Projet Gutenberg a 40 ans
# Du passé vers l'avenir
# Le Projet Gutenberg et les langues
# Distributed Proofreaders a 10 ans

Au sujet de l'auteure > Marie Lebert, chercheuse et journaliste,
s'intéresse aux technologies pour le livre et les langues. Ses livres
et dans ManyBooks.net , dans divers formats
permettant leur lecture sur tout appareil électronique (ordinateur,
PDA, téléphone mobile, smartphone et tablette).



Doctrine Publishing Corporation IS 40 YEARS OLD [EN]


In the 16th century, Gutenberg allowed anyone to have print books for a
small cost. In the 21st century, Doctrine Publishing Corporation would allow anyone
to have a digital library at no cost.

# Beginning

As recalled by Michael Hart in January 2009 in an email interview: “On
July 4, 1971, while still a freshman at the University of Illinois
(UI), I decided to spend the night at the Xerox Sigma V mainframe at
the UI Materials Research Lab, rather than walk miles home in the
summer heat, only to come back hours later to start another day of
school. I stopped on the way to do a little grocery shopping to get
through the night, and day, and along with the groceries they put in
the faux parchment copy of The U.S. Declaration of Independence that
became quite literally the cornerstone of Doctrine Publishing Corporation. That
night, as it turned out, I received my first computer account – I had
been hitchhiking on my brother’s best friend’s name, who ran the
computer on the night shift. When I got a first look at the huge amount
of computer money I was given, I decided I had to do something
extremely worthwhile to do justice to what I had been given. This was
such a serious, and intense thought process for a college freshman, my
first thought was that I had better eat something to get up enough
energy to think of something worthwhile enough to repay the cost of all
that computer time. As I emptied out groceries, the faux parchment
Declaration of Independence fell out, and the light literally went on
over my head like in the cartoons and comics... I knew what the future
of computing, and the internet, was going to be... ‘The Information
Age.’ The rest, as they say, is history.”

Michael keyed in The United States Declaration of Independence to the
mainframe he was using, in upper case, because there was no lower case
yet. The file was 5 K. To send a 5 K file to the 100 users of the pre-
internet of the time would have crashed the network, so Michael
mentioned where the etext was stored - though without a hypertext link,
because the web was still 20 years ahead. It was downloaded by six
users. Doctrine Publishing Corporation was born.

Michael decided to use the huge amount of computer time he had been
given to search the literary works that were stored in libraries, and
to digitize these works. A book would become a continuous text file
instead of a set of pages. Doctrine Publishing Corporation’s mission would be the
following: to put at everyone’s disposal, in electronic versions, as
many literary works as possible for free.

After keying in The United States Declaration of Independence (signed
on July 4, 1776) in 1971, Michael typed in a longer text, The United
States Bill of Rights, in 1972, i.e. the first ten amendments added in
1789 to the Constitution (dated 1787) and defining the individual
rights of the citizens and the distinct powers of the federal
government and the States. A volunteer typed in The United States
Constitution in 1973.

From one year to the next, disk space was getting larger, by the
standards of the time – there was no hard disk yet -, making it
possible to store larger files.

Volunteers began typing in The Bible, with one individual book at a
time, and a file for each book.

Michael typed in the collected works of Shakespeare, with volunteers,
one play at a time, and a file for each play. This edition of
Shakespeare was never released, unfortunately, due to changes in
copyright law. Shakespeare’s works belong to public domain, but
comments and notes may be copyrighted, depending on the publication
date. Other editions of Shakespeare from public domain were released a
few years later.

# 10 to 1,000 ebooks

Its critics long considered Doctrine Publishing Corporation as impossible on a large
scale. But Michael went on keying book after book during many years,
with the help of some volunteers.

In August 1989, Doctrine Publishing Corporation completed its 10th ebook, The King
James Bible (1769), both testaments, and 5M for all files.

In 1990, there were 250,000 internet users. The web was in its infancy.
The standard was 360 K disks.

In January 1991, Michael typed in Alice’s Adventures in Wonderland
(1865), by Lewis Carroll. In July 1991, he typed in Peter Pan (1904),
by James M. Barrie. These two classics of childhood literature each fit
on one disk.

The first browser, Mosaic, was released in November 1993. It became
easier to circulate etexts and recruit volunteers. From 1991 to 1996,
the number of ebooks doubled every year, with one ebook per month in
1991, two ebooks per month in 1992, four ebooks per month in 1993, and
eight ebooks per month in 1994.

In January 1994, Doctrine Publishing Corporation released The Complete Works of
William Shakespeare as eBook #100. Shakespeare wrote most of his works
between 1590 and 1613.

The steady growth went on, with an average of 8 ebooks per month in
1994, 16 ebooks per month in 1995, and 32 ebooks per month in 1996.

In June 1997, Doctrine Publishing Corporation released The Merry Adventures of Robin
Hood (1883), by Howard Pyle.

Doctrine Publishing Corporation reached 1,000 ebooks in August 1997. EBook #1000 was
La Divina Commedia (1321), by Dante Alighieri, in Italian, its original
language.

With the number of ebooks on the rise, three main sections were set up:
(a) “Light Literature”, such as Alice’s Adventures in Wonderland,
Through the Looking-Glass, Peter Pan and Aesop’s Fables; (b) “Heavy
Literature”, such as the Bible, Shakespeare’s works, Moby Dick and
Paradise Lost; (c) “Reference Literature”, such as Roget’s Thesaurus,
almanacs, and a set of encyclopedias and dictionaries. (A more detailed
classification was created later on.)

“Light Literature” was the main section in number of ebooks. As
explained on the website in 1998: “The Light Literature Collection is
designed to get persons to the computer in the first place, whether the
person may be a pre-schooler or a great-grandparent. We love it when we
hear about kids or grandparents taking each other to an etext of Peter
Pan when they come back from watching Hook at the movies, or when they
read Alice in Wonderland after seeing it on TV. We have also been told
that nearly every Star Trek movie has quoted current Doctrine Publishing Corporation
etext releases (from Moby Dick in The Wrath of Khan; a Peter Pan quote
finishing up the most recent, etc.) not to mention a reference to
Through the Looking-Glass in JFK. This was a primary concern when we
chose the books for our libraries. We want people to be able to look up
quotations they heard in conversation, movies, music, other books,
easily with a library containing all these quotations in an easy-to-
find etext format.”

Doctrine Publishing Corporation's goal is more about selecting books intended for the
general public than providing authoritative editions. As explained on
the website in 1998: “We do not write for the reader who cares whether
a certain phrase in Shakespeare has a ‘:’ or a ‘;’ between its clauses.
We put our sights on a goal to release etexts that are 99.9% accurate
in the eyes of the general reader. Given the preferences our
proofreaders have, and the general lack of reading ability the public
is currently reported to have, we probably exceed those requirements by
a significant amount. However, for the person who wants an
‘authoritative edition’ we will have to wait some time until this
becomes more feasible. We do, however, intend to release many editions
of Shakespeare and the other classics for comparative study on a
scholarly level.”

The etexts, later called ebooks, were stored in the simplest way, using
the low set of ASCII, called Plain Vanilla ASCII, for them to be read
on any hardware and software. As a text file, a book could be easily
copied, indexed, searched, analyzed, and compared with other books.

As explained by Michael Hart in August 1998 in an email interview: “We
consider etext to be a new medium, with no real relationship to paper,
other than presenting the same material, but I don’t see how paper can
possibly compete once people each find their own comfortable way to
etexts, especially in schools. (...) My own personal goal is to put
10,000 etexts on the net [this goal was reached in October 2003] and if
I can get some major support, I would like to expand that to 1,000,000
and to also expand our potential audience for the average etext from
1.x% of the world population to over 10%, thus changing our goal from
giving away 1,000,000,000,000 etexts to 1,000 times as many, a trillion
and a quadrillion in U.S. terminology.”

# 1,000 to 10,000 ebooks

From 1998 to 2000, the “output” was an average of 36 new ebooks per
month.

Doctrine Publishing Corporation reached 2,000 ebooks in May 1999. EBook #2000 was Don
Quijote (1605), by Cervantes, in Spanish, its original language.

Distributed Proofreaders was launched in October 2000 by Charles Franks
to share the proofreading of ebooks between many volunteers. Volunteers
choose one of the digitized books available on the website and
proofread a given page, or several pages, as they wish.

Doctrine Publishing Corporation reached 3,000 ebooks in December 2000. EBook #3000
was À l’ombre des jeunes filles en fleurs (In the Shadow of Young Girls
in Flower), vol. 3 (1919), by Marcel Proust, in French, its original
language.

Doctrine Publishing Corporation Australia was launched in August 2001.

Doctrine Publishing Corporation reached 4,000 ebooks in October 2001. EBook #4000 was
The French Immortals Series (1905), in English. This book is an
anthology of short fictions by authors from the French Academy
(Académie Française): Emile Souvestre, Pierre Loti, Hector Malot,
Charles de Bernard, Alphonse Daudet, and others.

The output in 2001 was an average of 104 new ebooks per month.

Doctrine Publishing Corporation reached 5,000 ebooks in April 2002. EBook #5000 was
The Notebooks of Leonardo da Vinci, an English version of Leonardo's
early 16th-century writings in Italian. Since its release, this ebook
has constantly stayed in the Top 100 of downloaded ebooks.

In 1991, Michael Hart chose to type in Alice’s Adventures in Wonderland
and Peter Pan because they would each fit on one 360 K disk, the
standard of the time. In 2002, the standard disk was 1.44 M and could
be compressed as a zipped file.

A practical file size is about 3 million characters, more than long
enough for the average book. The ASCII version of a 300-page novel is 1
M. A bulky book can fit in two ASCII files, that can be downloaded as
is or zipped. An average of 50 hours is necessary to get an ebook
selected, copyright-cleared, scanned, proofread, formatted, and
assembled.

A few numbers are reserved for “special” books. For example, eBook
#1984 is reserved for George Orwell’s classic, published in 1949, and
still a long way from falling into public domain.

In spring 2002, Doctrine Publishing Corporation’s ebooks represented 25% of all the
public domain works freely available on the web and listed in the
Internet Public Library (IPL). The output in 2002 was an average of 203
new ebooks per month.

In November 2002, Doctrine Publishing Corporation released the 75 files of the Human
Genome Project, with files of dozens or hundreds of megabytes, shortly
after its initial release in February 2001 as a work from public
domain.

1,000 ebooks in August 1997, 2,000 ebooks in May 1999, 3,000 ebooks in
December 2000, 4,000 ebooks in October 2001, 5,000 ebooks in April
2002, 10,000 ebooks in October 2003. EBook #10000 was The Magna Carta,
signed in 1215 and known as the first English constitutional text.

From April 2002 to October 2003, in 18 months, the collection of ebooks
doubled, going from 5,000 ebooks to 10,000 ebooks, with a monthly
average of 348 new ebooks in 2003. The fast growth was the work of
Distributed Proofreaders, a website launched in October 2000 to share
the proofreading of ebooks between many volunteers.

EBooks were also copied on CDs and DVDs. As blank CDs and DVDs cost
next to nothing, Doctrine Publishing Corporation began burning and sending a free CD
or DVD to anyone asking for it. People were encouraged to make copies
for a friend, a library or a school. Released in August 2003, the Best
of Gutenberg CD contained 600 ebooks. The first Doctrine Publishing Corporation DVD
was released in December 2003 to celebrate the first 10,000 ebooks,
with the burning of most titles (9,400 ebooks).

In September 2003, Doctrine Publishing Corporation launched Project Gutenberg Audio
eBooks, a  collection of human-read ebooks, as well as the Sheet Music
Subproject, a collection of digitized music sheet and music recordings.
A collection of still and moving pictures was also available.

# 10,000 to 20,000 ebooks

In December 2003, there were 11,000 ebooks, which represented 110 G, in
several formats (ASCII, HTML, PDF, and others, as is or zipped). In May
2004, there were 12,600 ebooks, which represented 135 G. With more than
300 new ebooks added per month (338 ebooks per month in 2004), the
number of gigabytes was expected to double every year.

The Doctrine Publishing Corporation Consortia Center (PGCC) was affiliated with
Doctrine Publishing Corporation in 2003, and became an official Project Gutenberg
site. Since 1997, PGCC had been working on gathering collections of
existing ebooks, as a complement to Doctrine Publishing Corporation working on
producing ebooks. As explained by Michael Hart in February 2009: “The
Doctrine Publishing Corporation Consortia Center has over 75,000 ebooks rendered as
PDF files, and some are really quite stunning. The difference? These
files were prepared by other eLibraries, not Doctrine Publishing Corporation, and are
using our worldwide distribution network to be seen.”

In Europe, Project Rastko, based in Belgrade, Serbia, launched Project
Gutenberg Europe (PG Europe) and Distributed Proofreaders Europe (DP
Europe) in January 2004. 100 ebooks were available in June 2005, in
several languages, as a reflection of European linguistic diversity.

In January 2005, Doctrine Publishing Corporation reached 15,000 ebooks. EBook #15000
was The Life of Reason (1906), by George Santayana.

What about languages? There were ebooks in 25 languages in February
2004, and in 42 languages in July 2005, including Sanskrit and the
Mayan languages. The seven main languages – with more than 50 ebooks –
were English (with 14,548 ebooks on July 27, 2005), French (577
ebooks), German (349 ebooks), Finnish (218 ebooks), Dutch (130 ebooks),
Spanish (103 ebooks), and Chinese (69 ebooks).

In July 2005, Doctrine Publishing Corporation Australia (launched in August 2001)
reached 500 ebooks.

Doctrine Publishing Corporation PrePrints was launched in January 2006 to collect
items submitted to Doctrine Publishing Corporation which were interesting enough to
be available online, but not ready yet to be added to the main Project
Gutenberg collection, because of missing data, low-quality files,
formats which were not handy, etc. 379 ebooks were available in
December 2006, and 2,020 ebooks in February 2009.

In December 2006, Doctrine Publishing Corporation reached 20,000 ebooks. EBook #20000
was the audiobook of Twenty Thousand Leagues Under the Sea (Vingt mille
lieues sous les mers, 1869), by Jules Verne, in its English version.

If 32 years and 3 months, from July 1971 to October 2003, were
necessary to produce the first 10,000 ebooks, 3 years and 2 months,
from October 2003 to December 2006, were necessary to produce the
following 10,000 ebooks. There were ebooks in 50 languages in December
2006.

# 20,000 to 30,000 ebooks

In December 2006, Mike Cook launched the blog Doctrine Publishing Corporation News as
and monthly newsletters. For example, the blog gave a table of the
weekly, monthly and yearly production numbers since 2001.

The weekly production was 24 ebooks in 2001, 47 ebooks in 2002, 79
ebooks in 2003, 78 ebooks in 2004, 58 ebooks in 2005, and 80 ebooks in
2006.

The monthly production was 104 ebooks in 2001, 203 ebooks in 2002, 348
ebooks in 2003, 338 ebooks in 2004, 252 ebooks in 2005, and 345 ebooks
in 2006.

The yearly production was 1,244 ebooks in 2001, 2,432 ebooks in 2002,
4,176 ebooks in 2003, 4,058 ebooks in 2004, 3,019 ebooks in 2005, and
4,141 ebooks in 2006.

Doctrine Publishing Corporation Australia reached 1,500 ebooks in April 2007.

Doctrine Publishing Corporation Canada (PGC) was launched on July 1st, 2007, on
Canada Day, by Michael Shepard and David Jones. Distributed
Proofreaders Canada (DPC) started production in December 2007. There
were 100 ebooks in March 2008, in English, French, and Italian.

Doctrine Publishing Corporation sent out 15 million ebooks via CDs and DVDs by snail
mail in 2007. The latest DVD (released in July 2006) included 17,000
ebooks. CD and DVD files were also generated as ISO files (since 2005)
to be downloaded for burning CDs or DVDs.

Doctrine Publishing Corporation reached 25,000 books in April 2008. EBook #25000 was
English Book Collectors (1902), by William Younger Fletcher.

Doctrine Publishing Corporation reached 30,000 books in October 2009. EBook #30000
was The Bird Book (1915), by Chester Albert Reed.

# 30,000 ebooks onwards

Distributed Proofreaders celebrated its 10th anniversary in October
2010, with more than 18,000 books digitized and proofread during ten
years by thousands of volunteeers.

Doctrine Publishing Corporation offered more than 33,000 high-quality proofread
ebooks in December 2010, in various formats for any electronic device
(computer, PDA, mobile phone, smartphone, and ebook reader).



EL PROYECTO GUTENBERG TIENE 40 AÑOS [ES]


En el siglo 16, Gutenberg había hecho posible para todos tener libros
impresos por un precio relativamente módico. En el siglo 21, el
Proyecto Gutenberg iba a permitir a cada uno disponer de una biblioteca
digital gratuita.

# Gestación

¿Cuáles son las raíces del proyecto? Cuando Michael Hart estudia en la
Universidad de Illinois (Estados Unidos), el laboratorio informático de
su universidad le asigna millones de dólares de tiempo de ordenador.

El 4 de julio de 1971, día de la fiesta nacional, Michael digita The
United States Declaration of Independence (Declaración de independencia
de los Estados Unidos), en mayúsculas, pues las letras minúsculas aún
no existan. El texto electrónico representa 5 K (kilobytes).

El envío de un archivo de 5 K a las cien personas que forman el pre-
internet de la época haya acabado con el sistema, provocando su
implosión, porque el ancho de banda aún es ínfimo.

Michael difunde un mensaje que explica dónde se almacena el texto – aún
sin enlace hipertexto, pues habría que esperar unos 20 años más para la
web – y seis personas descargan este archivo.

Sobre la marcha, Michael decide dedicar ese enorme crédito de tiempo a
la búsqueda de obras literarias disponibles en bibliotecas, y a la
digitalización de éstas.  El conjunto de páginas encuadernadas, forma
tradicional del libro, iba a convertirse en un texto electrónico que se
puede desplegar de par en par.

Poco después, Michael define así la misión del Proyecto Gutenberg:
poner a disposición de todos, por vía electrónica, el mayor número
posible de obras literarias gratuitamente.

Tras haber digitado The United States Declaration of Independence
(Declaración de independencia de los Estados Unidos, firmada el 4 de
julio de 1776) en 1971, Michael prosigue con sus esfuerzos en 1972
digitando The United States Bill of Rights  (Declaración de derechos de
los Estados Unidos). Esa declaración incluye las diez primeras
enmiendas añadidas en 1789 a la Constitución de los Estados Unidos
(ratificada en 1787), y define los derechos individuales de los
ciudadanos y los poderes respectivos del gobierno federal y de los
Estados. En 1973, un voluntario digita The United States Constitution
(Constitución de los
Estados Unidos) en su totalidad.

El internet, aún embrionario en 1971, despega verdaderamente en 1974,
tras la creación del protocolo TCP/IP (Transmission Control Protocol /
Internet Protocol).

Año tras año, la capacidad del disquete aumenta con regularidad – el
disco duro no existe aún – de modo que los archivos pueden ocupar cada
vez más espacio. Algunos voluntarios se animan a digitalizar La Biblia,
compuesta de varios libros, cada cual puede tratarse por separado y
ocupar un archivo diferente.

Michael también empieza a digitar la obra completa de Shakespeare, con
la ayuda de voluntarios, una obra de teatro tras otra, cada una en un
archivo. De hecho aquella edición nunca se puede poner en línea, debido
a que, entre tanto, entra en vigor una ley de copyright más rigurosa,
ya no destinada a proteger el texto de Shakespeare, pasado desde hace
tiempo al dominio público, sino los comentarios y notas de aquella
edición. Otras ediciones anotadas que sí han pasado al dominio público
se ponen en línea algunos años más tarde.

# De 10 a 1.000 ebooks

En agosto de 1989, el Proyecto Gutenberg pone en línea su décimo texto,
The King James Bible, una biblia publicada por primera vez en 1611 y
cuya versión más conocida es la de 1769. El conjunto de los archivos
del Antiguo Testamento y del Nuevo Testamento representa 5 M
(megabytes).

En 1990, ya hay 250.000 internautas, y el modelo estándar vigente es el
disquete de 360 K (kilobytes).

En enero de 1991, Michael digita Alice’s Adventures in Wonderland
(Alicia en el país de las maravillas, 1865) de Lewis Carroll. En julio
del mismo año, digita Peter Pan (1904) de James M. Barrie. Cada uno de
estos dos clásicos de la literatura infantil cabe en un disquete
estándar.

Luego llega la web, operativa a partir de 1991. El primer navegador,
Mosaic, aparece en noviembre de 1993. Al generalizarse el acceso a la
red, resulta más fácil hacer circular los textos electrónicos y
reclutar voluntarios.

El Proyecto Gutenberg perfecciona su método de trabajo, y logra
digitalizar un texto al mes en 1991, dos textos al mes en 1992, cuatro
textos al mes en 1993 y ocho textos al mes en 1994.

En enero de 1994, el Proyecto Gutenberg celebra su eBook #100 con la
puesta en línea de The Complete Works of William Shakespeare (La obra
completa de William Shakespeare). Shakespeare escribió la mayor parte
de su obra entre 1590 y 1613.

A continuación la producción sigue aumentando, con una media de 8
ebooks al mes en 1994, 16 ebooks al mes en 1995 y 32 ebooks al mes en
1996.

Entre 1991 y 1996, la producción se ha duplicado cada año. Mientras
sigue con la digitalización de los libros, Michael coordina también a
partir de entonces el trabajo de decenas de voluntarios.

En 1997, la producción sigue siendo de 32 ebooks al mes. En junio de
1997, el Proyecto Gutenberg pone en línea The Merry Adventures of Robin
Hood (Las alegres aventuras de Robin Hood, 1883) de Howard Pyle. En
agosto de 1997, se pone en línea el eBook #1000, La Divina Commedia (La
Divina Comedia, 1321) de Dante Alighieri, en su idioma original, el
italiano.

El Proyecto Gutenberg se articula en torno a tres grandes sectores: (a)
“Light Literature”(literatura de entretenimiento), que incluye por
ejemplo Alice’s Adventures in Wonderland (Las aventuras de Alicia en el
país de las maravillas), Peter Pan o Aesop’s Fables (Las Fábulas de
Esopo); (b) “Heavy Literature” (literatura “seria”), que incluye por
ejemplo La Biblia, las obras de Shakespeare o Moby Dick; (c) “Reference
Literature” (literatura de referencia), que reúne enciclopedias y
diccionarios, por ejemplo el Roget’s Thesaurus. Más adelante, esta
presentación en tres sectores es sustituida por una clasificación
detallada con más secciones.

El Proyecto Gutenberg pretende ser universal, tanto a nivel de las
obras que selecciona como del público al que se dirige, ya que la meta
es poner la literatura a disposición de todos, sin limitarse al público
habitual de estudiantes y docentes.

El sector dedicado a la literatura de entretenimiento se propone atraer
frente a la pantalla a un público muy diverso, por ejemplo a niños y a
sus abuelos en busca del texto electrónico de Peter Pan después de
haber visto la película Hook, de la versión electrónica de Alicia en el
país de las maravillas tras haber visto una adaptación televisiva, o
del origen de una cita literaria tras visionar un episodio de Star
Trek. En casi todos los episodios de Star Trek se citan libros
disponibles en versión digital en el Proyecto Gutenberg.

El objetivo, entonces, es que el público, esté o no esté acostumbrado
al contacto con el libro impreso, pueda encontrar con facilidad los
textos escuchados en conversaciones, películas, músicas, o leídos en
otros libros, periódicos y revistas.

Los textos electrónicos (llamados también “etexts” o “ebooks”) están
almacenados bajo la forma más sencilla posible, en formato ASCII
(American Standard Code for Information Interchange – Código
Estadounidense Estándar para el Intercambio de Información), para que
esos textos pudieran ser leídos sin problema con cualquier plataforma y
software. Los términos escritos en cursiva o en negrita y los términos
subrayados en la versión impresa están en letras capitales. Los
archivos ASCII no ocupan mucho espacio y se pueden descargar
fácilmente. La búsqueda textual es igual de sencilla. Basta con
utilizar la función "buscar" presente en cualquier software.

Michael Hart explica en agosto de 1998 en una entrevista por correo
electrónico: “Nosotros consideramos el texto electrónico como un nuevo
medio de comunicación, sin verdadera relación con el papel. La única
semejanza es que ambos difundimos las mismas obras, pero en cuanto la
gente se haya acostumbrado, no veo cómo el papel aún podría competir
con el texto electrónico, sobre todo en las escuelas. (…) Mi proyecto
es cargar 10.000 textos electrónicos en el internet [esta meta se
alcanza en octubre de 2003]. Si pudiera conseguir subvenciones más
importantes, me gustaría llegar hasta un millón y ampliar también el
número de nuestros usuarios potenciales pasando de un 1,x% a un 10% de
la población mundial, lo que representaría la distribución de 1.000
veces un billón de textos electrónicos en lugar de un solo billón.”

# De 1.000 a 10.000 ebooks

Entre 1998 y 2000, la producción sigue constante, con una media de 36
nuevos ebooks al mes. En mayo de 1999, las colecciones cuentan con
2.000 libros digitales. El eBook #2000 es Don Quijote (publicado en
1605), en castellano.

Distributed Proofreaders (DP) es lanzado en octubre de 2000 por Charles
Franks para repartir la corrección de las obras entre varias personas.
Los voluntarios eligen uno de los libros digitales disponibles en el
sitio web para releer y corregir determinada página. Cada cual trabaja
a su ritmo. A título indicativo, se aconseja repasar una página al día.
Representa poco tiempo en un día, pero mucho para el proyecto.

Disponible en diciembre del año 2000, el eBook #3000 es el tercer
volumen de À l'ombre des jeunes filles en fleurs (A la sombra de las
muchachas en flor, 1919) de Marcel Proust, en su idioma original, el
francés. La media pasa a 104 nuevos ebooks al mes en 2001.

El Doctrine Publishing Corporation Australia es lanzado en agosto de 2001.

Disponible en octubre de 2001, el eBook #4000 es The French Immortals
Series (Obras de los Inmortales franceses), en versión inglesa.
Publicado en 1905 por la Maison Mazarin (París), este libro reúne
varias ficciones de escritores laureados por la Academia de la Lengua
Francesa (Académie Française), como Emile Souvestre, Pierre Loti,
Hector Malot, Charles de Bernard, Alphonse Daudet y otros.

Disponible en abril de 2002, el eBook #5000 es The Notebooks of
Leonardo da Vinci (Los cuadernos de Leonardo da Vinci), que datan de
inicios de siglo 16, en una traducción del italiano al inglés. En 2010,
este texto aún se encuentra en el Top 100 de los libros descargados con
más frecuencia.

En 1991, Michael Hart decidió digitalizar Alice’s Adventures in
Wonderland o Peter Pan porque su versión digital cupo en un disquete de
360 K (kilobytes), o sea el estándar de la época. Quince años más
tarde, en 2002, ya disponemos de disquetes de 1,44 M (megabytes) con la
posibilidad de comprimir archivos en archivos ZIP. Un archivo estándar
puede contener tres millones de caracteres, o sea más de los necesarios
para un libro de tamaño mediano, ya que una novela de 300 páginas
digitalizada en formato ASCII representa 1 M (megabyte). Un libro
voluminoso cabe en dos archivos ASCII, descargables en versión normal o
en versión comprimida en un archivo ZIP.

Se necesitan unas cincuenta horas para seleccionar un libro de tamaño
mediano, comprobar que ha pasado al dominio público, escanearlo,
corregirlo, formatearlo y compaginarlo.

Algunos números de libros se reservan para más tarde, por ejemplo el
número 1984 (eBook #1984) para la novela epónima de George Orwell,
publicada en 1949, que aún está lejos de pasar al dominio público.

Al llegar la primavera de 2002, ya cubren un cuarto de las obras del
dominio público de libre acceso en la web, inventariadas de forma casi
exhaustiva por la Internet Public Library (IPL – Biblioteca Pública del
Internet), un buen resultado que es el fruto del trabajo paciente de
miles de voluntarios activos en numerosos países. En 2002, las
colecciones se amplían de 203 nuevos ebooks al mes.

En noviembre de 2002, el Proyecto Gutenberg pone en línea los 75
archivos del Human Genome Project (Proyecto del Genoma Humano, es saber
la secuenciación del genoma humano), poco tiempo después de su
publicación inicial en febrero de 2001, debido a que desde el principio
ya pertenecía al dominio público. Cada archivo se compone de decenas, o
incluso de cientos de megabytes.

1.000 ebooks en agosto de 1997, 2.000 ebooks en mayo de 1999, 3.000
ebooks en diciembre de 2000, 4.000 ebooks en octubre de 2001, 5.000
ebooks en abril de 2002, 10.000 ebooks en octubre de 2003. El eBook
#10.000 es The Magna Carta, que fue el primer texto constitucional
inglés, firmado en 1215.

Entre abril de 2002 y octubre de 2003, las colecciones se duplican,
pasando de 5.000 a 10.000 libros digitales en 18 meses. En 2003, la
producción es de unos 348 nuevos ebooks al mes. Este crecimiento rápido
se debe a la actividad de Distributed Proofreaders (DP), concebido en
octubre de 2000 para repartir la corrección de las obras entre muchos
voluntarios.

En agosto de 2003, se pone a disposición un CD Best of Gutenberg con
una selección de 600 ebooks. En diciembre de 2003, fecha en la que el
Proyecto Gutenberg alcanza la cifra de 10.000 libros digitales, se
graba en un DVD la casi totalidad de los ebooks (9.400 ebooks). Se
envían gratuitamente el CD y el DVD a cualquier persona que lo pida.
Luego cada uno queda libre de realizar todas las copias que pueda y de
distribuirlas a su alrededor en escuelas y bibliotecas.

En septiembre de 2003, el Proyecto Gutenberg lanza el Doctrine Publishing Corporation
Audio eBooks, una collección de libros audio (leídos por el ser
humano), así como el Sheet Music Subproject (Subproyecto para
partituras), una collección de partituras digitalizadas y de
grabaciones musicales. Un otro subproyecto también ofrece una
collección de imágenes.

# De 10.000 a 20.000 ebooks

En diciembre de 2003, las colecciones rondan los 11.000 libros
digitales. Varios formatos están representados (HTML, XML, RTF, etc.)
pero el formato principal - y obligatorio - sigue siendo el ASCII. Hay
46.000 archivos en conjunto, lo que equivale a una capacidad total de
110 G (gigabytes). El 13 de febrero de 2004, fecha en la que Michael
Hart da una conferencia en la sede de la UNESCO en París, las
colecciones abarcan exactamente 11.340 ebooks en 25 idiomas. En mayo de
2004, los 12.500 ebooks disponibles representan 100.000 archivos en
veinte formatos diferentes, lo que equivale a una capacidad total de
135 G (gigabytes), y ésta debería duplicarse cada año con la agregación
de más de 300 ebooks al mes (338 ebooks al mes en 2004).

El Doctrine Publishing Corporation Consortia Center (PGCC), lanzado en 1997 para
reunir otras colecciones de libros digitales en un punto de acceso
único, es afiliado oficialmente al Proyecto Gutenberg en 2003.

Se inicia también un proyecto europeo a iniciativa del Proyecto Rastko,
basado en Belgrado (Serbia). El Proyecto Gutenberg Europa y Distributed
Proofreaders Europa nacen en enero de 2004, con cien libros disponibles
para abril de 2005, en varios idiomas con el fin de reflejar la
diversidad lingüística que prevalece en Europa.

En enero de 2005, el Proyecto Gutenberg pone en línea el eBook #15000,
The Life of Reason (La vida de la razón, 1906) de George Santayana.

Si bien en febrero de 2004 sólo había libros en 25 idiomas, en julio de
2005 están representados 42 idiomas, entre los cuales el sanscrito y
las lenguas maya.

El Doctrine Publishing Corporation Australia (lanzado en agosto de 2001) celebra sus
500 libros en julio de 2005.

En enero de 2006 se crea el Doctrine Publishing Corporation PrePrints para acoger
nuevos documentos que por su interés merecerían estar en línea, pero
que no pueden ser incorporados a las colecciones existentes sin su
procesamiento previo por voluntarios: colecciones incompletas, calidad
insuficiente, necesidad de conversión a otro formato, etc. Los
PrePrints cuentan con 379 ebooks en diciembre de 2006, y 2.020 ebooks
en febrero de 2009.

En diciembre de 2006, el Proyecto Gutenberg alcanza los 20.000 libros
digitales. El eBook #20000 es un libro audio, Twenty Thousand Leagues
Under the Sea (Veinte mil leguas de viaje submarino, 1869), la versión
inglesa de la novela de Julio Verne en francés. En 2006, la producción
es de unos 345 nuevos ebooks al mes.

Aunque se hayan necesitado 32 años y tres meses, de julio de 1971 a
octubre de 2003, para producir los 10.000 primeros ebooks, bastará con
sólo tres años y dos meses, de octubre de 2003 a diciembre de 2006,
para producir los 10.000 ebooks siguientes.

Por la misma fecha, el Doctrine Publishing Corporation Australia ronda los 1.500
ebooks (se alcanza esta cifra en abril de 2007) y el Proyecto Gutenberg
Europa cuenta con 400 ebooks.

En diciembre de 2006 figuran 50 idiomas. Diez idiomas cuentan con
colecciones de más de 50 libros: el inglés (17.377 libros el 16 de
diciembre de 2006), el francés (966 libros), el alemán (412 libros), el
finlandés (344 libros), el holandés (244 libros), el español (140
libros), el italiano (102 libros), el chino (69 libros), el portugués
(68 libros) y el tagalog (51 libros).

# De 20.000 a 30.000 ebooks

Se estrena el blog Doctrine Publishing Corporation News en noviembre de 2006 a
instigación de Mike Cook, para complementar las cartas de información
(semanal y mensual) que ya llevaban muchos años de existencia.

El blog presenta por ejemplo las estadísticas de producción semanales,
mensuales y anuales desde 2001.

La producción semanal se eleva a 24 libros en 2001, 47 libros en 2002,
79 libros en 2003, 78 libros en 2004, 58 libros en 2005 y 80 libros en
2006.

La producción mensual es de 104 libros en 2001, 203 libros en 2002, 348
libros en 2003, 338 libros en 2004, 252 libros en 2005 y 345 libros en
2006.

La producción anual es de 1.244 libros en 2001, 2.432 libros en 2002,
4.176 libros en 2003, 4.058 libros en 2004, 3.019 libros en 2005 y
4.141 libros en 2006.

El Proyecto Gutenberg Canadá (PGC) ve la luz el 1° de julio de 2007,
día de la fiesta nacional, a instigación de Michael Shepard y David
Jones. Poco después nace Distributed Proofreaders Canadá (DPC) cuya
producción empieza en diciembre de 2007. Los cien primeros ebooks están
disponibles en marzo de 2008, en inglés, en francés y en italiano.

Distributed Proofreaders (DP), lanzado en octubre de 2000, cuenta con
miles de voluntarios en enero de 2008, con un total de 11.934 libros
procesados en siete años y tres meses. Distributed Proofreaders Europa
(DP Europe), lanzado en enero de 2004, cuenta con 1.500 voluntarios.
Distributed Proofreaders Canadá (DPC), lanzado en diciembre de 2007,
cuenta con 250 voluntarios.

El Proyecto Gutenberg alcanza los 25.000 libros digitales en abril de
2008. El eBook #25000 es English Book Collectors (Colleccionistas
ingleses de libros, 1902) de William Younger Fletcher.

El Proyecto Gutenberg Europa alcanza los 500 libros en octubre de 2008.

El Proyecto Gutenberg contabiliza 30.000 libros en octubre de 2009. El
eBook #30000 es The Bird Book (El libro de los aves, 1915), de Chester
Albert Reed.

# 30.000 ebooks y más

Distributed Proofreaders celebra su décimo aniversario en octubre de
2010, con más de 18.000 libros digitalizados y corregidos en diez años
por miles de voluntarios.

El Proyecto Gutenberg cuenta con más de 33.000 ebooks en diciembre de
2010, en varios formatos para lectura en un ordenador, un PDA, un
teléfono móvil, un smartphone o una tableta.



LE PROJET GUTENBERG A 40 ANS [FR]


Au 16e siècle, Gutenberg avait permis à chacun d'avoir des livres
imprimés pour un prix relativement modique. Au 21e siècle, le Projet
Gutenberg permettrait à chacun d'avoir une bibliothèque numérique
gratuite.

# Gestation

Quels furent les tous débuts du projet? Alors étudiant à l’Université
de l'Illinois (États-Unis), Michael Hart se voit attribuer quelques
millions de dollars de «temps machine» dans le laboratoire informatique
de son université.

Le 4 juillet 1971, jour de la fête nationale, il saisit The United
States Declaration of Independence (Déclaration de l’indépendance des
États-Unis) sur le clavier de son ordinateur, en caractères majuscules,
puisque les caractères minuscules n’existent pas encore. Le texte
électronique représente 5 Ko (kilo-octets). L’envoi d’un fichier de 5
Ko à la centaine de personnes utilisant le pré-internet de l'époque
aurait fait imploser celui-ci, la bande passante étant infime. Michael
diffuse donc un message indiquant où le texte est stocké - sans lien
hypertexte toutefois, puisque le web ne voit le jour que vingt ans
après - suite à quoi le fichier est téléchargé par six personnes. Le
Projet Gutenberg est né.

Dans la foulée, Michael décide de consacrer l'énorme crédit-temps mis à
sa disposition à la recherche des oeuvres littéraires disponibles dans
les bibliothèques et à la numérisation de celles-ci. Au lieu d’être un
ensemble de pages reliées, le livre sera un texte électronique pouvant
être déroulé en continu.

Peu après, Michael définit la mission du Projet Gutenberg: mettre à la
disposition de tous gratuitement, par voie électronique, le plus grand
nombre possible d’oeuvres littéraires.

Après avoir saisi The United States Declaration of Independence
(Déclaration de l’indépendance des États-Unis, signée le 4 juillet
1776) en 1971, Michael poursuit ses efforts en 1972 en saisissant The
United States Bill of Rights (Déclaration des droits des États-Unis).
Ce texte comprend les dix premiers amendements ajoutés en 1789 à la
Constitution des États-Unis (qui date elle-même de 1787), et
définissant les droits individuels des citoyens et les pouvoirs
respectifs du gouvernement fédéral et des États. En 1973, un volontaire
saisit The United States Constitution (Constitution des États-Unis)
dans son entier.

L’internet, qui était encore embryonnaire en 1971, débute véritablement
en 1974, suite à la création du protocole TCP/IP (Transmission Control
Protocol / Internet Protocol).

D’année en année, la capacité de la disquette augmente régulièrement -
le disque dur n’existe pas encore -, si bien qu'il est possible
d’envisager des fichiers de plus en plus volumineux. Des volontaires
entreprennent la numérisation de La Bible, composée elle-même de
plusieurs livres pouvant être traités séparément et occuper chacun un
fichier différent.

Michael Hart débute la saisie des oeuvres complètes de Shakespeare,
avec l'aide de volontaires, une pièce de théâtre après l’autre, avec un
fichier pour chaque pièce. Cette version n'est d’ailleurs jamais mise
en ligne, du fait d’une loi plus contraignante sur le copyright entrée
en vigueur dans l’intervalle, et qui vise non pas le texte de
Shakespeare, tombé depuis longtemps dans le domaine public, mais les
commentaires et notes de l'édition correspondante. D’autres éditions
annotées appartenant au domaine public sont mises en ligne quelques
années plus tard.

# De 10 à 1.000 ebooks

En août 1989, le Projet Gutenberg met en ligne l'eBook #10, The King
James Bible, une bible publiée pour la première fois en 1611 et dont la
version la plus connue date de 1769. L'ensemble des fichiers de
l'Ancien Testament et du Nouveau Testament représente 5 Mo (méga-
octets).

En 1990, les internautes sont au nombre de 250.000, et le standard en
vigueur est la disquette de 360 Ko. En janvier 1991, Michael Hart
saisit Alice’s Adventures in Wonderland (Alice au pays des merveilles,
1865) de Lewis Carroll. En juillet de la même année, il saisit Peter
Pan (1904) de James M. Barrie. Ces deux classiques de la littérature
enfantine tiennent chacun sur une disquette standard.

Arrive ensuite le web, opérationnel en 1991. Le premier navigateur,
Mosaic, apparaît en novembre 1993. Lorsque l’utilisation du web se
généralise, il devient plus facile de faire circuler les textes
électroniques et de recruter des volontaires.

Le Projet Gutenberg rode sa méthode de travail, avec la numérisation
d’un texte par mois en 1991, deux textes par mois en 1992, quatre
textes par mois en 1993 et huit textes par mois en 1994.

En janvier 1994, le Projet Gutenberg met en ligne l'eBook #100, The
Complete Works of William Shakespeare (Les oeuvres complètes de William
Shakespeare). Shakespeare écrivit l'essentiel de son oeuvre entre 1590
et 1613.

La production continue ensuite d’augmenter, avec une moyenne de 16
nouveaux titres par mois en 1995 et 32 nouveaux titres par mois en
1996.

Comme on le voit, entre 1991 et 1996, la production double chaque
année. Tout en continuant de numériser des livres, Michael coordonne
désormais le travail de dizaines de volontaires.

En 1997, la production est toujours de 32 nouveaux titres par mois. En
juin 1997, le Projet Gutenberg met en ligne The Merry Adventures of
Robin Hood (Les aventures de Robin des Bois, 1883) de Howard Pyle. En
août 1997, il met en ligne l'eBook #1000, La Divina Commedia (La Divine
Comédie, 1321) de Dante Alighieri, dans sa langue d’origine, en
italien.

À l'époque, le Projet Gutenberg s’articule en trois grands secteurs:
(a) «Light Literature» (littérature de divertissement), qui inclut par
exemple Alice’s Adventures in Wonderland, Peter Pan ou Aesop’s Fables
(Fables d’Ésope); (b) «Heavy Literature» (littérature «sérieuse»), qui
inclut par exemple La Bible, les oeuvres de Shakespeare ou Moby Dick;
(c) «Reference Literature» (littérature de référence), composée
d’encyclopédies et de dictionnaires, par exemple le Roget’s Thesaurus.
Un classement par rubriques plus détaillé remplacera par la suite ces
trois secteurs.

Le Projet Gutenberg se veut universel, aussi bien pour les oeuvres
choisies que pour le public visé, le but étant de mettre la littérature
à la disposition de tous, en dépassant largement le public habituel des
étudiants et des enseignants. Le secteur consacré à la littérature de
divertissement est destiné à amener devant l’écran un public très
divers, par exemple des enfants et leurs grands-parents recherchant le
texte électronique de Peter Pan après avoir vu le film Hook, ou
recherchant la version électronique d’Alice au pays des merveilles
après avoir regardé l'adaptation filmée à la télévision, ou recherchant
l’origine d’une citation littéraire après avoir vu un épisode de Star
Trek. Pratiquement tous les épisodes de Star Trek citent des livres
ayant leur correspondant numérique dans le Projet Gutenberg.

L’objectif est donc que le public, qu’il soit familier ou non avec le
livre imprimé, puisse facilement retrouver des textes entendus dans des
conversations, des films, des musiques, ou alors lus dans d’autres
livres, journaux et magazines.

Les textes électroniques (appelés “etexts” ou “ebooks”) sont stockés de
la manière la plus simple possible, au format ASCII (American Standard
Code for Information Interchange), pour que ces textes puissent être
lus sans problème quels que soient la plateforme et le logiciel
utilisés. Des lettres capitales remplacent les termes en italique, en
gras et soulignés de la version imprimée. Les fichiers électroniques
prennent peu de place et peuvent être facilement téléchargés. La
recherche textuelle est tout aussi simple. Il suffit d’utiliser la
fonction «rechercher» présente dans n’importe quel logiciel.

Michael Hart écrit en août 1998 lors d'un entretien par courriel: «Nous
considérons le texte électronique comme un nouveau médium, sans
véritable relation avec le papier. Le seul point commun est que nous
diffusons les mêmes oeuvres, mais je ne vois pas comment le papier peut
concurrencer le texte électronique une fois que les gens y sont
habitués, particulièrement dans les établissements d'enseignement. (…)
Mon projet est de mettre 10.000 textes électroniques sur l’internet.
[NDLR: Ce sera chose faite en octobre 2003.] Si je pouvais avoir des
subventions importantes, j’aimerais aller jusqu’à un million et étendre
aussi le nombre de nos usagers potentiels de 1,x% à 10% de la
population mondiale, ce qui représenterait la diffusion de 1.000 fois
un milliard de textes électroniques, au lieu d’un milliard seulement.»

# De 1.000 à 10.000 ebooks

Entre 1998 et 2000, la moyenne est constante, avec 36 nouveaux titres
par mois. En mai 1999, les collections comptent 2.000 livres
numériques. L'eBook #2000 est Don Quijote (Don Quichotte, 1605) de
Cervantes, dans sa langue d’origine, en espagnol.

Distributed Proofreaders (DP) est lancé en octobre 2000 par Charles
Franks pour permettre la correction partagée des livres entre de
nombreux volontaires. Les volontaires choisissent un livre en cours de
traitement pour relire et corriger une page donnée. Chacun travaille à
son propre rythme. A titre indicatif, il est conseillé de relire une
page par jour. C’est peu de temps sur une journée, et c’est beaucoup
pour le projet.

Disponible en décembre 2000, l'eBook #3000 est le troisième volume de À
l’ombre des jeunes filles en fleurs (1919) de Marcel Proust, dans sa
langue d'origine, en français. La moyenne passe à 104 livres par mois
en 2001.

Le Doctrine Publishing Corporation Australia voir le jour en août 2001.

Mis en ligne en octobre 2001, l'eBook #4000 est The French Immortals
Series (Collection de textes d'Immortels français), dans sa traduction
anglaise. Publié à Paris en 1905 par la Maison Mazarin, ce livre
rassemble plusieurs fictions d’écrivains couronnés par l’Académie
française, comme Émile Souvestre, Pierre Loti, Hector Malot, Charles de
Bernard, Alphonse Daudet, etc.

Disponible en avril 2002, l'eBook #5000 est The Notebooks of Leonardo
da Vinci (Les Carnets de Léonard de Vinci), des carnets datant du début
du 16e siècle et traduits de l'italien vers l'anglais. Ces carnets ont
constamment été dans le Top 100 des livres téléchargés depuis leur mise
en ligne.

En 1991, Michael Hart avait choisi de numériser Alice’s Adventures in
Wonderland et Peter Pan parce que, dans l’un et l’autre cas, leur
version numérisée tenait sur une disquette de 360 Ko, le standard de
l’époque. Quinze ans plus tard, en 2002, on dispose de disquettes de
1,44 Mo et on peut aisément compresser les fichiers en les zippant. Un
fichier standard peut désormais comporter trois millions de caractères,
plus qu’il n’en faut pour un livre de taille moyenne, puisqu'un roman
de 300 pages numérisé au format ASCII représente un méga-octet. Un
livre volumineux tient sur deux fichiers ASCII, téléchargeables tels
quels ou en version zippée.

Cinquante heures environ sont nécessaires pour sélectionner un livre de
taille moyenne, vérifier qu’il est bien du domaine public, le scanner,
le corriger, le formater et le mettre en page.

Quelques numéros de livres sont réservés pour l’avenir, par exemple le
numéro 1984 (eBook #1984) pour le roman éponyme de George Orwell,
publié en 1949, et qui est donc loin d’être tombé dans le domaine
public.

Au printemps 2002, les collections représentent le quart des oeuvres du
domaine public en accès libre sur le web, recensées de manière
pratiquement exhaustive par l’Internet Public Library (IPL), un beau
résultat dû au patient travail de milliers de volontaires actifs dans
de nombreux pays. En 2002, la production est   de 203 nouveaux titres
par mois.

En novembre 2002, le Projet Gutenberg met en ligne les 75 fichiers du
Human Genome Project (Projet du génome humain, à savoir le séquençage
du génome humain), ceci peu de temps après sa parution initiale en
février 2001, puisqu’il appartient d’emblée au domaine public. Chaque
fichier se chiffre en dizaines sinon en centaines de méga-octets.

1.000 livres en août 1997, 2.000 livres en mai 1999, 3.000 livres en
décembre 2000, 4.000 livres en octobre 2001, 5.000 livres en avril
2002, 10.000 livres en octobre 2003. L'eBook #10000 est The Magna
Carta, qui fut le premier texte constitutionnel anglais, signé en 1215.

Entre avril 2002 et octobre 2003, les collections doublent, passant de
5.000 à 10.000 livres en dix-huit mois. La moyenne mensuelle est de 348
nouveaux titres en 2003. Cette croissance rapide est due à l’activité
de Distributed Proofreaders (DP), un site conçu en octobre 2000 pour
permettre la correction partagée des livres entre de nombreux
volontaires.

En août 2003, un CD Best of Gutenberg est disponible avec une sélection
de 600 ebooks. En décembre 2003, date à laquelle le Projet Gutenberg
fête ses 10.000 ebooks, la quasi-totalité de ceux-ci (9.400 ebooks) est
gravée sur un DVD. CD et DVD sont envoyés gratuitement à qui en fait la
demande. Libre ensuite à chacun de faire autant de copies que possible
et de les distribuer autour de soi dans des écoles et des
bibliothèques.

En septembre 2003, le Projet Gutenberg lance le Projet Gutenberg Audio
eBooks, une collection de livres audio (lus par l'être humain), ainsi
que le Sheet Music Subproject (Sous-projet pour les partitions
musicales), une collection rassemblant des partitions musicales et des
enregistrements musicaux. Un autre sous-projet rassemble des images
fixes et animées.

# De 10.000 à 20.000 ebooks

En décembre 2003, les collections approchent les 11.000 ebooks.
Plusieurs formats sont désormais présents, par exemple les formats
HTML, XML et RTF, le format principal - et obligatoire – restant
l’ASCII. Le tout représente 46.000 fichiers, soit une capacité totale
de 110 Go (giga-octets). Le 13 février 2004, date de la conférence de
Michael Hart au siège de l’UNESCO à Paris, les collections comprennent
très exactement 11.340 ebooks dans 25 langues. En mai 2004, les 12.500
ebooks disponibles représentent 100.000 fichiers dans une vingtaine de
formats, soit une capacité totale de 135 Go, destinée à doubler chaque
année avec l’ajout d'environ 300 ebooks par mois (338 ebooks en 2004).

Parallèlement, le Doctrine Publishing Corporation Consortia Center (PGCC), qui avait
été lancé en 1997 pour rassembler des collections de livres numériques
déjà existantes et provenant de sources diverses, est officiellement
affilié au Projet Gutenberg en 2003.

Le Projet Gutenberg Europe est lancé en janvier 2004 à l’instigation du
Projet Rastko, basé à Belgrade, en Serbie. Distributed Proofreaders
Europe débute la production de livres numériques à la même date, avec
cent livres disponibles en avril 2005. Les livres sont en plusieurs
langues pour refléter la diversité linguistique prévalant en Europe.

En janvier 2005, le Projet Gutenberg met en ligne l'eBook #15000, The
Life of Reason (La vie de raison, 1906) de George Santayana.

En juin 2005, le nombre de livres s’élève à 16.000. Si 25 langues
seulement étaient présentes en février 2004, 42 langues sont
représentées en juin 2005, dont le sanscrit et les langues mayas.

Le Doctrine Publishing Corporation Australia (lancé en août 2001) fête ses 500 livres
en juillet 2005.

Un nouveau secteur, dénommé Doctrine Publishing Corporation PrePrints, est lancé en
janvier 2006 pour accueillir de nouveaux documents suffisamment
intéressants pour être mis en ligne, mais ne pouvant être intégrés aux
collections du Projet Gutenberg sans traitement ultérieur par des
volontaires, pour diverses raisons: collections incomplètes, qualité
insuffisante, conversion souhaitée dans un autre format, etc. Les
PrePrints comprennent 379 ebooks en décembre 2006, et 2.020 ebooks en
février 2009.

En décembre 2006, le Projet Gutenberg franchit la barre des 20.000
livres. L'eBook #20000 est un livre audio, Twenty Thousand Leagues
Under the Sea, version anglaise du roman Vingt mille lieues sous les
mers (1869) de Jules Verne. La moyenne est de 345 nouveaux titres par
mois en 2006.

S'il a fallu 32 ans et deux mois, de juillet 1971 à octobre 2003, pour
numériser les 10.000 premiers livres, il n’aura fallu que trois ans et
deux mois, d’octobre 2003 à décembre 2006, pour numériser les 10.000
livres suivants.

À la même date, le Doctrine Publishing Corporation Australia approche les 1.500
livres (c'est chose faite en avril 2007) et le Projet Gutenberg Europe
compte 400 livres.

En décembre 2006, on compte 50 langues. Les dix langues comprenant plus
de cinquante livres sont l’anglais (17.377 livres le 16 décembre 2006),
le français (966 livres), l’allemand (412 livres), le finnois (344
livres), le hollandais (244 livres), l’espagnol (140 livres), l’italien
(102 livres), le chinois (69 livres), le portugais (68 livres) et le
tagalog (51 livres).

# De 20.000 à 30.000 ebooks

Doctrine Publishing Corporation News, le blog officiel du Projet Gutenberg, débute en
novembre 2006 à l’instigation de Mike Cook. Ce blog complète les
lettres d’information (hebdomadaire et mensuelle) existant depuis
nombre d'années. Le blog offre par exemple les statistiques de
production hebdomadaires, mensuelles et annuelles depuis 2001.

La production hebdomadaire est de 24 livres en 2001, 47 livres en 2002,
79 livres en 2003, 78 livres en 2004, 58 livres en 2005 et 80 livres en
2006.

La production mensuelle est de 104 livres en 2001, 203 livres en 2002,
348 livres en 2003, 338 livres en 2004, 252 livres en 2005 et 345
livres en 2006.

La production annuelle est de 1.244 livres en 2001, 2.432 livres en
2002, 4.176 livres en 2003, 4.058 livres en 2004, 3.019 livres en 2005
et 4.141 livres en 2006.

Le Projet Gutenberg Canada (PGC) voit le jour le 1er juillet 2007, le
jour de la fête nationale, à l'instigation de Michael Shepard et David
Jones. Il est suivi de Distributed Proofreaders Canada (DPC), avec une
production qui débute en décembre 2007. Les cent premiers livres sont
disponibles en mars 2008, en anglais, en français et en italien.

Le Projet Gutenberg envoie 15 millions de livres sur CD ou DVD par
courrier postal en 2007. Le DVD le plus récent (qui date de juillet
2006) comprend 17.000 livres. Le contenu des CD et DVD est également
disponible sous forme de fichiers ISO (depuis 2005) peuvant être
téléchargés pour graver des CD et DVD.

Le Projet Gutenberg compte 25.000 livres en avril 2008. L'eBook #25000
est English Book Collectors (Collectionneurs de livres anglais, 1902)
de William Younger Fletcher.

Le Projet Gutenberg Europe atteint les 500 livres en octobre 2008.

Le Projet Gutenberg comptabilise 30.000 livres en octobre 2009. L'eBook
#30000 est The Bird Book (Le livre des oiseaux, 1915), de Chester
Albert Reed.

# 30.000 ebooks et plus

Principale source des livres du Projet Gutenberg, Distributed
Proofreaders (DP) fête son dixième anniversaire en octobre 2010, avec
plus de 18.000 livres patiemment numérisés, relus et corrigés pendant
dix ans par plusieurs milliers de volontaires.

Le Projet Gutenberg propose plus de 33.000 ebooks de grande qualité en
décembre 2010, dans divers formats pour lecture sur ordinateur, PDA,
téléphone mobile, smartphone et tablette.



FROM THE PAST TO THE FUTURE [EN]


The results of Doctrine Publishing Corporation are not only measured in numbers. The
results can also be measured in the major influence the project has
had.

# Other digital libraries

As the oldest producer of free ebooks on the internet, Project
Gutenberg has inspired many other digital libraries, for example
Projekt Runeberg for classic Nordic (Scandinavian) literature, and
Projekt Gutenberg-DE for classic German literature, which started
respectively in 1992 and 1994.

Projekt Runeberg was the first Swedish digital library of books from
public domain, and a partner of Doctrine Publishing Corporation. It was initiated in
December 1992 by the students’ computer club Lysator, in cooperation
with the Linköping University (Sweden), as a volunteer project to
create and collect free electronic editions of classic Nordic
literature and art. Around 200 ebooks were available in full text in
1998. There was also a list of 6,000 Nordic authors as a tool for
further collection development.

Projekt Gutenberg-DE was the first German digital library of books from
public domain, created in 1994 as a partner of Doctrine Publishing Corporation. Texts
were available for online reading, with one webpage for short texts and
with several webpages – one per chapter – for longer works. There was
an alphabetic list of authors and titles, and a short biography and
bibliography for each author.

# “Less is more.”

Doctrine Publishing Corporation has kept its administrative and financial structure
to the bare minimum. Its motto fits into three words: “Less is more.”
The goal is to ensure its independence from loans and other funding,
and from ephemeral cultural priorities, to avoid pressure from
politicians and others. The goal is also to ensure respect for the
volunteers, who can be confident their work will be used for decades.
Volunteers can network through mailing lists, weekly or monthly
newsletters, discussion lists, forums, and wikis. Founded in 2000, the
PGLAF (Doctrine Publishing Corporation Literary Archive Foundation) has only three
part-time employees.

Donations are used to buy equipment and supplies, mostly computers,
scanners, and blank CDs and DVDs. CDs and DVDs are sent for free to
those who request them. After the CD Best of Gutenberg available in
August 2003 with a selection of 600 ebooks, and a first DVD available
in December 2003 with 9,400 ebooks, a second DVD is available in July
2006 with 17,000 ebooks. Since 2005, CDs and DVDs have been both
available on the website of BitTorrent as ISO images that can be
downloaded to burn CDs and DVDs for personal use. In 2007, the Project
Gutenberg sent 15 million books by snail mail on CDs and DVDs.

More generally, Michael Hart should be given more credit as the
inventor of the electronic book (ebook). If we consider the ebook in
its etymological sense – i.e. a book that has been digitized to be
distributed as an electronic file – it was born with Doctrine Publishing Corporation
in July 1971, 30 years before the various commercial launchings that
peppered the early 2000s, with the ebooks of Amazon, Barnes & Noble,
Gemstar, and others.

# Tens of thousands of downloads per day

There is a big demand, as confirmed by the tens of thousands of books
that are downloaded every day.

For example, on July 31, 2005, there were 37,532 downloads for the day,
243,808 downloads for the week, and 1,154,765 downloads for the month.

On May 6, 2007, there were 89,841 downloads for the day, 697,818
downloads for the week, and 2,995,436 downloads for the month.

On November 15, 2010, there were 130,524 downloads for the day, 888,520
downloads for the week, and 3,582,153 downloads for the month.

North Carolina, Chapel Hill, United States), the main distribution
is the backup distribution site and provides unlimited disk space for
storage and processing. Doctrine Publishing Corporation has 40 mirror sites
worldwide, and seeks new ones. It also encourages the use of P2P for
sharing its ebooks.

Readers can choose ebooks from the “Top 100?, i.e. the top 100 ebooks
and the top 100 authors for the previous day, the last seven days and
the last thirty days.

Doctrine Publishing Corporation ebooks can also help bridge the “digital divide”.
They can be read on an outdated computer or a second-hand netbook
costing just a few dollars.

# Towards the future

It is hoped machine translation software will be able to convert the
ebooks from one to another of 100 languages. In ten years from now,
machine translation may be judged 99% satisfactory – research is active
on that front, and software is improving fast – allowing for the
reading of literary classics in a choice of many languages. Project
Gutenberg is also interested in combining translation software and
human translators, somewhat as OCR software is now combined with the
work of proofreaders.

40 years after the beginning of Doctrine Publishing Corporation, Michael Hart
describes himself as a workaholic who has devoted his entire life to
his project. He considers himself a pragmatic and farsighted altruist.
For years he was regarded as a nut but now he is respected. He wants to
change the world through freely-available ebooks that can be used and
copied endlessly, and reading and culture for everyone at minimal cost.

Doctrine Publishing Corporation’s mission can be stated in eight words: “To encourage
the creation and distribution of ebooks,” by everybody, and by every
possible means, while implementing new ideas, new methods, and new
software.



DESDE EL PASADO HACIA EL FUTURO [ES]


Los resultados del Proyecto Gutenberg no se miden sólo en cifras. Los
resultados se miden también por la influencia que ha tenido el
proyecto, pues ésta ha sido enorme.

# Otras bibliotecas digitales

El Proyecto Gutenberg – primera página web de información en el
internet y primera biblioteca digital –, inspira muchas otras
bibliotecas digitales, por ejemplo el Projekt Runeberg para la
literatura escandinava o el Projekt Gutenberg-DE para la literatura
alemana.

El Projekt Runeberg es la primera biblioteca digital sueca de libros
del dominio público, y un socio del Proyecto Gutenberg. Esta biblioteca
es creada en diciembre de 1992 por Lysator, un club informático de
estudiantes, en colaboración con la biblioteca de la Universidad de
Linköping (Suecia), para producir y organizar versiones electrónicas
gratuitas de obras de literatura nórdica (escandinava) clásica. 200
obras están disponibles en 1998, con una lista de 6.000 autores
nórdicos para el desarrollo de las colecciones futuras.

El Projekt Gutenberg-DE es la primera biblioteca digital alemana de
libros del dominio público, y también un socio del Proyecto Gutenberg.
Se pueden leer decenas de textos en línea en 1998, con una página web
para textos cortos y varias páginas web - uno por capítulo – para obras
más largas. Una lista alfabética de autores y de títulos está
disponible en el sitio, con una breve biografía y bibliografía para
cada autor.

# Una estructura tan simple como posible

La estructura administrativa y financiera del Proyecto Gutenberg se
limita al mínimo estricto. Michael Hart insiste frecuentemente sobre la
necesidad de preservar un marco lo más flexible posible que deje campo
libre a los voluntarios, y la puerta abierta para las nuevas ideas. El
objetivo es garantizar la perennidad del proyecto, sin depender ni de
créditos y cortes de créditos, ni de las prioridades culturales,
financieras y políticas del momento. De este modo no puede ejercerse
ninguna forma de presión por el poder o el dinero. Además esto
significa respeto para con los voluntarios, quienes pueden estar
seguros de que verán su trabajo utilizado durante muchos años. En
cuanto a la supervisión regular del proyecto, se garantiza gracias a
cartas de información semanales y mensuales, foros de discusión, wikis
y blogs.

Las donaciones sirven para financiar ordenadores y escáneres, y para
enviar CD y DVD gratuitos a aquéllos que los solicitan. Después del CD
"Best of Gutenberg" disponible en agosto de 2003 con una selección de
600 libros y de un primer DVD disponible en diciembre de 2003 con 9.400
libros, un segundo DVD está disponible en julio de 2006 con 17.000
libros. A partir de 2005, CD y DVD ambos están disponibles en el sitio
web de BitTorrent, bajo la forma de imágenes ISO que se pueden
descargar con el fin de grabar CD y DVD a título personal. En 2007, el
Proyecto Gutenberg envía 15 millones de libros por correo postal bajo
la forma de CD y DVD.

Aunque demasiadas veces se silencie, cabe recordar que el verdadero
inventor del ebook es Michael Hart. Si tomamos la palabra "ebook" en su
sentido etimológico – a saber un libro digital para difusión bajo la
forma de un archivo electrónico - habría nacido con el Proyecto
Gutenberg en julio de 1971, 30 años antés de los diversos lanzamientos
comerciales que salpicaron el principio de los años 2000 con los ebooks
de Amazon, Barnes & Noble, Gemstar y demás.

# Decenas de miles de descargas al día

La demanda es enorme, a prueba de ello el número de descargas, que se
cifran en decenas de miles diarias.

A fecha del 31 de julio de 2005, se cuenta con 37.532 archivos
descargados al día, 243.808 archivos a la semana y 1.154.765 archivos
al mes.

A fecha del 6 de mayo de 2007, se cuenta con 89.841 archivos
descargados al día, 697.818 archivos a la semana y 2.995.436 archivos
al mes.

A fecha del 15 de noviembre de 2010, se cuenta con 130.524 archivos
descargados al día, 888.520 archivos a la semana y 3.582.153 archivos
al mes.

(basado en la Universidad de Carolina del Norte, Estados Unidos), que
alberga también el sitio web del Proyecto Gutenberg. El segundo sitio
web de descargas es el del Internet Archive, que también sirve de copia
de seguridad y le proporciona al
Proyecto Gutenberg une capacidad de almacenamiento ilimitada.

Un Top 100 inventaria los cien títulos y los cien autores que más han
sido descargados durante el día, la semana y el mes.

El Proyecto Gutenberg dispone de 40 sitios web espejo repartidos en
toda la planeta, y aún necesita encontrar otros. Los archivos también
circulan en modo P2P (peer-to-peer), lo que permite a cualquier
utilizador intercambiar directamente archivos con otro utilizador.

Los libros del Proyecto Gutenberg pueden ayudar a colmar la fractura
digital. Es muy sencillo descargarlos en un ordenador o un dispositivo
móvil de segunda mano que no cuestan más de unos dólares o decenas de
dólares.

# Hacia el futuro

Más adelante, quizás se pueda contemplar la idea de una traducción
simultánea a unos cien idiomas, utilizando un programa de traducción
automática con un margen de fiabilidad del orden de 99% en el futuro.
Los textos generados por el software de traducción automática pasarían
luego en manos de traductores (no máquinas, sino seres humanos) para
hacerles algunos retoques, siguiendo un modelo parecido al de la
tecnología OCR, que no puede prescindir de los correctores (no de los
software, sino de los seres humanos) para ofrecer un contenido de
calidad óptima.

Cuarenta años después de la creación del Proyecto Gutenberg, Michael
Hart se define aún como un adicto al trabajo que sigue dedicándose
enteramente a su proyecto, proyecto que en su opinión está al origen de
una revolución neo-industrial. Se define también a sí mismo como un
altruista, pragmático y visionario. Tras haber sido tildado de chiflado
durante años, ahora suscita el respeto.

Con el pasar de los años, la misión del Proyecto Gutenberg nunca ha
dejado de ser la misma, a saber la de cambiar el mundo mediante el
ebook gratuito, de uso infinito y repetible. El objetivo también sigue
siendo el mismo, es decir la lectura gratis y la cultura para todos.

En cuanto a la misión, se resume en pocas palabras: "fomentar la
creación y la distribución de los ebooks", por cuantas personas sea
posible, por todos los medios posibles, y aceptando también los virajes
necesarios para integrar nuevas ideas, nuevos métodos y nuevos
soportes.



DU PASSÉ VERS L'AVENIR [FR]


Les résultats du Projet Gutenberg ne se mesurent pas seulement à des
chiffres. Les résultats se mesurent aussi à l’influence du projet, qui
est considérable.

# D'autres bibliothèques numériques

Premier site d’information sur l’internet et première bibliothèque
numérique, le Projet Gutenberg inspire bien d’autres bibliothèques
numériques au fil des ans, à commencer par le Projekt Runeberg pour la
littérature scandinave et le Projekt Gutenberg-DE pour la littérature
allemande.

Le Projekt Runeberg est la première bibliothèque numérique suédoise de
livres du domaine public, créée en décembre 1992 par Lysator, un club
informatique d’étudiants, en collaboration avec la bibliothèque de
l'Université de Linköping (Suède). Le but est de produire et organiser
des  versions électroniques gratuites de la littérature nordique
classique. 200 oeuvres sont disponibles en 1998, avec une liste de
6.000 auteurs nordiques en tant qu'outil de développement des
collections.

Projekt Gutenberg-DE est la première bibliothèque numérique allemande
de livres du domaine public. Plusieurs dizaines de textes peuvent être
lus en ligne en 1998, avec une page web pour les textes courts et
plusieurs pages – une par chapitre – pour les oeuvres plus longues. Une
liste alphabétique d'auteurs et de titres est également disponible,
ainsi qu'une courte biographie et bibliographie pour chaque auteur.

# Une structure aussi simple que possible

La structure administrative et financière du Projet Gutenberg se limite
au strict minimum, avec une devise qui tient en trois mots: «Less is
more». Michael Hart insiste régulièrement sur la nécessité d’un cadre
aussi souple que possible laissant toute initiative aux volontaires, et
la porte grande ouverte aux idées nouvelles. Le but est d’assurer la
pérennité du projet indépendamment des crédits, des coupures de crédits
et des priorités culturelles, financières et politiques du moment. Pas
de pression possible donc par le pouvoir et par l’argent. Et respect à
l’égard des volontaires, qui sont assurés de voir leur travail utilisé
pendant de nombreuses années. Le suivi régulier du projet est assuré
grâce à une lettre d’information hebdomadaire et mensuelle, des forums
de discussion, des wikis et des blogs.

Les dons servent à financer des ordinateurs et des scanners, et à
envoyer des CD et DVD gratuits à tous ceux qui en font la demande.
Suite au CD Best of Gutenberg disponible en août 2003 avec une
sélection de 600 titres, un premier DVD est disponible en décembre 2003
avec 9.400 titres, suivi d'un deuxième DVD disponible en juillet 2006
avec 17.000 titres. A partir de 2005, CD et DVD sont disponibles sous
forme d'images ISO sur le site de BitTorrent, ces images pouvant être
téléchargées pour graver des CD et DVD sur place à titre personnel. En
2007, le Projet Gutenberg envoie 15 millions de livres par voie postale
sous forme de CD et DVD.

Chose souvent passée sous silence, Michael Hart est le véritable
inventeur de l’ebook. Si on considère l’ebook dans son sens
étymologique, à savoir un livre numérisé pour diffusion sous forme de
fichier électronique, celui-ci serait né avec le Projet Gutenberg en
juillet 1971, trente ans avant les divers lancements commerciaux ayant
émaillé le début des années 2000 avec les ebooks d'Amazon, Barnes &
Noble, Gemstar et autres.

# Des dizaines de milliers de téléchargements par jour

La demande est énorme. En témoigne le nombre de téléchargements, qui se
comptent  en dizaines de milliers par jour.

A la date du 31 juillet 2005, on compte 37.532 fichiers téléchargés
dans la journée, 243.808 fichiers téléchargés dans la semaine et
1.154.765 fichiers téléchargés dans le mois.

A la date du 6 mai 2007, on compte 89.841 fichiers téléchargés dans la
journée, 697.818 fichiers téléchargés dans la semaine et 2.995.436
fichiers téléchargés dans le mois. Courant mai, ce nombre atteint les 3
millions.

À la date du 15 novembre 2010, on compte 130.524 fichiers téléchargés
dans la journée, 888.520 fichiers téléchargés dans la semaine et
3.582.153 fichiers téléchargés dans le mois.

(basé à l’Université de Caroline du Nord, aux États-Unis), qui héberge
aussi le site du Projet Gutenberg. Le deuxième site de téléchargement
est l’Internet Archive, qui est le site de sauvegarde et qui met à la
disposition du Projet Gutenberg une capacité de stockage illimitée.

Un «Top 100» recense les cent titres et les cent auteurs les plus
téléchargés dans la journée, dans la semaine et dans le mois.

Le Projet Gutenberg dispose de 40 sites miroirs répartis sur toute la
planète, et il en cherche d’autres. La circulation des fichiers se fait
aussi en mode P2P (Peer-to-Peer), qui permet d’échanger des fichiers
directement d’un utilisateur à l’autre.

Les livres du Projet Gutenberg peuvent aider à combler la fracture
numérique. Ils sont aisément téléchargeables sur un ordinateur ou un
netbook d'occasion ne coûtant que quelques dollars ou quelques dizaines
de dollars.

# Vers l'avenir

Plus tard, il sera peut-être possible d'envisager une traduction
simultanée dans une centaine de langues, en utilisant un logiciel de
traduction automatique qui aurait alors un taux de fiabilité de l’ordre
de 99%, un pourcentage dont on est encore loin. Ce logiciel de
traduction automatique serait relayé par des traducteurs (non pas des
machines, mais des êtres humains), sur un modèle comparable à la
technologie OCR actuellement relayée par des correcteurs (non pas des
logiciels, mais des êtres humains) pour offrir un contenu de grande
qualité.

Quarante ans après les débuts du Projet Gutenberg, Michael Hart se
définit toujours comme un fou de travail dédiant toute sa vie à son
projet, qu’il voit comme étant à l’origine d’une révolution néo-
industrielle. Il se définit aussi comme altruiste, pragmatique et
visionnaire. Après avoir été traité de toqué pendant de nombreuses
années, il force maintenant le respect.

Au fil des ans, la mission du Projet Gutenberg reste la même, à savoir
changer le monde par le biais de l’ebook gratuit indéfiniment
utilisable et reproductible, et favoriser ainsi la lecture et la
culture pour tous à moindres frais.

Cette mission se résume en quelques mots: «encourager la création et la
distribution d’ebooks», par autant de personnes que possible, et par
tous les moyens de diffusion possibles, tout en prenant les virages
nécessaires pour intégrer de nouvelles idées, de nouvelles méthodes et
de nouveaux supports.



Doctrine Publishing Corporation AND LANGUAGES [EN]


Doctrine Publishing Corporation mainly offers English-language ebooks, but
multilingualism has become one of its priorities. French is the second
language of the project. There were ebooks in 60 languages in December
2010.

# In 1990-94

Initially, the ebooks were in English. As Doctrine Publishing Corporation was
launched from the University of Illinois (United States), with the help
of English-speaking volunteers, its first goal has been to provide
ebooks to the English-language community, that is to say 95% of
internet users in the early 1990s. (Non-English-speaking users reached
50% in summer 2000, with a percentage steadily growing ever since.)

Doctrine Publishing Corporation was also inspiring other digital libraries elsewhere.
Projekt Runeberg, for classic Nordic literature, and Projekt Gutenberg-
DE, for classic German literature, started respectively in 1992 and
1994.

Projekt Runeberg was the first Swedish digital library of books from
public domain, and a partner of Doctrine Publishing Corporation. It was created by
the students' computer club Lysator, in cooperation with Linköping
University, as a volunteer project to produce and organize free
electronic editions of classic Nordic (Scandinavian) literature. Around
200 ebooks were available in 1998, with a list of 6,000 Nordic authors
as a tool for further collection development.

Projekt Gutenberg-DE was the first German digital library of books from
public domain, and also a partner of Doctrine Publishing Corporation. A number of
texts were available for online reading in 1998, with one web page for
short texts and several web pages - one per chapter - for longer works.
There was an alphabetic list of authors and titles, with a short
biography and bibliography for each author.

# In 1997

French was the second language of Doctrine Publishing Corporation, and still is in
2010.

The first ebooks released in French were six works by Stendhal and two
works by Jules Verne, all released in early 1997.

The six works by Stendhal were four short novels: L'Abbesse de Castro
(published in 1837), Les Cenci (1837), Vittoria Accoramboni (1837) and
La Duchesse de Palliano (1838), and two novels:  Le Rouge et le Noir
(1830) and La Chartreuse de Parme (1839).

The two novels by Jules Verne were: De la terre à la lune (1865) and Le
tour du monde en quatre-vingts jours (1873).

Three novels by Jules Verne were already available in English: From the
Earth to the Moon (original title: De la terre à la lune), released in
September 1993; Around the World in 80 Days (original title: Le tour du
monde en quatre-vingts jours), released in January 1994; and 20,000
Leagues Under the Seas (original title: Vingt mille lieues sous les
mers, 1869-70), released in September 1994.

Since then, Jules Verne has constantly been in the most downloaded
authors, at 11 in the “Top 20” available on the website of Project
Gutenberg in December 1999, and at 6 in the “Top 100 during the last 30
days”, on October 7, 2010.

As a side remark, the first pictures ever made available in Project
Gutenberg were French Cave Paintings, released in April 1995 as eBook
#249, with an XHTML version available in November 2000. This ebook
offers four copyrighted photographs of paleolithic paintings found in a
grotto in Ardèche, a region of south-western France. The photographs
were sent to Doctrine Publishing Corporation by Jean Clottes, a general curator for
cultural heritage (conservateur général du patrimoine), for everyone to
enjoy them.

Released in August 1997, eBook #1000 was La Divina Commedia (1321) de
Dante Alighieri, in Italian, its original language.

# In 1998

In October 1997, Michael Hart expressed his intention to produce more
ebooks in other languages. In early 1998, there were a few titles in
French, German, Italian, Spanish, and Latin.

Stendhal and Jules Verne were followed by Edmond Rostand with Cyrano de
Bergerac, published in 1897 and released in Doctrine Publishing Corporation 100 years
later, in March 1998.

# In 1999

Released in May 1999, eBook #2000 was Don Quijote (1605), by Cervantes,
in Spanish, its original language.

In July 1999, Michael Hart wrote in an email interview: "I am
publishing in one new language per month right now, and will continue
as long as possible."

# In 2000

Released in December 2000, eBook #3000 was À l'ombre des jeunes filles
en fleurs (In the Shadow of Young Girls in Flower), vol. 3 (1919), by
Marcel Proust, in French, its original language.

# In 2001

Doctrine Publishing Corporation Australia was launched in July 2001, and began
producing ebooks in English and in other languages, for example some
volumes in French of À la recherche du temps perdu (In Search of Lost
Time, 1913-27) by Marcel Proust. (The last volumes of Proust's
masterpiece are still copyrighted in the United States, the reason why
they are lacking in Doctrine Publishing Corporation's main website.) 1,750 ebooks
were available in Doctrine Publishing Corporation Australia in February 2009.

Released in October 2001, eBook #4000 was The French Immortals Series
(1905), in English. This book is an anthology of short fictions by
authors from the French Academy (Académie française): Emile Souvestre,
Pierre Loti, Hector Malot, Charles de Bernard, Alphonse Daudet, and
others.

# In 2002

Released in April 2002, eBook #5000 was The Notebooks of Leonardo da
Vinci (early 16th century), as an English translation from Italian, its
original language. Since its release, this ebook has regularly stayed
in the “Top 100” of downloaded ebooks.

# In 2003

The Doctrine Publishing Corporation Consortia Center (PGCC) was affiliated with
Doctrine Publishing Corporation in 2003, and became a sister project. Since 1997,
PGCC has been working on gathering collections of ebooks from other
sources, in a number of formats and languages, with 75,000 ebooks in
2010.

# In 2004

In early 2004, there were works in 25 languages in Doctrine Publishing Corporation.

In February 2004, Michael Hart went off to Europe, with stops in Paris,
France; Brussels, Belgium; and Belgrade, Serbia.

He gave a lecture on February 12, 2004 at the headquarters of UNESCO
(United Nations Educational, Scientific and Cultural Organization) in
Paris. He chaired a discussion at the French National Assembly on
February 13.

The following week, he addressed the European Parliament, in Brussels.

Then he went to Belgrade to meet with the team of Project Rastko and
support the launching of Doctrine Publishing Corporation Europe and Distributed
Proofreaders Europe.

Project Rastko, a non-governmental cultural and educational project,
was founded in 1997 in Belgrade as part of the Balkans Cultural Network
Initiative, a regional network for the Balkan peninsula in south-
eastern Europe.

Distributed Proofreaders Europe (DP Europe) has used the software of
the original Distributed Proofreaders, created in 2000 by Charles
Franks to share the correction of ebooks among many volunteers.

DP Europe has offered a plurilingual interface right from the start,
with its main pages translated into 12 European languages by volunteer
translators as soon as April 2004. The long-term goal was 60 languages,
for the interface to be available in most European languages.

# In 2005

In May 2005, DP Europe finished processing its 100th ebook. These
ebooks were in several languages, as a reflection of European
linguistic diversity. DP Europe has supported Unicode to be able to
proofread ebooks in many languages. 600 ebooks were available in
February 2009.

In July 2005, there were works in 42 languages in Doctrine Publishing Corporation,
including Sanskrit and the Mayan languages. The seven main languages
were English (with 14,548 ebooks on July 27, 2005), French (577
ebooks), German (349 ebooks), Finnish (218 ebooks), Dutch (130 ebooks),
Spanish (103 ebooks), and Chinese (69 ebooks).

# In 2006

Released in December 2006, eBook #20000 was the audiobook of Twenty
Thousand Leagues Under the Sea (Vingt mille lieues sous les mers,
1869), by Jules Verne,
in its English version.

In December 2006, there were ebooks in 50 languages. The ten main
languages were English (with 17,377 ebooks on December 16, 2006),
French (966 ebooks), German (412 ebooks), Finnish (344 ebooks), Dutch
(244 ebooks), Spanish (140 ebooks), Italian (102 ebooks), Chinese (69
ebooks), Portuguese (68 ebooks), and Tagalog (51 ebooks).

# In 2007

Doctrine Publishing Corporation Canada (PGC) was launched on July 1st, 2007, on
Canada Day. Distributed Proofreaders Canada (DPC) started production in
December 2007, with 100 ebooks in English, French, and Italian in March
2008, and 250 ebooks in February 2009.

# In 2010

On October 7, 2010, there were works in 59 languages in Project
Gutenberg. The ten  main languages were English (with 28,441 ebooks),
French (1,659 ebooks), German (709 ebooks), Finnish (536 ebooks), Dutch
(496 ebooks), Portuguese (473 ebooks), Chinese (405 ebooks), Spanish
(295 ebooks), Italian (250 ebooks), and Greek (101 ebooks). They were
followed by Latin, Esperanto, Swedish, and Tagalog.

# In 2020, may be

It is hoped machine translation software will be able to convert the
ebooks from one to another of many languages.

In ten years from now, machine translation may be judged 99%
satisfactory - research is active on that front, and software is
quickly improving – allowing for the reading of literary classics in a
choice of many languages.

The machine translated ebooks won't compete with the work of literary
translators and their labor of love during days and months if not
years, but they would allow readers to get the gist of some literary
works that have never been translated so far, or only translated in a
few languages, for commercial reasons.

The output of translation software could then be proofread by human
translators, in a similar way the output of OCR software is proofread
by the volunteers of Distributed Proofreaders.

So, may be, we will see Distributed Translators one day, as a partner
or sister project of Distributed Proofreaders and Doctrine Publishing Corporation?



EL PROYECTO GUTENBERG Y LOS IDIOMAS [ES]


El Proyecto Gutenberg ofrece libros digitales en inglés en su gran
mayoría, pero el multilingüismo es una de sus prioridades. El francés
es el segundo idioma del proyecto. Las collecciones reúnen libros en 60
idiomas – incluso en español - en diciembre de 2010.

# En 1990-1994

Al principio los libros digitales están en inglés. Como el Proyecto
Gutenberg  fue lanzado desde la Universidad de Illinois (Estados
Unidos), con la ayuda de voluntarios de habla inglesa, su propósito
inicial es proporcionar libros a la comunidad anglófona, es decir el
95% de los usuarios del internet a principios de 1990. (Los non
anglófonos representarán el 50% de los usuarios en el verano de 2000,
con un porcentaje que seguirá creciendo durante los años siguientes.)

El Proyecto Gutenberg también inspira dos otras bibliotecas digitales
en Europa, el Projekt Runeberg en 1992 para la literatura nórdica y el
Projekt Gutenberg-DE en 1994 para la literatura alemana.

El Projekt Runeberg es la primera biblioteca digital sueca de libros
del dominio público, y un socio del Proyecto Gutenberg. Esta biblioteca
es creada en diciembre de 1992 por Lysator, un club informático de
estudiantes, en colaboración con la biblioteca de la Universidad de
Linköping (Suecia), para producir y organizar versiones electrónicas
gratuitas de obras de literatura nórdica (escandinava) clásica. 200
obras están disponibles en 1998, con una lista de 6.000 autores
nórdicos para el desarrollo de las colecciones futuras.

El Projekt Gutenberg-DE es la primera biblioteca digital alemana de
libros del dominio público, y también un socio del Proyecto Gutenberg.
Se pueden leer decenas de textos en línea en 1998, con una página web
para textos cortos y varias páginas web - uno por capítulo – para obras
más largas. Una lista alfabética de autores y de títulos está
disponible en el sitio, con una breve biografía y bibliografía para
cada autor.

# En 1997

El francés llegó a ser la segunda lengua del Proyecto Gutenberg, y
sigue siéndolo en 2010.

Los primeros libros en francés son seis obras de Stendhal y dos obras
de Jules Verne, todas disponibles a principios de 1997.

Las dos novelas de Jules Verne son: De la terre à la lune (1865) y Le
tour du monde en quatre-vingts jours (1873).

En aquella fecha, tres novelas de Jules Verne ya están disponibles en
inglés: From the Earth to the Moon (título original: De la terre à la
lune), disponible en  septiembre de 1993; Around the World in 80 Days
(título original: Le tour du monde en quatre-vingts jours), disponible
en enero de 1994; y 20,000 Leagues Under the Sea (título original:
Vingt mille lieues sous les mers, 1869-1870), disponible en septiembre
de 1994.

Desde la publicación de estos primeros libros digitales, Jules Verne
siempre ha sido parte de los autores más descargados. Era el undécimo
autor en el “Top 20 de autores” mas descargados en diciembre de 1999.
Era el sexto autor en el “Top 100 de autores” más descargados en los
últimos treinta días en la fecha del 15 de noviembre de 2010.

En agosto de 1997, el Proyecto Gutenberg pone en línea el eBook #1000,
La Divina Commedia (La Divina Comedia) de Dante Alighieri (publicada en
1321), en italiano, su idioma original.

# En 1998-2000

En octubre de 1997, Michael Hart anuncia su intención de aumentar la
producción de libros en otros idiomas que el inglés. A principios de
1998, el catálogo incluye obras en alemán, español, francés, italiano y
latín.

Disponible en mayo de 1999, el eBook #2000 es Don Quijote (1605), en
castellano, su idioma original.

En julio de 1999, Michael escribe en una entrevista por correo
electrónico: “Ahora añado un nuevo idioma cada mes, y voy a seguir
haciéndolo todo el tiempo sea posible.”

Disponible en diciembre de 2000, el eBook #3000 es el tercer volumen de
À l’ombre des jeunes filles en fleurs (A la sombra de las muchachas en
flor, 1919) de Marcel Proust, en francés, su idioma original.

# En 2001

El Proyecto Gutenberg Australia - creado en julio de 2001 – inaugura la
producción de libros digitales en inglés y en otros idiomas, por
ejemplo algunos volúmenes en francés de À la recherche du temps perdu
(En busca del tiempo perdido, 1913-1927) de Marcel Proust. (Los últimos
volúmenes todavía están bajo copyright en los Estados Unidos, y no
están disponibles en el Proyecto Gutenberg). El Proyecto Gutenberg
Australia cuenta con 1.750 ebooks en febrero de 2009.

Disponible en octubre de 2001, el eBook #4000 es The French Immortals
Series (Obras de los Inmortales franceses), en su versión inglesa.
Publicado en 1905 por la Maison Mazarin (París), este libro reúne
varias obras cortas de ficción de escritores laureados por la Academia
de la Lengua Francesa (Académie Française), como Emile Souvestre,
Pierre Loti, Hector Malot, Charles de Bernard, Alphonse Daudet y otros.

# En 2002

Disponible en abril de 2002, el eBook #5000 es The Notebooks of
Leonardo da Vinci (Los Cuadernos de Leonardo da Vinci), en una
traducción del italiano al inglés de este texto del siglo 16. Desde su
puesta en línea, este ebook  figura con regularidad en el “Top 100” de
los libros más descargados.

# En 2003

El Doctrine Publishing Corporation Consortia Center (PGCC) - lanzado en 1997 para
reunir en un punto de acceso único colecciones de otras bibliotecas -
está afiliado oficialmente al Proyecto Gutenberg en 2003. Este sitio
ofrece más de 75.000 ebooks en varios formatos e idiomas en noviembre
de 2010.

# En 2004

A principios de 2004, 25 lenguas están representadas en el Proyecto
Gutenberg.

En febrero de 2004, Michael Hart vuela a Europa con escalas en Bruselas
(Bélgica), París (Francia) y Belgrado (Serbia). El 12 de febrero de
2004 da una conferencia en la sede de la UNESCO (Organización de las
Naciones Unidas para la Educación, la Ciencia y la Cultura) en París.
Al día siguiente, anima un debate en la Asamblea Nacional Francesa. La
semana siguiente hace un discurso ante el Parlamento Europeo en
Bruselas.

Después Michael se va a reúne con el equipo del Proyecto Rastko en
Belgrado para apoyar el lanzamiento del Proyecto Gutenberg Europa y de
Distributed Proofreaders Europa. El Proyecto Rastko es una organización
no gubernamental  con vocación cultural y educativa fundada en 1997
como parte de una red cultural regional en la Península de los
Balcanes, en el sureste de Europa.

Distributed Proofreaders Europa (DP Europa) utiliza el software y la
interfaz de Distributed Proofreaders, un sitio creado en octubre de
2000 por Charles Franks para repartir la revisión de los libros
digitales entre muchos voluntarios.

Desde sus inicios, DP Europe es un sitio plurilingüe que toma en cuenta
las mayores lenguas nacionales europeas. Traducido por traductores
voluntarios, el sitio de DP Europa está disponible en doce idiomas en
abril de 2004, con la intención de proponer la interfaz en sesenta
idiomas, es decir todos los (mayores) idiomas europeos.

En mayo de 2005, DP Europa completa la corrección de su centésimo libro
digital. Estos libros están en varios idiomas con el fin de reflejar la
diversidad lingüística que prevalece en Europa. La codificación
utilizada es el Unicode para corregir libros en  muchos idiomas. DP
Europa cuenta con 600 libros en febrero de 2009.

# En 2005

En julio de 2005, 42 lenguas están representadas en el Proyecto
Gutenberg, incluyendo el sánscrito y las lenguas mayas. Los siete
principales idiomas son el inglés (con 14.548 ebooks el 27 de julio
2005), el francés (577 ebooks), en alemán (349 ebooks), el finlandés
(218 ebooks), el holandés (130 ebooks), el español (103 ebooks) y el
chino (69 ebooks).

# En 2006

Disponible en diciembre de 2006, el eBook #20000 es Twenty Thousand
Leagues Under the Sea (Veinte mil leguas de viaje submarino, 1869), en
una versión audio en inglés.

En diciembre de 2006, 50 lenguas están representadas en el Proyecto
Gutenberg. Los diez principales idiomas son el inglés (con 17.377
ebooks el 16 de diciembre 2006), el francés (966 ebooks), el alemán
(412 ebooks), el finlandés (344 ebooks), el holandés (244 ebooks), el
español (140 ebooks), el italiano (102 ebooks), el chino (69 ebooks),
el portugués (68 ebooks) y el tagalo (51 ebooks).

# En 2007

El Proyecto Gutenberg Canadá (PGC) es creado el 1 de julio de 2007, el
día de la fiesta nacional de Canadá. Distributed Proofreaders Canadá
(DPC) inicia su producción de libros en diciembre de 2007, con 100
libros en inglés, en francés y en italiano disponibles en marzo de
2008, y 250 libros disponibles en febrero de 2009.

# En 2010

En octubre de 2010, 59 lenguas están representadas en el Proyecto
Gutenberg. Los diez principales idiomas son el inglés (con 28.441
ebooks el 7 de octubre 2010), el francés (1.659 ebooks), el alemán (709
ebooks), el finlandés (536 ebooks), el holandés (496 ebooks), el
portugués (473 ebooks), el chino (405 ebooks), el español (295 ebooks),
el italiano (250 ebooks) y el griego (101 ebooks). Estos idiomas son
seguidos por el latín, el esperanto, el sueco y el tagalo.

# En 2020, quizás

Quizás podamos beneficiar en el futuro de la traducción inmediata de
estos libros a una gran variedad de idiomas, a través de un software de
traducción automática.

En diez años, la traducción automática podría haber logrado un
porcentaje de fiabilidad del 99% - la investigación es muy activa en
este campo, y los softwares son cada vez mejores - con capacidad de
leer obras literarias en un gran número de idiomas.

Los libros traducidos por un software de traducción automática no van a
competir con el trabajo de los traductores literarios y sus esfuerzos
talentosos durante días y meses si no años. Pero van a permitir al
lector captar lo esencial de obras literarias nunca traducidas, o
traducidas sólo a unos pocos idiomas por razones comerciales.

Un libro traducido por un software de traducción podrá a continuación
ser corregido por traductores (seres humanos) mediante el uso de una
interfaz similar a la que utilizan ahora los voluntarios de Distributed
Proofreaders para la corrección de un libro digital producido por un
software de OCR (reconocimiento óptico de caracteres).

Así pues, uno empieza a soñar con Distributed Translators para
compartir la revisión de las traducciones, como un socio de Distributed
Proofreaders y del Proyecto Gutenberg.



LE PROJET GUTENBERG ET LES LANGUES [FR]


Le Projet Gutenberg propose essentiellement des livres numériques en
anglais, mais le multilinguisme est l'une de ses priorités. Le français
est la deuxième langue du projet. Soixante langues sont représentées en
décembre 2010.

# En 1990-1994

À l'origine, les livres numériques sont en anglais. Comme le Projet
Gutenberg est lancé à partir de l'Université de l'Illinois (États-
Unis), avec l'aide de volontaires anglophones, son but premier est de
procurer des livres à la communauté anglophone, à savoir 95% des
usagers de l'internet au début des années 1990. (Les usagers non
anglophones atteignent les 50% en été 2000, avec un pourcentage qui
augmente régulièrement ensuite.)

Le Projet Gutenberg inspire aussi d’autres bibliothèques numériques
ailleurs, à savoir le Projekt Runeberg pour la littérature nordique
(scandinave) en 1992 et le Projekt Gutenberg-DE pour la littérature
allemande en 1994.

Le Projekt Runeberg est la première bibliothèque numérique suédoise de
livres du domaine public, et un partenaire du Projet Gutenberg. Elle
est créée en décembre 1992 par Lysator, un club informatique
d’étudiants, en collaboration avec la bibliothèque de l'Université de
Linköping (Suède), pour produire et organiser des versions
électroniques gratuites de la littérature nordique classique. 200
oeuvres sont disponibles en 1998, avec une liste de 6.000 auteurs
nordiques en tant qu'outil de développement des collections.

Projekt Gutenberg-DE est la première bibliothèque numérique allemande
de livres du domaine public, et également un partenaire du Projet
Gutenberg. Plusieurs dizaines de textes peuvent être lus en ligne en
1998, avec une page web pour les textes courts et plusieurs pages – une
par chapitre – pour les oeuvres plus longues. Une liste alphabétique
d'auteurs et de titres est également disponible, ainsi qu'une courte
biographie et bibliographie pour chaque auteur.

# En 1997

Le français fut la deuxième langue du Projet Gutenberg, et c'est
toujours le cas en 2010.

Les premiers livres disponibles en français sont six oeuvres de
Stendhal et deux oeuvres de Jules Verne, toutes mises en ligne début
1997.

Les six oeuvres de Stendhal sont quatre récits: Les Cenci (publié en
1837), Vittoria Accoramboni (1837), La Duchesse de Palliano (1838) et
L'Abbesse de Castro (1839) – tous récits publiés dans La revue des deux
mondes - et deux romans: Le Rouge et le Noir (1830) et La Chartreuse de
Parme (1839).

Les deux romans de Jules Verne sont: De la terre à la lune (1865) et Le
tour du monde en quatre-vingts jours (1873).

À cette date, trois romans de Jules Verne sont déjà disponibles en
anglais: From the Earth to the Moon (titre original: De la terre à la
lune), disponible en  septembre 1993; Around the World in 80 Days
(titre original: Le tour du monde en quatre-vingts jours), disponible
en janvier 1994; et 20,000 Leagues Under the Seas (titre original:
Vingt mille lieues sous les mers, 1869-1870), disponible en septembre
1994.

Depuis la parution de ces premiers titres, Jules Verne a toujours fait
partie des auteurs les plus téléchargés, à la onzième place dans le
«Top 20» du Projet Gutenberg en décembre 1999 et à la sixième place
dans le «Top 100» des auteurs les plus téléchargés durant les trente
derniers jours à la date du 6 novembre 2010.

À titre anecdotique, le premier recueil d'images disponible dans le
Projet Gutenberg toutes langues confondues est French Cave Paintings
(Peintures des cavernes en France), mis en ligne dès avril 1995 (eBook
#249), avec une version XHTML ajoutée en novembre 2000. Il s’agit de
quatre photos de peintures paléolithiques retrouvées dans une grotte de
l’Ardèche, un département du sud-ouest de la France. Ces photos, sous
copyright, ont été mises à la disposition du Projet Gutenberg par Jean
Clottes, conservateur général du patrimoine, pour pouvoir être
appréciées de tous.

Disponible en 1997, l'eBook #1000 est La Divina Commedia (1321) de
Dante Alighieri, en italien, sa langue originale.

# En 1998

En octobre 1997, Michael Hart annonce son intention d'intensifier la
production de livres dans des langues autres que l'anglais. Début 1998,
le catalogue comprend quelques oeuvres en allemand, en espagnol, en
français (dix titres), en italien et en latin.

Stendhal et Jules Verne sont suivis par Edmond Rostand avec Cyrano de
Bergerac, publié en 1897 et disponible dans le Projet Gutenberg un
siècle plus tard, en  mars 1998.

# En 1999

Disponible en mai 1999, l'eBook #2000 est Don Quijote (1605) de
Cervantès, en espagnol, sa langue originale.

En juillet 1999, Michael écrit lors d'un entretien par courriel:
"J'introduis une nouvelle langue par mois maintenant, et je vais
poursuivre cette politique aussi longtemps que possible."

# En 2000

Disponible en décembre 2000, l'eBook #3000 est le volume 3 (1919) de À
l'ombre des jeunes filles en fleurs de Marcel Proust, en français, sa
langue originale.

Le Doctrine Publishing Corporation Australia est lancé en juillet 2001, et commence à
produire des livres numériques en anglais et dans d'autres langues, par
exemple certains volumes en français de À la recherche du temps perdu
(1913-1927) de Marcel Proust. (Les derniers volumes sont toujours sous
copyright aux États-Unis, raison pour laquelle ils ne sont pas
disponibles sur le site américain du Projet Gutenberg.) Les collections
du Doctrine Publishing Corporation Australia comprennent 1.750 livres numériques en
février 2009.

# En 2001

Disponible en octobre 2001, l'eBook #4000 est The French Immortals
Series  (Recueil de textes d'Immortels français, 1905), en anglais.
Cette anthologie regroupe des oeuvres de fiction courtes de plusieurs
membres de l'Académie française: Émile Souvestre, Pierre Loti, Hector
Malot, Charles de Bernard, Alphonse Daudet et d'autres.

# En 2002

Disponible en avril 2002, l'eBook #5000 est The Notebooks of Leonardo
da Vinci (Les carnets de Léonard de Vinci), un version anglaise de ces
carnets datant du 16e siècle. Ce livre est depuis régulièrement présent
dans le «Top 100» des livres téléchargés.

# En 2003

Le Doctrine Publishing Corporation Consortia Center (PGCC) – fondé en 1997 pour
regrouper des collections de livres numériques émanant d'autres sources
- est affilié au Projet Gutenberg en 2003 et devient l'un de ses sites
officiels. Il propose plus de 75.000 titres dans divers formats et en
plusieurs langues en décembre 2010.

# En 2004

Début 2004, 25 langues sont représentées dans le Projet Gutenberg.

En février 2004, Michael Hart prend l'avion vers l’Europe, avec des
étapes à Bruxelles (Belgique), Paris (France) et Belgrade (Serbie).

Le 12 février 2004, il donne une conférence au siège de l’UNESCO
(Organisation des Nations Unies pour l'éducation, la science et la
culture) à Paris. Le lendemain, toujours à Paris, il anime un débat à
l’Assemblée nationale. La semaine suivante, il s’adresse au Parlement
européen à Bruxelles. Puis il va rendre visite à l'équipe du Projet
Rastko à Belgrade pour soutenir le lancement du Projet Gutenberg Europe
et de Distributed Proofreaders Europe.

Le Projet Rastko est un projet non gouvernemental à vocation culturelle
et pédagogique fondé en 1997 et faisant partie d'un réseau culturel
régional dans la péninsule des Balkans, située au sud-est de l'Europe.

Distributed Proofreaders Europe (DP Europe) est calqué sur le site
original de Distributed Proofreaders, un site créé en octobre 2000 par
Charles Franks pour partager la correction des livres entre de nombreux
volontaires.

Dès ses débuts, DP Europe est un site plurilingue, avec prise en compte
des principales langues nationales européennes. Grâce à des traducteurs
volontaires, le site de DP Europe est disponible en douze langues dès
avril 2004. L'objectif à long terme est une interface disponible en
soixante langues, à savoir la plupart des langues européennes.

# En 2005

En mai 2005, DP Europe termine la correction de son centième livre. Ces
livres sont en plusieurs langues, en tant que reflet de la diversité
des langues en Europe. L'encodage utilisé est l'Unicode, pour pouvoir
traiter des livres dans de nombreuses langues. 600 livres sont
disponibles en février 2009.

En juillet 2005, 42 langues sont représentées dans le Projet Gutenberg,
y compris le sanscrit et les langues mayas. Les sept langues
principales sont l'anglais (avec 14.548 ebooks le 27 juillet 2005), le
français (577 ebooks),  l'allemand (349 ebooks), le finnois (218
ebooks), le néerlandais (130 ebooks),  l'espagnol (103 ebooks) et le
chinois (69 ebooks).

# En 2006

Disponible en décembre 2006, l'eBook #20000 est Twenty Thousand Leagues
Under the Sea (Vingt mille lieues sous les mers, 1869) de Jules Verne,
dans une version audio en langue anglaise.

En décembre 2006, 50 langues sont représentées dans le Projet
Gutenberg. Les dix langues principales sont l'anglais (avec 17.377
ebooks le 16 décembre 2006),  le français (966 ebooks), l'allemand (412
ebooks), le finnois (344 ebooks), le néerlandais (244 ebooks),
l'espagnol (140 ebooks), l'italien (102 ebooks), le chinois (69
ebooks), le portugais (68 ebooks) et le tagalog (51 ebooks).

# En 2007

Doctrine Publishing Corporation Canada (PGC) est lancé le 1er juillet 2007, le jour
de la fête nationale au Canada. Distributed Proofreaders Canada (DPC)
débute ses activités en décembre 2007, avec 100 livres numériques en
anglais, en français et en italien en mars 2008, et 250 livres en
février 2009.

# En 2010

En novembre 2010, 60 langues sont représentées dans le Projet
Gutenberg. Les dix langues principales sont l'anglais (avec 28.666
ebooks le 6 novembre 2010),  le français (1.672 ebooks), l'allemand
(715 ebooks), le finnois (542 ebooks), le néerlandais (498 ebooks), le
portugais (474 ebooks), le chinois (405 ebooks), l'espagnol (297
ebooks), l'italien (253 ebooks) et le grec (107 ebooks). Ces langues
sont suivies du latin, de l'espéranto, du suédois et du tagalog.

# En 2020, peut-être

Il est possible qu'on puisse bénéficier un jour de la traduction
immédiate de ces livres dans un vaste choix de langues, par le biais
d'un logiciel de traduction automatique.

Dans dix ans, la traduction automatique pourrait avoir atteint un taux
de fiabilité de l’ordre de 99% - la recherche est très active dans ce
domaine, avec des logiciels de plus en plus performants – avec
possibilité de lire des oeuvres littéraires dans un grand nombre de
langues.

Les livres traduits par le biais d'un logiciel de traduction
automatique ne rivaliseront certainement pas avec le travail des
traducteurs littéraires et leurs efforts talentueux pendant des jours
et des mois sinon des années. Mais ils permettraient au lecteur une
première approche d'oeuvres littéraires jamais traduites jusqu'ici, ou
traduites seulement dans quelques langues, pour des raisons
commerciales.

Le texte d'un livre traduit (issu d'un logiciel de traduction) pourrait
ensuite être corrigé par des traducteurs (des êtres humains, pas des
logiciels), en utilisant une interface semblable à celle utilisée
actuellement pour la correction du texte d'un livre (issu d'un logiciel
OCR) par les volontaires de Distributed Proofreaders.

On se prend ainsi à rêver à un Distributed Translators pour partager la
révision des traductions, Distributed Translators pouvant être un
organisme partenaire de Distributed Proofreaders et du Projet
Gutenberg.



DISTRIBUTED PROOFREADERS IS TEN YEARS OLD [EN]


Doctrine Publishing Corporation got its first boost with the invention of the web in
1990, and its second boost with the creation of Distributed
Proofreaders in 2000, to share the proofreading of digitized books
between many volunteers. Volunteers choose a book currently processed
through the site to proofread a given page, or several pages, as they
wish. One page per day is a great goal. It doesn't seem much, but with
hundreds of volunteers it really adds up.

# A website launched in 2000

Distributed Proofreaders (DP) was founded in October 2000 by Charles
Franks to support the digitization of public domain books. From the
website one can access a program that allows several proofreaders to be
working on the same book at the same time, each proofreading on
different pages. The goal is to all work together – from any region in
the world - to significantly speed up the proofreading process.

Originally conceived to assist Doctrine Publishing Corporation (PG), Distributed
Proofreaders is now the main source of PG ebooks. In 2002, DP became an
official PG site. In May 2006, DP became a separate legal entity and
continues to maintain a strong relationship with PG.

Distributed Proofreaders counted 3,000 ebooks "preserved for the world"
in February 2004, 5,000 ebooks in October 2004, 7,000 ebooks in May
2005, 10,000 ebooks in December 2006, 11,950 ebooks in January 2008,
and 18,848 ebooks on 15 October 2010. Production was 196 titles in
October 2010.

# How all this works

Volunteers register and receive detailed instructions. For example,
words in bold, italic or underlined, or footnotes are always treated
the same way for any ebook. A discussion forum allows them to ask
questions or seek help at any time.

Each time proofreaders go to the website, they choose the book they
want. One page of the book appears in two forms side by side: the
scanned image of one page, and the text from that image as produced by
OCR software. The proofreader can easily compare both versions, note
the differences, and fix them. OCR is usually 99% accurate, which makes
for about 10 corrections a page. The proofreader saves the page as it
is completed, and then can either stop work or do another.

The books are proofread twice, and the second time only by experienced
proofreaders.

All the pages of the book are then formatted, combined and assembled by
post-processors to make an ebook.

A project manager oversees the progress of a particular book through
its different steps on the website.

The ebook is now ready to be released in Doctrine Publishing Corporation with an
index entry (title, subtitle, author, ebook number, and character set)
for the database. Catalogers go on with the cataloguing process
(author's dates of birth and death, Library of Congress classification,
etc.) after the release.

# Everyone is welcome

New volunteers are most welcome, and will be guided by experienced
volunteers for their first steps. There is a lot to do, and everyone is
welcome.

As stated on DP's website in 2005, "Remember that there is no
commitment expected on this site. Proofread as often or as seldom as
you like, and as many or as few pages as you like. We encourage people
to do 'a page a day', but it's entirely up to you! We hope you will
join us in our mission of 'preserving the literary history of the world
in a freely available form for everyone to use'."

# Distributed Proofreaders Europe

Distributed Proofreaders Europe (DP Europe) was launched in  early 2004
by Project Rastko in Belgrade, Serbia, as well as Doctrine Publishing Corporation
Europe. DP Europe uses the software of the original Distributed
Proofreaders.

Since its beginning, DP Europe has been a multilingual website, with
its main pages translated into the main national European languages by
volunteer translators. DP Europe was available in 12 languages as early
as April 2004. The long-term goal is 60 languages representing most
European languages.

In May 2005, DP Europe finished processing its 100th ebook. Ebooks were
in several languages to reflect European linguistic diversity. 600
ebooks were ready in February 2009, and 732 ebooks on 15 October 2010.

DP Europe supports Unicode to be able to proofread ebooks in numerous
languages. Unicode is an encoding system created in 1991 that gives a
unique number for every character in any language. Unicode is meant to
replace ASCII, an encoding system dating back from 1968 that can only
handle English and Latin in its “original” version, and a few European
languages with accents in its “extended” version. In 2008, half of the
files available on the internet were Unicode files.

# Distributed Proofreaders Canada

Distributed Proofreaders Canada (DPC) started production in December
2007, to digitize and proofread ebooks for Doctrine Publishing Corporation Canada
(PGC), founded on July 1st, 2007, on Canada Day, by Michael Shepard and
David Jones. There were 100 ebooks in March 2008, in English, French
and Italian. 250 ebooks were available in February 2009, and 427 books
on October 15, 2010.

# A few numbers

= Over 33,000 high-quality proofread ebooks in Doctrine Publishing Corporation, in
several languages. (Quality more than quantity is what really matters
to the reader, believe me.)

= 18,961 ebooks processed by Distributed Proofreaders (the original
website) on November 1st, 2010, since its creation in October 2000,
with 2,352 active volunteers in October 2010.

= 739 ebooks processed by Distributed Proofreaders Europe on November
1st, 2010, since its creation on January 2004.

= 433 ebooks processed by Distributed Proofreaders Canada on November
1st, 2010, since its creation in December 2007, with 127 active
volunteers in October 2010.

# A few links

Doctrine Publishing Corporation,
with 33,000 high-quality proofread ebooks.

Distributed Proofreaders,
http://www.pgdp.net/c/
launched in October 2000.

Distributed Proofreaders Europe,
http://dp.rastko.net/
launched in early 2004, with a plurilingual interface, and books to
proofread in several languages.

Distributed Proofreaders Canada,
http://www.pgdpcanada.net/c/default.php
launched in December 2007.

Volunteers are most welcome on the three websites – with no geographic
requirements - because there are no borders for beautiful literary
works to be “preserved for the world”.



DISTRIBUTED PROOFREADERS TIENE 10 AÑOS [ES]


El Proyecto Gutenberg cobra nuevo aliento y alcanza una difusión
internacional con la aparición de la web en 1990, y luego con la
creación de Distributed Proofreaders (Correctores Distribuidos) en
2000, cuya meta es compartir la revisión de los libros entre centenares
de voluntarios. Los voluntarios eligen un libro digital que se está
procesando en el sitio para releer y corregir determinada página, o
algunas páginas, como quieran. A título indicativo, se aconseja
corregir una página al día. Representa poco tiempo en un día, pero
mucho para el proyecto. Una página multiplicada por cientos de
voluntarios representa un volumen considerable.

# Un sitio lanzado en 2000

Distributed Proofreaders es concebido en octubre de 2000 por Charles
Franks para  contribuir a la digitalización de los libros del dominio
público. La interfaz del sitio web da acceso a un software que permite
a varios voluntarios trabajar simultáneamente en el mismo libro, cada
uno corrigiendo diferentes páginas. El objetivo es que todos trabajen
juntos - desde cualquier lugar del mundo - para acelerar
significativamente el proceso de revisión de los libros.

Originalmente destinado a ayudar el Proyecto Gutenberg en su tarea,
Distributed Proofreaders se convierte rápidamente en la principal
fuente de sus ebooks. Después de afiliarse con el Proyecto Gutenberg en
2002, Distributed Proofreaders se convierte en una entidad
independiente en mayo de 2006, aunque manteniendo una estrecha relación
con éste.

Distributed Proofreaders contabiliza 3.000 libros digitalizados y
corregidos en febrero de 2004, 5.000 libros en octubre de 2004, 7.000
libros en mayo de 2005, 10.000 libros en diciembre de 2006, 11.950
libros en enero de 2008 y 19.059 libros el 16 de noviembre de 2010. La
producción es de 196 ebooks en octubre de 2010.

# La organización práctica del procesamiento

El nuevo voluntario empieza por registrarse. Recibe instrucciones
detalladas, por ejemplo cómo tratar las partes en negrita, en cursiva o
subrayadas, o las notas, que se tratan todas de la misma manera. Un
foro permite formular preguntas y pedir ayuda en cualquier momento.

Cuando el voluntario inicia una sesión en el sitio, elige un libro a
partir de  una lista dada. Una página del libro elegido aparece en dos
versiones: por una parte la imagen digitalizada de la página, por otra
el texto resultante de esta imagen, producido por un software de OCR
(reconocimiento óptico de caracteres). El voluntario compara las dos
versiones y corrige las diferencias. Un software de OCR tiene una
precisión del 99%, lo que representa un promedio de diez errores a
corregir por página. Luego el voluntario salva la página y puede cesar
su relectura o bien optar por la corrección de otra página.

Todos los libros son revisados dos veces, y la segunda vez sólo por
correctores experimentados.

Otros voluntarios llamados “post-procesadores” (“post-processors” en
inglés) formatean y montan las páginas corregidas, de acuerdo con
normas precisas, para obtener un ebook.

Durante todo el proceso, un jefe de proyecto (llamado “project manager”
en inglés) sigue el tratamiento de un libro dado para garantizar el
buen funcionamiento del proceso.

A continuación se pone en línea el ebook en el Proyecto Gutenberg
después de su indexación (título, subtítulo, autor, número del ebook y
formato de codificación) por voluntarios indizadores. Catalogadores
voluntarios se encargan  luego de la catalogación de este libro (fechas
de nacimiento y  muerte del autor, clasificación de la Biblioteca del
Congreso, etc.).

# Calquier participación es bienvenida

Los nuevos voluntarios son bienvenidos, en cualquier país y para
cualquier idioma, y serán guiados por voluntarios experimentados para
sus primeros pasos como revisores. La tarea es inmensa, y cualquier
ayuda es muy apreciada.

Como se indica en el sitio web en 2005, "DP no espera su compromiso
incondicional. Usted puede revisar textos todas las veces que quiera, y
el número de páginas que desee. Alentamos a la gente a corregir una
página por día, pero usted está totalmente libre de hacer lo que le
gusta. Esperamos que usted se una a nuestra misión de 'preservar la
literatura mundial en una versión gratuita y disponible para todos'."

# Distributed Proofreaders Europa

Distributed Proofreaders Europa (DP Europa) – copiado a partir del
sitio y del software original de Distributed Proofreaders – se lanza en
enero de 2004 para gestionar la revisión de los libros del Proyecto
Gutenberg Europa, a iniciativa del Proyecto Rastko, basado en Belgrado
(Serbia).

Desde sus inicios, DP Europa es un sitio web multilingüe, traducido por
voluntarios a los grandes idiomas nacionales europeos, y disponible en
doce idiomas en abril de 2004. El objetivo a largo plazo es una
interfaz en sesenta idiomas para tener en cuenta todas las (mayores)
lenguas europeas.

Los cien primeros libros están disponibles en abril de 2005. Estos
libros están en varios idiomas – de los cuales el español - con el fin
de reflejar la diversidad lingüística que prevalece en Europa. DP
Europa contabiliza 600 libros en febrero de 2009, y 741 libros el 16 de
noviembre de 2010.

DP Europa utiliza el Unicode para poder procesar libros en varios
idiomas. Unicode es un sistema de codificación creado en 1991, que
asigna un código único para cada carácter de todos los idiomas del
planeta. Se sustituye poco a poco al ASCII, un sistema de codificación
que data de 1968 y que sólo puede procesar el inglés y el latín en su
versión “original”, y algunos idiomas europeos con acentos en su
versión “extendida”. En 2008, 50% de los archivos disponibles en el
internet están codificados en Unicode.

# Distributed Proofreaders Canada

Distributed Proofreaders Canadá (PGC) se lanza en diciembre de 2007
para la producción de los ebooks del Proyecto Gutenberg Canadá (PGC),
creado el 1 de julio de 2007, día de la fiesta nacional, a instigación
de Michael Shepard y David Jones. Los cien primeros libros están
disponibles en marzo de 2008, con libros en inglés, en francés y en
italiano. 250 libros están disponibles en febrero de 2009, y 441 libros
el 16 de noviembre de 2010.

# Algunas cifras

= Más de 33.000 ebooks en el Proyecto Gutenberg, todos revisados dos
veces, y en varios idiomas. El objetivo es más la calidad que la
cantidad.

= 19.059 ebooks procesados por Distributed Proofreaders (el sitio
original, basado en los Estados Unidos) el 16 de noviembre de 2010,
desde su lanzamiento en octubre de 2000, y 2.352 voluntarios activos
durante el mes de octubre de 2010.

= 741 ebooks procesados por Distributed Proofreaders Europa el 16 de
noviembre de 2010, desde su lanzamiento en enero de 2004.

= 441 ebooks procesados por Distributed Proofreaders Canadá el 16 de
noviembre de 2010, desde su lanzamiento en diciembre de 2007, con 127
voluntarios activos durante el mes de octubre de 2010.

# Algunos enlaces

El Proyecto Gutenberg,

Distributed Proofreaders,
http://www.pgdp.net/c/
que tiene 10 años.

Distributed Proofreaders Europa,
http://dp.rastko.net/
el proyecto europeo lanzado en enero de 2004, con una interfaz en
varios idiomas, incluso en español.

Distributed Proofreaders Canada,
http://www.pgdpcanada.net/c/default.php
lanzado en diciembre de 2007.

Los voluntarios de todos los países son bienvenidos en los tres sitios
- sin preferencia geográfica o lingüística – porque la buena literatura
no tiene fronteras.



DISTRIBUTED PROOFREADERS A DIX ANS [FR]


Le Projet Gutenberg trouve un second souffle et un rayonnement
international avec l’apparition du web en 1990 puis la création de
Distributed Proofreaders en 2000, pour partager la relecture des livres
entre des centaines de volontaires. Les volontaires choisissent un
livre en cours de traitement pour relire et corriger une page donnée,
ou bien plusieurs. A titre indicatif, il est conseillé de relire une
page par jour. C’est peu de temps sur une journée, et c’est beaucoup
pour le projet. Une page multipliée par des centaines de volontaires
représente un chiffre considérable.

# Un site lancé en 2000

Distributed Proofreaders est conçu en octobre 2000 par Charles Franks
pour contribuer à la numérisation des livres du domaine public. À
partir du site web, on accède à un logiciel permettant à plusieurs
correcteurs de travailler simultanément au même livre, chacun
travaillant sur des pages différentes, le but étant bien sûr de
travailler ensemble – de n'importe quelle région du monde - pour
accélérer de manière sensible le processus de révision des livres.

Censé à l'origine aider le Projet Gutenberg dans sa tâche, Distributed
Proofreaders devient rapidement la principale source des livres du
Projet Gutenberg. Après avoir été affilié au Projet Gutenberg en 2002,
il devient une entité indépendante en mai 2006, tout en conservant des
liens étroits avec le Projet Gutenberg.

Distributed Proofreaders comptabilise 3.000 livres numérisés et
corrigés en février 2004, 5.000 livres en octobre 2004, 7.000 livres en
mai 2005, 10.000 livres en décembre 2006, 11.950 livres en janvier 2008
et 18.848 livres le 15 octobre 2010. La production était de 196 livres
en octobre 2010.

# Comment cela se passe, pratiquement

Le volontaire relecteur commence par s’inscrire. Il reçoit des
directives détaillées. Ces directives concernent par exemple les
parties en gras, en italique et soulignées, ou les notes, qui sont
toutes traitées de la même manière. Un forum permet de poser des
questions et de demander de l’aide à tout moment.

Quand le relecteur se connecte au site, il sélectionne le livre de son
choix à partir d'une liste donnée. Une page du livre choisi apparaît
simultanément dans deux versions: d’une part l’image scannée, d’autre
part le texte issu de cette image, produit par un logiciel OCR. Le
relecteur compare les deux versions et corrige les différences. Un
logiciel OCR étant fiable à 99%, cela représente une moyenne de dix
erreurs à corriger par page. Le relecteur sauvegarde ensuite la page,
et peut ensuite soit cesser le travail, soit opter pour la correction
d'une autre page.

Tous les livres sont relus et corrigés deux fois de suite et, la
deuxième fois, uniquement par des correcteurs expérimentés.

Les pages corrigées sont ensuite formatées et assemblées selon des
règles précises par d'autres volontaires (appelés «post-processors»)
pour obtenir un ebook.

Durant la totalité du processus, le traitement d'un livre donné est
suivi par un responsable (appelé «project manager»), qui s'assure du
bon déroulement des opérations.

Après la mise en forme suit la mise en ligne sur le Projet Gutenberg,
avec indexation du livre (titre, sous-titre, auteur, numéro de l'ebook
et format d'encodage) par d'autres volontaires puis catalogage
complémentaire (dates de naissance et mort de l'auteur, classification
de la Library of Congress, etc.) ensuite.

# Toute participation est bienvenue

De nouveaux volontaires sont bienvenus, dans tout pays et pour toute
langue, y compris pour les livres en français, et seront guidés par des
volontaires expérimentés pour leurs premiers pas en tant que réviseurs.
La tâche est immense, et toute aide est très appréciée.

Comme indiqué sur le site en 2005, «DP ne s'attend pas à un engagement
inconditionnel de votre part. Corrigez des textes aussi souvent que
vous le voulez, et le nombre de pages que vous voulez. Nous
encourageons les gens à corriger une page par jour, mais vous êtes tout
à fait libre de faire ce qui vous plaît. Nous espérons que vous vous
joindrez à notre mission de “préserver la littérature mondiale dans une
version gratuite et disponible pour tous”.»

# Distributed Proofreaders Europe

Distributed Proofreaders Europe (DP Europe) – calqué sur le site
original de Distributed Proofreaders, dont il utilise le logiciel – est
lancé en janvier 2004 pour gérer la relecture partagée du Projet
Gutenberg Europe, sous l'égide du Projet Rastko à Belgrade (Serbie).

Dès ses débuts, DP Europe est un site multilingue. Ses pages
principales sont traduites dans les grandes langues nationales
européennes par des traducteurs volontaires. Le site de DP Europe est
disponible en douze langues dès le mois d'avril 2004. L'objectif à long
terme est soixante langues, avec prise en compte de la plupart des
langues européennes.

Cent livres numérisés et corrigés sont disponibles en mai 2005. Les
livres sont en plusieurs langues pour refléter la diversité
linguistique prévalant en Europe. 600 livres sont prêts en février 2009
et 732 livres le 15 octobre 2010.

DP Europe utilise l'Unicode pour pouvoir traiter des livres dans un
grand nombre de langues. L'Unicode, créé en 1991, est un système
d’encodage qui attribue un code unique à chaque caractère pour toutes
les langues de la planète, et qui remplace peu à peu l'ASCII, un
système d'encodage datant de 1968 et qui ne peut traiter que l'anglais
et le latin dans sa version «originale», et quelques langues
européennes avec accents dans sa version «étendue». En 2008, la moitié
des fichiers disponibles sur l'internet sont encodés en Unicode.

# Distributed Proofreaders Canada

Distributed Proofreaders Canada (DPC) débute ses activités en décembre
2007 pour la production des livres du Projet Gutenberg Canada (PGC),
qui voit lui-même le jour quelques mois auparavant, le 1er juillet
2007, le jour de la fête nationale, sous l'égide de Michael Shepard et
David Jones. Les cent premiers livres sont disponibles en mars 2008,
avec des livres en anglais, en français et en italien. 250 livres sont
disponibles en février 2009 et 427 livres le 15 octobre 2010.

# Quelques chiffres

= Plus de 33.000 ebooks pour le Projet Gutenberg, tous relus et
corrigés deux fois, et dans plusieurs langues, le but étant plus la
qualité que la quantité.

= 18.961 ebooks traités par Distributed Proofreaders (le site original,
basé aux États-Unis) le 1er novembre 2010, depuis son lancement en
octobre 2000, et 2.352 volontaires actifs pendant le mois d'octobre
2010.

= 739 ebooks traités par Distributed Proofreaders Europe le 1er
novembre 2010, depuis son lancement en janvier 2004.

= 433 ebooks traités par Distributed Proofreaders Canada le 1er
novembre 2010, depuis son lancement en décembre 2007, avec 127
volontaires actifs pendant le mois d'octobre 2010.

# Quelques liens

Le Projet Gutenberg,

Distributed Proofreaders,
http://www.pgdp.net/c/
lancé en octobre 2000.

Distributed Proofreaders Europe,
http://dp.rastko.net/
l'antenne européenne lancée début 2004, avec une interface en plusieurs
langues, dont le français.

Distributed Proofreaders Canada,
http://www.pgdpcanada.net/c/default.php
lancé en décembre 2007.

Les volontaires de tous pays sont en fait bienvenus sur les trois sites
– sans préférence géographique ni linguistique - la belle littérature
n'ayant pas de frontières.



ACKNOWLEDGEMENTS / AGRADECIMIENTOS / REMERCIEMENTS


Many thanks to / Muchas gracias a / Merci à:

Anna Álvarez
Mike Cook
Al Haines
Michael Hart
Greg Newby
Russon Wooldridge

for their kind help / para su ayuda / pour leur aide.


Copyright © 2010 Marie Lebert





*** End of this Doctrine Publishing Corporation Digital Book "40 years / 40 años / 40 ans" ***

Doctrine Publishing Corporation provides digitized public domain materials.
Public domain books belong to the public and we are merely their custodians.
This effort is time consuming and expensive, so in order to keep providing
this resource, we have taken steps to prevent abuse by commercial parties,
including placing technical restrictions on automated querying.

We also ask that you:

+ Make non-commercial use of the files We designed Doctrine Publishing
Corporation's ISYS search for use by individuals, and we request that you
use these files for personal, non-commercial purposes.

+ Refrain from automated querying Do not send automated queries of any sort
to Doctrine Publishing's system: If you are conducting research on machine
translation, optical character recognition or other areas where access to a
large amount of text is helpful, please contact us. We encourage the use of
public domain materials for these purposes and may be able to help.

+ Keep it legal -  Whatever your use, remember that you are responsible for
ensuring that what you are doing is legal. Do not assume that just because
we believe a book is in the public domain for users in the United States,
that the work is also in the public domain for users in other countries.
Whether a book is still in copyright varies from country to country, and we
can't offer guidance on whether any specific use of any specific book is
allowed. Please do not assume that a book's appearance in Doctrine Publishing
ISYS search  means it can be used in any manner anywhere in the world.
Copyright infringement liability can be quite severe.

About ISYS® Search Software
Established in 1988, ISYS Search Software is a global supplier of enterprise
search solutions for business and government.  The company's award-winning
software suite offers a broad range of search, navigation and discovery
solutions for desktop search, intranet search, SharePoint search and embedded
search applications.  ISYS has been deployed by thousands of organizations
operating in a variety of industries, including government, legal, law
enforcement, financial services, healthcare and recruitment.



Home