Gutenberg项目

Gutenberg项目
已确立的1971年12月
(发布的第一个文件)
收藏
尺寸超过70,000个文件
其他信息
网站gutenberg.org

Gutenberg项目PG )是一项自愿进行数字化和存档文化作品的努力,并“鼓励创建和分发电子书”。它是由美国作家迈克尔·哈特(Michael S. Hart)于1971年创立的,是最古老的数字图书馆。其集合中的大多数项目都是公共领域书籍或单个故事的全文。可以在几乎所有计算机上都可以免费访问所有文件,以免费访问。截至2015年10月3日,Gutenberg项目在其免费电子书中达到了50,000件商品。

这些发行版以纯文本以及其他格式(例如HTMLPDFEPUBMOBIPLUCKER )提供。大多数版本都使用英语,但也可以提供许多非英语作品。有多个附属项目提供其他内容,包括区域和语言特定的作品。 Gutenberg Project与分布式校对器密切相关,这是一个基于Internet的社区,用于校对扫描文本。

Gutenberg项目以发明家Johannes Gutenberg的名字命名,他在开发印刷技术方面的作品导致书籍和其他文本的大量可用性增加。

历史

Gutenberg项目Michael S. Hart (左)和Gregory Newby (右)

迈克尔·哈特(Michael S.伊利诺伊大学的学生哈特(Hart)在大学材料研究实验室中获得了施乐Sigma V Mainframe计算机的访问权。通过友好的运营商,他收到了一个几乎无限的计算机时间的帐户;此后,其价值估计为100,000美元或100,000,000美元。哈特(Hart)解释说,他想通过做一些可以认为具有巨大价值的事情来“回馈”这份礼物。他的最初目标是在20世纪末,将10,000本最多的书籍可供公众提供给公众。

1971年7月4日,在受到美国独立宣言的免费印刷副本的启发之后,他决定将文本键入计算机,并将其传输给计算机网络上的其他用户。

- Gregory B. Newby

这台特殊的计算机是Arpanet上的15个节点之一,ARPANET是将成为Internet的计算机网络。哈特认为,有一天,公众可以访问计算机,并决定免费以电子形式提供文学作品。他在背包中使用了《美国独立宣言》的副本,这成为古腾堡电子文本的第一个项目。他为约翰内斯·古滕伯格(Johannes Gutenberg)命名了该项目,这是十五世纪的德国打印机,他推动了可移动的印刷出版社革命。

到1990年代中期,哈特(Hart)从伊利诺伊州本笃会学院(Benedictine College)运营了古腾堡(Gutenberg)项目。越来越多的志愿者加入了这一努力。直到1989年,他手动输入了所有文本,当时图像扫描仪光学角色识别软件得到了改善并变得更加可用,从而使书籍扫描更加可行。哈特后来与卡内基·梅隆大学(Carnegie Mellon University)安排了一项安排,该大学同意管理古腾堡计划的财务状况。随着电子文本量的增加,志愿者开始接管Hart运行的项目的日常运营。

意大利志愿者Pietro Di Miceli开发并管理了第一个项目Gutenberg网站,并开始开发该项目在线目录。该项目网页在担任这个角色的十年(1994 - 2004年)中获得了许多奖项,经常出现在“ Best of Web”列表中,这有助于该项目的受欢迎程度。

从2004年开始,改进的在线目录使项目Gutenberg内容更容易浏览,访问和超链接。 Gutenberg项目现在由伊比布里奥(Ibiblio)北卡罗来纳大学教堂山(Chapel Hill)的分校主持。

哈特(Hart)于2011年9月6日在他在伊利诺伊州乌尔巴纳(Urbana)的家中去世,享年64岁。

CD和DVD项目

2003年8月,Gutenberg项目创建了一张CD ,其中包含该系列中约600本“最佳”电子书。 CD可作为ISO映像下载。当用户无法下载CD时,他们可以免费要求将副本发送给他们。

2003年12月,创建了一个DVD ,其中包含近10,000件项目。当时,这几乎代表了整个集合。在2004年初,DVD也通过邮件提供。

2007年7月,新版本的DVD发行了包含17,000多本书,并于2010年4月发布了双层DVD,其中包含近30,000个项目。

志愿者在可记录的媒体上记录了大多数DVD以及该项目邮寄的所有CD。但是,新的双层DVD是制造的,因为事实证明,它比让志愿者燃烧它们更经济。截至2010年10月,该项目已邮寄约40,000张光盘。截至2017年,尽管ISO映像仍然可供下载,但已停止免费CD的交付。

收集范围

从1994年到2015年的Gutenberg项目的增长

截至2015年8月,Gutenberg项目在其收藏中宣称超过70,000件商品,每周平均添加50多本新的电子书。这些主要是西方文化传统文学作品。除了小说,诗歌,短篇小说和戏剧之类的文学外,古腾堡项目还提供食谱参考作品和期刊问题。该项目Gutenberg Collection还拥有一些非文本项目,例如音频文件和音乐通用文件。

大多数发行版都是英语,但在许多其他语言中也有很大的数量。截至2016年4月,最多的非英语语言是:法语,德语,芬兰,荷兰语,意大利语和葡萄牙语。

只要有可能,Gutenberg发行版就可以用纯文本获得,主要是使用编码US-ASCII字符,但经常扩展到ISO-8859-1 (例如,在法语中代表强调字符,例如,用德语表示Scharfes s ) 。除了没有版权之外,自从Gutenberg项目成立以来,该发行版的拉丁文字符集)文本版本的要求一直是迈克尔·哈特(Michael Hart)的标准,因为他认为这是在扩展未来最有可能可读的格式。出于必要,必须进一步扩展此标准,以供东亚语言中的大量文本(如中文和日语)收集到现在的收藏中,而使用UTF-8

当志愿者提交时,其他格式也可以发布。最常见的非ASCII格式是HTML ,它允许包括标记和插图。一些项目成员和用户要求更先进的格式,认为它们更容易阅读。但是一些不容易编辑的格式(例如PDF )通常不符合Gutenberg项目的目标。同样,Gutenberg Project也有两个可以提交的主格式的选项(从中生成所有其他文件):文本编码计划标准的自定义版本(自2005年以来)和重组文本(自2011年以来)。

从2009年开始,Gutenberg目录开始提供自动生成的替代文件格式,包括HTML(尚未提供), EpubPlucker

理想

迈克尔·哈特(Michael Hart)在2004年说:“古腾堡(Gutenberg)项目的使命很简单:'鼓励创建和分发电子书' ”。他的目标是“以尽可能多的格式提供尽可能多的电子书,以使全世界阅读尽可能多的语言”。同样,一个项目的口号是“打破无知和文盲的标准”,因为它的志愿者的目标是继续在19世纪后期公共图书馆开始进行公共扫盲和对文学遗产的赞赏。

古腾堡项目有意分散;没有选择策略决定要添加哪些文本。相反,个别志愿者正在研究他们感兴趣或有可用的东西。 Gutenberg项目旨在长期保留物品,因此任何一个本地事故都不会丢失它们。为了确保这一点,整个集合会定期备份,并在许多不同位置的服务器上镜像

版权

Gutenberg项目谨慎地根据美国版权法验证其电子书的状态。仅在获得版权许可后,材料才会添加到Gutenberg档案项目中,并保存这些许可的记录以供将来参考。 Gutenberg Project并未要求其发布的标题新版权。相反,它鼓励他们免费的繁殖和分发。

根据美国版权法,该项目Gutenberg藏品中的大多数书籍都是作为公共领域分发的。还有一些受版权保护的文本,例如科幻作家Cory Doctorow的文本,Gutenberg已获得许可。这些受版权持有人规定的进一步限制受到进一步的限制,尽管它们通常倾向于在创意共享下获得许可。

“ Gutenberg Project”是该组织的商标,该商标不能用于该项目的公共领域文本的商业或修改后的重新分配。如果删除了对古腾堡计划的所有提及,则没有法律障碍在公共领域中销售作品,但是古腾堡的贡献者质疑了志愿者正格式化的直接和商业重复使用内容的适当性。已经有一些书籍被剥夺了该项目的归因,并在Kindle商店和其他书商中出售了盈利,其中一本是1906年的书籍狐狸捕获

由于S. Fischer Verlag的法院命令,该网站德国境内无法访问。尽管他们在美国的公共领域,但德国法院(法兰克福和主要地区法院)承认侵犯了仍在德国活动的版权,并断言Gutenberg项目的网站属于德国管辖权,因为它托管了德国的内容语言,在德国可以访问。法兰克福上诉法院于2019年4月30日确认了这一判决(11 U 27/18)。法兰克福上诉法院尚未允许向联邦法院(Bundesgerichtshof)进一步上诉,但是,已向联邦法院提出了允许上诉许可的申请。截至2020年10月4日,该申请仍在审理中(联邦法院I ZR 97/19)。根据Gutenberg文学档案基金会的说法,“ 2021年10月,当事方达成了和解协议。根据协议的条款,这三位作者的Gutenberg项目将从德国被封锁,直到其德国版权到期。解决方案,全民公司不再存在。解决方案的其他条款是机密的。”

自2020年5月以来,该网站在意大利被封锁。

批评

文本文件使用UTF-8中编码的纯文本的格式,通常包裹在65-70个字符中,段落被双层折叠隔开。近几十年来,由此产生的外观和缺乏标记的可能性通常被认为是平淡无奇的,是这种格式的缺点。 Gutenberg项目试图通过在HTML,EPUB和PDF版本中提供许多文本来解决这个问题。较旧文本的HTML版本是自动化版本。另一个非营利性项目标准电子书旨在通过其格式化和风格的公共领域标题收集来解决这些问题。它纠正了与设计和版式有关的问题。

1994年12月,古腾堡(Project Gutenberg)受到文本编码计划的批评,因为他们未能在准备文本时不可避免地包括文档或讨论这些决定,或者在某些情况下,没有记录文本的几个(相互冲突)文本中的哪一个是一个数字化。

可用的作品(和版本)的选择取决于受欢迎程度,易于扫描,版权和其他因素。在任何众包项目中,这都是很难避免的。

2004年3月,迈克尔·哈特(Michael Hart)和约翰·S·Guagliardo(John S. Guagliardo)启动了一项倡议,以提供低成本的知识产权。该项目的初始名称是Gutenberg 2(PG II)项目,该项目在PG志愿者中引起了争议,因为该项目的商业企业已重新使用了该项目的商标名称。

Gutenberg文学档案基金会项目

2000年,一家非营利性公司,Gutenberg文学档案基金会项目。501(c)(3) EIN :64-6221541在美国密西西比州被租用,以满足该项目的法律需求。向其捐款是可以税收扣除的

格雷戈里·B·纽比(Gregory B. Newby)于2001年成为UNC信息与图书馆科学学院的助理教授,以及长期的Gutenberg志愿者项目,成为基金会的第一位首席执行官,后来是后来的北极地区超级计算中心主任,后来校正加拿大首席技术官。

伙伴

  • Gutenberg Project Consortia Center专门从事藏品集合。这些没有编辑的监督或主要项目Gutenberg的一致格式。主题收藏以及众多语言。这是由WorldLibrary.net赞助的,该net主持了一个自出版门户网站self.gutenberg.org
  • Ibiblio ,位于北卡罗来纳大学教堂山分校,现在主持Gutenberg项目
  • 分布式校对器:2000年,查尔斯·弗兰克斯(Charles Franks)创立了分布式校对器(DP),允许校对扫描文本的校对,可以通过互联网通过互联网分发。这项工作增加了添加到Gutenberg项目的文本的数量和种类,并使新志愿者更容易开始贡献。 DP于2002年正式隶属于Gutenberg项目。截至2018年,36,000多本DP限制的书籍构成了Gutenberg Project近70,000本书中的近三分之二。

姊妹项目

所有姊妹项目都是独立的组织,具有相同的理想,并已获得使用Gutenberg商标项目的许可。他们通常具有特定的民族或语言重点。

姊妹项目清单

  • 根据澳大利亚版权法,澳大利亚古腾堡项目托管了许多是公共领域的文本,但仍在美国的版权(或不确定地位)属于公共领域,重点是澳大利亚作家和有关澳大利亚的书籍。
  • 加拿大古腾堡项目。加拿大公共领域文本的数字图书馆。
  • Projekt Gutenberg-de声称其产品具有版权,并限制了对其文本的可浏览网络访问的访问。
  • Gutenberg Project Europe由Rastko Project in Serbia运营。它的目的是成为整个欧洲的Gutenberg项目,并于2005年开始发布项目。它使用分布式校对软件快速生产Etexts。
  • Gutenberg Luxembourg项目主要出版但不仅仅是用卢森堡写的书。
  • 由芬兰项目Gutenberg志愿者创立的ProjektiLönnrot,其名称来自芬兰语言学家EliasLönnrot (1802-1884)
  • 菲律宾的Gutenberg项目旨在“使尽可能多的人为菲律宾和菲律宾语言特别关注尽可能多的书籍”。
  • 俄罗斯古腾堡计划(Rutenberg)旨在用斯拉夫语言收集公共领域书籍,尤其是在俄罗斯语中。该项目及其法律方面的讨论始于2012年4月。鲁滕伯格一词是“俄罗斯”和“古腾堡”一词的组合。
  • Gutenberg Project Gutenberg Promist Propsal Project Gutenberg Consortia中心被称为Gutenberg Project Promist Propers Press ,与Gutenberg Project本身不同,Gutenberg Project Gutenberg Project允许提交以前从未发表过的文本,包括自我出版的电子书。于2012年推出,还拥有“ gutenberg.us”域。
  • 台湾Gutenberg项目旨在归档版权书籍免费书籍,特别关注台湾的英语,普通话和台湾语言。这是forumosa.com的特殊项目
  • Projekt Runeberg ,北欧文学
  • ReadingRoo.ms ,该项目Gutenberg预印本的故乡
  • David Jones和Michael Shepard于2007年12月启动的分发校对校对加拿大一个独立的实体。
  • 褪色的页面分布式校对加拿大公共领域书籍档案

会员

也可以看看