Google书籍

Google书籍
萤幕截图
站点类型
数字图书馆
所有者 Google
URL 书.google .com
发射 2004年10月(作为Google Print)
当前状态 积极的

Google图书(以前称为Google Book SearchGoogle Print及其代码名称Project Ocean )是Google的一项服务,可搜索Google已扫描的书籍和杂志的全文,并使用光学角色识别转换为文本(OCR) ) ,并存储在其数字数据库中。出版商和作者通过Google Books合作伙伴计划或Google图书馆合作伙伴通过图书馆项目提供书籍。此外,Google还与许多杂志出版商合作,以数字化其档案。

2004年10月,在法兰克福图书博览会上引入了发行者计划,首先被称为Google Print。扫描在图书馆合作伙伴的集合中工作并将其添加到数字库存中,该项目于2004年12月宣布。 。

Google Books Initiative因其潜力提供了前所未有的访问权的潜力而受到赞誉,可以成为最大的在线知识体系并促进知识的民主化。但是,它也因潜在的侵犯版权行为而受到批评,并且缺乏编辑来纠正OCR过程中扫描文本中引入的许多错误。

截至2019年10月,Google庆祝了15年的Google书籍,并提供了超过4000万本书的扫描书籍。 Google估计2010年,世界上大约有1.3亿个不同的头衔,并表示旨在扫描所有头衔。但是,自2000年代以来,美国学术图书馆的扫描过程已放缓。 Google Book的扫描工作一直受到诉讼,其中包括Augildv。Google (美国的集体诉讼),以Google受到帮助(请参阅下文)。这是一个几乎改变美国孤儿作品的版权实践的主要案例。加利福尼亚大学,伯克利大学和东北大学的商学院的学者进行了一项2023年的研究发现,Google Books的书籍数字化导致书籍的实物版本的销售增加。

细节

Google书籍的结果都显示在通用Google搜索和专用的Google Books搜索网站( books.google.com )中。

为了响应搜索查询,Google书籍允许用户从书籍中查看搜索词出现的书籍完整页面,如果本书不含版权或版权所有所有者已获得许可。如果Google认为这本书仍处于版权的范围内,则用户可以看到围绕查询搜索词的“文字”。书本中搜索词的所有实例都带有黄色的亮点。

Google书籍上使用的四个访问级别是:

  • 全视图公共领域中的书籍可用于“全视图”,可以免费下载。如果出版商已获得许可,则通过合作伙伴计划获得的印刷书籍也可以进行全视图,尽管这很少见。
  • 预览:对于已授予许可的印刷书籍,可见页面的数量仅限于通过各种访问限制和安全措施设置的“预览”,其中一些基于用户跟踪。通常,发布者可以设置可预览的书的百分比。用户仅限于复制,下载或打印图书预览。页面底部出现了水印“受版权保护的材料”。通过合作伙伴计划获得的所有书籍都可以预览。
  • 摘要视图:“摘要视图” - 在查询搜索术语周围的两到三行文本 - 在Google未经版权所有者许可显示预览的情况下显示。这可能是因为Google无法识别所有者或所有者拒绝许可。如果书中多次出现搜索词,则Google显示不超过三个片段,从而阻止用户查看本书过多。另外,Google不会为某些参考书(例如词典)显示任何片段,即使摘要的显示可能会损害工作的市场。 Google坚持认为,根据版权法不需要许可即可显示摘要视图。
  • 无预览:Google还显示尚未数字化的书籍的搜索结果。由于尚未扫描这些书籍,因此无法搜索它们的文字,只有元数据,例如标题,作者,出版商,页面,ISBN,主题和版权信息,在某些情况下,目录和书籍摘要是可用的。实际上,这类似于在线图书馆卡目录。

为了回应美国出版商协会作者协会等团体的批评,Google宣布了2005年8月的退出政策,版权所有所有者可以提供他们不希望扫描的标题清单,并且该请求将会提供。受到尊重。该公司还表示,在2005年8月至11月1日之间,它不会扫描任何令人震惊的书籍,以便为业主提供决定将哪些书籍排除在项目之外的机会。因此,版权所有者在任何工作方面都有三种选择:

  1. 它可以参与合作伙伴计划,以使一本书可供预览或完整视图,在这种情况下,它将共享根据响应用户查询的作品显示页面的收入。
  2. 它可以让Google在图书馆项目下扫描该书,并根据用户查询显示摘要。
  3. 它可以选择退出图书馆项目,在这种情况下,Google不会扫描这本书。如果已经扫描了这本书,则Google将其访问级别重置为“无预览”。

大多数扫描的作品不再印刷或商业上可用。

除了从图书馆购买书籍外,Google还通过“合作伙伴计划”从其出版商合作伙伴那里获得书籍,旨在帮助出版商和作者推广他们的书籍。出版商和作者要幺以EpubPDF格式提交其书籍的数字副本,要幺向Google提交打印副本,该副本可在Google Books上提供预览。发行商可以控制可预览的书的百分比,最低为20%。他们还可以选择使本书完全可查看,甚至允许用户下载PDF副本。书籍也可以在Google Play上出售。与图书馆项目不同,这不会引起任何版权问题,因为它是根据与出版商的协议进行的。出版商可以随时选择从协议中撤回。

对于许多书籍,Google书籍显示原始页码。但是,蒂姆·帕克斯(Tim Parks)在2014年的《纽约书籍评论》中写道,Google已停止为许多最近出版物提供页码(可能是通过合作伙伴计划获得的内容)“大概是与出版商结盟,以强迫我们这些需要准备脚注才能购买纸质版本的人。”

扫描书籍

该项目始于2002年的代号海洋。 Google联合创始人Larry Page一直对数字化书籍感兴趣。当他和玛丽莎·梅耶(Marissa Mayer)于2002年开始尝试书籍扫描时,他们花了40分钟才能将一本300页的书数字化。但是,在开发该技术之后不久,扫描运营商每小时最多可以扫描6000页。

Google建立了指定的扫描中心,卡车运输到该中心。电台可以以每小时1,000页的速度数字化。这些书被放置在定制的机械摇篮中,该机械摇篮将书脊柱调整到位,而一系列的灯光和光学仪器扫描了两个开放页面。每个页面都将有两个摄像机针对它捕获图像,而范围的发现器激光雷达在书的表面上覆盖了三维激光网格,以捕获纸张的曲率。人类操作员会用脚踏板拍摄照片,将页面翻转。由于无需将页面弄平或完美地对齐它们,Google的系统不仅达到了显著的效率和速度,而且还有助于保护脆弱的收藏量免于过度处理。之后,粗图像经历了三个级别的处理:首先,除电算法使用LIDAR数据修复了页面的曲率。然后,光学字符识别(OCR)软件将原始图像转换为文本,最后是提取的另一轮算法的页码,脚注,插图和图表。

许多书籍使用定制的埃尔菲尔323相机扫描,每小时1000页。 2009年授予Google的一项专利显示,Google提出了一种创新的系统,用于扫描书籍,该系统使用两个相机和红外光自动纠正一本书中页面的曲率。通过构建每个页面的3D型号,然后“击退”它,Google能够提供扁平的页面,而不必真正使页面平整,这需要使用破坏性方法,例如打开或玻璃板,以单独使用玻璃板将每页变平,这对于大规模扫描效率低下。

Google决定省略颜色信息,以支持更好的空间分辨率,因为当时的大多数不受欢迎的书籍都不包含颜色。每个页面图像都通过区分文本和插图区域的算法传递。然后通过OCR处理文本区域,以启用全文搜索。 Google在提出最佳的压缩技术方面花费了大量资源,旨在提高高图像质量,同时保持文件尺寸最小,以使互联网用户具有低带宽的访问。

网站功能

对于每项工作,Google Books都会自动生成一个概述页面。此页面显示从书中提取的信息 - 它的发布详细信息,高频单词地图,目录以及辅助材料,例如摘要,读者评论(在网站的移动版本中不可读取)以及链接到其他相关文本。例如,该页面的访问者可能会看到具有类似类型和主题的书籍列表,或者他们可能会在书中看到当前的奖学金列表。此外,此内容为登录其Google帐户的用户提供了交互式可能性。他们可以以标准格式导出书目数据和引用,编写自己的评论,将其添加到其库中以标记,组织和与他人共享。因此,Google书籍从包括用户,第三方网站(如Goodreads)以及书的作者和出版商等各种来源收集了这些更加解释性的元素。

实际上,为了鼓励作者上传自己的书籍,Google已在网站上添加了一些功能。作者可以允许访问者免费下载其电子书,或者他们可以设定自己的购买价格。他们可以来回更换价格,每当适合它们时提供折扣。另外,如果一本书的作者选择添加ISBNLCCNOCLC记录号,则该服务将更新本书的URL以包括在内。然后,作者可以将特定页面设置为链接的锚点。此选项使他们的书更容易发现。

ngram查看器

Ngram查看器是连接到Google书籍的服务,该服务在其书籍集中绘制了单词用法的频率。这项服务对历史学家和语言学家来说很重要,因为它可以通过整个时间段内通过单词来提供内在的人类文化。由于该程序中使用的元数据错误,该程序受到了批评。

内容问题和批评

该项目已受到批评,即由于扫描的数据有错误,并且没有解决此类问题,因此保存孤儿和印刷工作的目的是面临风险。

扫描错误

在Google书中扫描的手

扫描过程可能会出现错误。例如,某些页面可能是不可读的,颠倒的,也可能是错误的顺序。学者甚至报导了皱巴巴的页面,掩盖了拇指和手指,并涂抹或模糊图像。在这个问题上,扫描书结尾处发表的Google声明说:

最基本级别的数字化基于物理书籍的页面图像。为了使本书作为EPUB格式化文件可用,我们采用了这些页面图像,并使用光学字符识别(或短词)技术提取了文本。从页面图像中提取文本是一项困难的工程任务。在物理书籍的页面,精美的字体,旧字体,撕裂页面等上污迹都会导致提取文本中的错误。不完美的OCR只是从页面图像集合到提取文本的书籍的最终目标中的第一个挑战。我们的计算机算法还必须自动确定书的结构(放置图像的标题和页脚是什么,文字是经文还是散文等)。正确地做到这一点,我们可以以遵循原始书籍格式的方式渲染这本书。尽管我们尽了最大的努力,您可能会看到本书中的拼写错误,垃圾字符,无关图像或缺少页面。根据我们的估计,这些错误不应阻止您享受本书的内容。自动构建一本完美书籍的技术挑战令人生畏,但是我们继续对OCR和书籍结构提取技术进行增强。

2009年,谷歌表示,他们将开始使用recaptcha来帮助解决Google Book Scans中发现的错误。此方法只会改善由于扫描过程而难以识别的扫描单词,并且无法解决错误的错误,例如翻转页面或封锁单词。

扫描错误启发了艺术品,例如已发表的异常页面和Tumblr博客。

元数据中的错误

学者们经常在Google书籍上的元数据信息中报告了猖ramp的错误 - 包括错误的作者和错误的出版日期。语言学家杰弗里·努伯格(Geoffrey Nunberg)研究了随着时间的流逝单词用法的变化,注意到对1950年之前出版并包含“互联网”一词的书籍的搜索显示出了527个不太可能的结果。伍迪·艾伦(Woody Allen)在出生之前就表面上出版了325本书中提到。 Google通过将大部分错误归咎于外部承包商,对Nunberg做出了回应。

报告的其他元数据错误包括作者出生之前的出版日期(例如,查尔斯·狄更斯(Charles Dickens)于1812年出生之前的作品);不正确的主题分类( Moby Dick的版本在“计算机”下发现,Mae West的传记,分类为“宗教”),矛盾的分类(惠特曼(Whitman错误地拼写了标题,作者和出版商( Moby Dick:或White“ Wall” ),一本书的元数据不正确地附加到一本完全不同的书中(1818年数学作品的元数据导致了1963年的浪漫小说)。

对400个随机选择的Google Books Records的作者,标题,出版商和出版年度元素元素进行了评论。结果表明,数字化项目中有36%的采样书籍包含元数据错误。此错误率高于人们在典型的在线目录中发现的错误率。

在这项研究中发现的总错误率为36.75%,表明Google Books的元数据的错误率很高。尽管“主要”和“次要”错误是基于“可发现性”的不确定概念的主观区别,但本研究中检查的四个元数据元素中发现的错误都应被认为是主要的。

基于错误扫描日期的元数据错误使使用Google Books Project数据库的研究变得困难。 Google对清理这些错误的兴趣只有有限的兴趣。

语言问题

一些欧洲政客和知识分子批评了Google在语言帝国主义方面的努力。他们认为,由于建议扫描的绝大多数书籍都是英语,因此在数字世界中会导致自然语言的不成比例代表。例如,德语,俄语,法语和西班牙语是奖学金中的流行语言。然而,对英语的不成比例的强调可以塑造获得历史学术奖学金的机会,并最终塑造未来奖学金的成长和方向。这些批评家中有前法国国家前总统让·诺尔·珍妮(JeannoëlJeanneney)

Google书籍与Google Scholar

尽管Google Books已将大量日记帐问题数字化,但其扫描并不包括在特定问题中识别特定文章所需的元数据。这导致Google Scholar的制造商启动了自己的计划,以数字化并主持旧期刊文章(与出版商一致)。

图书馆合作伙伴

Google Books Library项目旨在扫描和搜索几个主要研究的藏品。除书目信息外,经常可以查看书籍中的文字片段。如果一本书不在版权和公共领域中,则该书可以完全可以阅读或下载

通过图书馆项目进行扫描的透明书籍可在Google书籍上提供摘要视图。关于扫描的质量,Google承认它们“并不总是足够高质量”,可以在Google Play上出售。同样,由于假定的技术限制,Google并没有用发行商可能提供的更高质量版本代替扫描。

该项目是作者协会诉Google诉讼的主题,该诉讼于2005年提交,并于2013年统治了Google,并于2015年再次上诉。

版权所有者可以要求扫描书的权利,并可以预览或完整视图(通过将其“转移”到其合作伙伴计划帐户),或要求Google防止搜索书籍文本。

自成立以来,参与图书馆项目的机构数量不断增加。

最初的合作伙伴

有关密歇根大学图书馆项目的通知
  • 哈佛大学哈佛大学图书馆
    哈佛大学图书馆和Google在整个2005年进行了一名飞行员。该项目继续进行,目的是增加在线访问哈佛大学图书馆的持股,其中包括超过1580万册。尽管通常仅限于哈佛大学的图书馆材料的物理访问权限,但目前的哈佛学生,教职员工或可以来到剑桥的学者,但哈佛大学- 戈格尔项目的设计旨在使哈佛社区的成员和各地的用户都可以发现。在哈佛集合中工作。
  • 密歇根大学密歇根大学图书馆
    截至2012年3月,扫描了550万卷。
  • 纽约公共图书馆
    在此试点计划中,NYPL与Google合作提供了一系列公共领域书籍,这些书将进行整体扫描,并在线免费提供。用户将能够搜索和浏览这些作品的全文。扫描过程完成后,可以从纽约公共图书馆的网站和Google搜索引擎访问书籍。
  • 牛津大学博德利图书馆
  • 斯坦福大学斯坦福大学图书馆Sulair

其他合作伙伴

自合伙企业首次宣布以来,其他机构合作伙伴也加入了该项目:

历史

2002年:Google的一群团队成员正式启动“秘密书籍”项目。 Google创始人谢尔盖·布林(Sergey Brin)拉里·佩奇(Larry Page)提出了这样的想法,即后来成为1996年斯坦福大学研究生的Google书籍。GoogleBooks网站上的历史页面描述了他们对该项目的最初愿景:“在一个未来的世界中,书籍的集合被数字化,人们将使用“网络爬网”来索引书籍的内容并分析它们之间的联系,从而通过跟踪其他书籍的引用数量和质量来确定任何给定书籍的相关性和有用性。”该团队访问了当时一些更大的数字化工作的地点以及JSTOR和美国制造等数字化项目的基础。佩奇在与当时的大学校长玛丽·苏·科尔曼(Mary Sue Coleman)的交谈中,当佩奇发现该大学目前扫描所有图书馆的卷为1000年时,据报导,佩奇告诉科尔曼,他“相信Google可以在六分钟内实现Google。 “

2003年:该团队致力于开发高速扫描过程,以及用于解决奇数大小,异常字体和“其他意外特点”中问题的软件。

2004年12月:Google表示其Google Print计划的扩展名称为Google Print Library Project。 Google宣布了与密歇根大学哈佛大学哈佛大学图书馆),斯坦福大学绿色图书馆),牛津Bodleian图书馆)和纽约公共图书馆在内的几家知名大学和公共图书馆的合作伙伴关系。根据新闻稿和大学图书馆员的报导,Google计划在十年内通过其Google Books服务数字化并提供约1500万本。这一公告很快引发了争议,因为出版商和作者协会对Google的数字化计划提出了质疑,而不仅仅是公共领域中的书籍,还提出了仍处于版权之下的书名。

2005年9月至10月:针对Google指控的两项诉讼,该公司尚未尊重版权,也未能适当地赔偿作者和出版商。一个是代表作者的集体诉讼(作者诉Google诉Google,2005年9月20日),另一个是五个大型出版商和美国出版商协会提起的民事诉讼。 (McGraw Hill诉Google,2005年10月19日)

2005年11月:Google将此服务的名称从Google打印更改为Google Book搜索。它的计划使出版商和作者能够将其书籍纳入该服务,并重命名为Google Books合作伙伴计划,与图书馆的合作伙伴关系成为Google Books Library Project

2006年:Google在其所有不受欢迎的公共领域书籍中添加了一个“下载PDF”按钮。它还添加了一个新的浏览界面以及新的“关于本书”页面。

2006年8月加州大学系统宣布将加入书籍数字化项目。这包括该系统管理的大约100个库中3400万本书中的一部分。

2006年9月马德里大学合并大学成为第一个加入Google图书图书馆项目的西班牙语图书馆。

2006年10月威斯康星大学 - 麦迪逊分校宣布将与威斯康星州历史学会图书馆一起加入书籍搜索数字化项目。这些图书馆共同拥有720万个持股。

2006年11月弗吉尼亚大学加入了该项目。它的图书馆包含超过500万本书和超过1700万本书,稀有书籍和档案。

2007年1月德克萨斯大学奥斯汀分校宣布将加入书籍搜索数字化项目。从大学的13个图书馆地点数字化至少将数字数字化。

2007年3月巴伐利亚州立图书馆宣布与Google建立合作伙伴关系,以扫描超过一百万个公共领域和印刷外的德语以及英语,法语,意大利语,拉丁语和西班牙语。

2007年5月:Google和Lausanne的Cantonal and University图书馆共同宣布了一本数字化项目合作伙伴关系。

2007年5月根特大学Boekentoren图书馆宣布,它将与Google一起参与数字化和制作19世纪书籍的数字化版本,其中包括法语和荷兰语的语言。

2007年5月:迈索尔大学宣布,Google将数字化80万本书和手稿,包括用梵文和棕榈叶上的梵文或卡纳达语编写的大约100,000本手稿。

2007年6月机构合作委员会(2016年的大十大学术联盟更名为十大学术联盟)宣布,其十二个会员图书馆将在未来六年内参加扫描1000万本书。

2007年7月Keio University成为Google在日本的第一个图书馆合作伙伴,宣布他们将至少数字化120,000个公共领域书籍。

2007年8月:Google宣布将从康奈尔大学图书馆中数字化多达500,000个版权和公共领域项目。 Google还将提供扫描的所有作品的数字副本,以纳入大学自己的图书馆系统。

2007年9月:Google添加了一项功能,该功能允许用户共享公共领域中的书籍片段。摘要可能完全像在书的扫描中或纯文本一样出现。

2007年9月:Google推出了一项名为“ My Library”的新功能,该功能允许用户创建个人自定义库,可以标记,评论,评估或全文搜索的书籍的选择。

2007年12月哥伦比亚大学作为数字化公共领域工程的合作伙伴。

2008年5月Microsoft逐渐减少,并计划结束其扫描项目,该项目已达到75万本书和8000万本期刊文章。

2008年10月:经过两年的谈判,出版业和Google之间达成了和解。 Google同意补偿作者和出版商,以换取使公众可用的数百万本书的权利。

2008年10月Hathitrust “共享数字存储库”(后来称为Hathitrust数字图书馆)由机构合作委员会加利福尼亚大学系统的11个大学图书馆共同启动归档并从Google和其他人扫描的收藏中提供学术访问。

2008年11月:Google达到了Google及其出版合作伙伴扫描的物品的700万本书。 100万处于完整的预览模式,有100万是可见的和可下载的公共领域作品。大约有500万个绝版

2008年12月:Google宣布将杂志纳入Google图书中。标题包括纽约杂志乌木流行力学

2009年2月:Google推出了Google图书搜索的移动版本,允许iPhone和Android手机用户使用移动浏览器阅读美国(在美国以外的500,000多个公共领域)的150万个公共领域。该书的纯文本而不是页面图像。

2009年5月:在纽约举行的年度Bookexpo大会上,Google表示其目的是引入一个计划,该计划将使出版商能够通过Google将其最新书籍的数字版本直接向消费​​者出售给消费者。

2009年12月:法国法院关闭了在法国出版的版权书籍的扫描,称这违反了版权法。这是扫描项目的第一个重大法律损失。

2010年4月:视觉艺术家没有被包括在以前的诉讼和解决方案中,是另一项诉讼中的原告团体,并说他们打算将不仅仅是受到审查的Google书籍。该声明说:“新的集体诉讼超越了Google的图书馆项目,其中包括Google对摄影师,插画家和其他视觉艺术家的权利的其他系统性和普遍侵犯。”

2010年5月:据报导,Google将推出一家名为Google Editions的数字图书商店。它将与自己的电子书商店与亚马逊,Barnes&Noble,Apple和其他电子图书零售商竞争。与其他人不同,Google版本将完全在线,并且不需要特定的设备(例如Kindle,Nook或iPad)。

2010年6月:Google通过了1200万本书扫描。

2010年8月:宣布Google打算在十年内扫描所有现有的129,864,880本书,总计超过40亿个数字页面和2万亿个单词。

2010年12月:Google电子书(Google Editions)在美国推出。

2010年12月:Google启动了Ngram Viewer,该查看器在其书籍集合中收集并绘制了有关单词用法的数据。

2011年3月:一名联邦法官拒绝了出版业和Google之间达成的和解

2012年3月:Google通过了2000万本书进行了扫描。

2012年3月:Google与出版商达成了和解。

2013年1月:纪录片Google和世界大脑圣丹斯电影节上展出。

2013年11月作者诉Google案的裁决,美国地方法院法官Denny Chin与Google的统治,并以合理的使用为由。作者说,他们会提出上诉。

2015年10月:上诉法院支持Google,宣布Google并未违反版权法。据《纽约时报》报导,Google扫描了超过2500万本书。

2016年4月:美国最高法院拒绝听取作者行会的上诉,这意味着下级法院的裁决是由搜索片段的裁决,而Google将被允许扫描图书馆书籍并在搜索结果中显示摘要而不会违反法律。

地位

Google对Google Books Project的未来计划非常秘密。扫描操作至少自2012年以来一直在放慢速度,正如Google的几个合作伙伴机构所证实的那样。在威斯康星大学,速度已降至2006年的一半。但是,图书馆员说,逐渐减少的速度可能是该项目成熟的自然结果 - 最初的书籍完全被占用。扫描,而现在只需要考虑尚未扫描的标题。该公司自己的Google图书时间线页面即使在2017年甚至在2007年之后也没有提及任何内容,而Google Books Blog已在2012年合并到Google搜索博客中。

尽管赢得了2017年长达十年的诉讼,但大西洋曾表示,Google“几乎都关闭了其扫描行动”。 2017年4月, Wired报导说,只有少数Google员工从事该项目,但仍在扫描新书,但价格较低。它评论说,长达十年的法律斗争使Google失去了野心。

法律问题

通过该项目,无论版权地位如何,图书馆的书籍都在一定程度地被数字化,这导致了针对Google的许多诉讼。据报导,到2008年底,Google已将超过700万本书数字化,其中仅在公共领域工作了约100万本书。在其余的中,有一百万是版权和印刷品,有五百万在版权中,但没有印刷。 2005年,一群作者和出版商提出了针对Google的重大集体诉讼,以侵犯受版权保护的作品。 Google认为它正在保存“孤儿作品” - 书籍仍具有版权,但其版权持有人无法找到。

作者协会美国出版商协会在2005年为其书籍项目分别起诉Google,理由是“严重侵犯版权”。 Google反驳说,它的项目代表了合理的用途,并且是数字时代等同于卡片目录,其出版物中的每个单词索引。诉讼已合并,最终提出了解决方案。该和解在各种各样的理由上受到了重大批评,包括反托拉斯,隐私和拟议的作者和出版商类别的不足。结算最终被拒绝,出版商不久之后就与Google定居。作者协会继续其案件,并在2011年获得了拟议的课程认证。 Google对这一决定提出上诉,其中许多Amici断言了班级的不足,第二巡回法院于2013年7月拒绝了班级认证,并将此案还给地方法院以考虑Google的合理使用辩护。

2015年,作者协会对纽约第二巡回上诉法院对Google提出了另一项上诉。 Google是根据他们没有向人们展示全文而是片段的论点一致赢得了案件,而他们不允许人们非法阅读这本书。法院在一份报告中指出,他们没有侵犯版权法,因为他们受到了公平使用条款的保护。

作者协会在2016年再次尝试对这一决定提出上诉,这次将其案件被最高法院审议。该案被拒绝,使第二巡回法院对案件的裁决保持原状,这意味着Google并未违反版权法。此案还为其他类似案件树立了先决条件,以实现合理使用法律,因为它进一步阐明了法律并扩大了法律。这种澄清会影响类似于Google的其他扫描项目。

其他诉讼遵循了作者协会的领导。 2006年,德国诉讼以前提起诉讼,被撤回。 2006年6月,法国出版商HervéDelaMartinière被称为LaMartinière和Éditionsdu Seuil ,宣布打算提起Google France。 2009年,巴黎民事法院判给300,000欧元(约430,000美元)的损害赔偿和利息,并命令Google每天支付10,000欧元,直到从其数据库中删除出版商的账簿为止。法院写道:“ Google违反了作者的版权法,通过完全复制并制作可访问的书籍“无允许的书籍拥有”书籍,而Google则“违反了对出版商有害的版权行为”。 Google表示会吸引人。加入诉讼的Syndicat National de L'Edition表示,Google扫描了大约100,000张法国作品的版权作品。

2009年12月,中国作家米安·米安(Mian Mian)以8,900美元的价格提起民事诉讼,以扫描她的小说《酸恋人》 。这是在中国针对Google提起的第一次此类诉讼。同样,在当年11月,中国书面工程版权协会(CWWC)指责Google在未经授权的情况下扫描了570名中国作家的18,000本书。 Google于11月20日同意提供了扫描的中文书籍清单,但该公司拒绝承认已“侵犯”版权法。

2007年3月,Microsoft版权,商标和商业秘密副法律顾问Thomas Rubin指控Google通过其书籍搜索服务违反了版权法。鲁宾特别批评了Google自由复制任何作品的政策,直到版权所有者通知以停止。

Google对公共领域工作的许可也是一个关注的领域,因为使用了数字水印技术。公共领域中的一些已发表的作品,例如美国联邦政府制作的所有作品,仍然像版权下的其他作品一样对待,因此在1922年之后被锁定。

类似的项目

  • Gutenberg项目是一项自愿进行数字化和存档文化作品的努力,以“鼓励创建和分发电子书”。它是由迈克尔·哈特(Michael S. Hart)于1971年成立的,是最古老的数字图书馆。截至2015年10月3日,Gutenberg项目在其收藏中达到了50,000件物品。
  • Internet Archive是一家非营利组织,每天数字化1000多本书,以及Google Books和其他来源的书籍。截至2011年5月,它托管了超过280万本公共领域书籍,大于Google Books的大约100万个公共领域书籍。 Open Library是Internet档案馆的姐妹项目,向150个图书馆的访问者提供了80,000张扫描并购买了商业电子书。
  • 自2008年10月13日以来, Hathitrust维护Hathitrust数字图书馆,该图书馆保留并提供了对Google扫描的材料,一些Internet存档书籍的访问权限,一些互联网存档书籍以及合作伙伴机构本地扫描的材料。截至2010年5月,它包括大约600万册,其中超过100万是公共领域(至少在美国)。
  • ACLS人文学科电子书,在线收集了5400多本人文和相关社会科学的高质量书籍,可通过机构订阅获得。
  • 微软资助了2006年底扫描30万本书,以创建现场搜索书。它一直持续到2008年5月,当时该项目被放弃并在互联网档案中免费提供。
  • 印度国家数字图书馆(NDLI)是印度人力资源开发部的一个项目。目的是将几个国家和国际数字图书馆集成到一个单个网站上。 NDLI免费提供了许多英语和印度语言的书籍的成本访问。
  • 截至2010年,欧洲人链接到大约1000万个数字对象,包括视频,照片,绘画,音频,地图,手稿,印刷书籍和报纸,以及欧盟1000多个欧洲历史上的欧洲历史上的报纸。
  • 加里卡(Gallica)从法国国家图书馆链接到约4,000,000个数字化的书籍,报纸,手稿,地图和图纸等。1997年创建的数字图书馆继续以每月约5000个新文档的速度扩展。自2008年底以来,大多数新的扫描文档都以图像和文本格式获得。这些文件中的大多数都是用法语编写的。
  • Wikisource
  • 跑步者

也可以看看