谷歌学术

谷歌学术
Google Scholar logo.png
Google Scholar home page.png
Google Scholar主页
站点类型
书目数据库
所有者谷歌
URL学者。谷歌.com
登记可选的
发射2004年11月20日; 18年前
当前状态积极的

谷歌学术是一个可以自由访问的网络搜索引擎索引全文或元数据学术文学跨越一系列出版格式和学科。发行beta2004年11月,Google Scholar指数包括同行评审在线的学术期刊和书籍,会议论文,这些论文预印本摘要技术报告和其他学术文学,包括法院意见专利.[1]

Google Scholar使用Web搜寻器或Web机器人来识别用于包含在搜索结果中的文件。[2]为了在Google Scholar中索引内容,它必须符合某些指定标准。[3]较早发表的统计估计PLOS ONE用一个标记并重新捕获方法估计所有英语发表的文章的覆盖率约为80-90%,估计为1亿。[4]该估计还确定了互联网上有多少文档。Google Scholar因不审查期刊而受到批评掠夺性期刊在其索引中。[5]

密歇根大学图书馆和其他图书馆,其藏品进行了搜索Google书籍Google Scholar保留了扫描的副本,并使用它们来创建Hathitrust数字图书馆.[6][7]

历史

Google Scholar是由Alex Verstak和Anurag Acharya[8]然后,他们俩都在构建Google的主要网络索引。[9][10]他们的目标是“使世界的问题解决者提高10%”[11]通过更轻松,更准确地获得科学知识。这个目标反映在Google Scholar的广告口号中”站在巨人的肩膀上”,这是从一个归因于伯纳德·沙特雷斯(Bernard),由艾萨克·牛顿(Isaac Newton)引用,是对几个世纪以来为领域做出贡献的学者致敬,为新的知识成就提供了基础。[12]Google Scholar中文本的原始资料之一是密歇根大学的印刷品系列。[6]

随着时间的流逝,学者已经获得了一系列功能。2006年,实施了支持的引文导入功能参考书目经理, 如参考repman尾注, 和Bibtex。2007年,阿查里亚(Acharya)宣布,Google Scholar启动了一项与出版商一致的计划,以数字化和托管期刊文章,这是与他们的出版商一致的。Google书籍,对旧期刊的扫描不包括在特定问题中识别特定文章所需的元数据。[13]在2011年,谷歌从其搜索页面上删除了工具栏的学者,[14]对于尚未意识到其存在的用户而言,它既不容易访问,也不太可发现。在此期间,具有类似功能的网站,例如CiteseerScirus和MicrosoftWindows Live Academic搜索已开发。其中一些现在已停用。2016年,微软推出了新的竞争对手微软学术.[15]

2012年推出了一个重大的增强,单个学者有可能创建个人“学者引用概况”。[16]2013年11月引入的一项功能使已登录的用户可以将搜索结果保存到“ Google Scholar Library”中,该个人集合可以单独搜索并通过标签组织。[17]通过“指标”按钮,它揭示了感兴趣领域中的顶级期刊,并且也可以访问产生这些期刊影响的文章。现在,指标功能支持查看整个科学领域以及学术期刊的影响。[18]

功能和规格

Google Scholar允许用户在线或在库中搜索文章的数字或物理副本。[19]它索引“全文期刊文章,技术报告,预印本,这些,书籍和其他文件,包括被认为是“学术”的选定网页。”[20]由于Google Scholar的许多搜索结果链接到商业期刊文章,因此大多数人将只能访问摘要和文章的引用详细信息,并且必须支付费用才能访问整个文章。[20]搜索关键字的最相关结果将首先列出,按照作者的排名,与之相关的参考文献数量以及它们与其他学术文献的相关性以及期刊出现的出版物的排名。[21]

小组和文学访问

它使用其“组”功能,显示了与期刊文章的可用链接。在2005年的版本中,此功能提供了与文章的订阅版本和免费的文章版本的链接;在2006年的大部分时间里,它仅提供了发布者版本的链接。自2006年12月以来,它提供了已发布版本和主要开放访问的链接存储库,包括所有在各个教师网页上发布的内容以及其他通过相似性标识的非结构化资源。另一方面,Google Scholar不允许在收费访问开放访问资源,提供的功能Unmainwall以及嵌入数据的工具,例如网络科学scopusUntaywall期刊,图书馆用来计算其藏品的实际成本和价值。[22]

引文分析和工具

通过其“引用”功能,Google Scholar提供了对所观看文章的文章摘要的访问权限。[23]特别是此功能提供引文索引以前仅在Citeseerscopus, 和网络科学。Google Scholar还提供链接,以便可以以各种格式复制引用或导入用户选择参考经理Zotero.

“学者引用概况”是作者本身可以编辑的公共作者资料。[16]个人,通过Google帐户登录,该帐户通常与学术机构相关联,现在可以创建自己的页面,从而提供感兴趣的领域和引用领域。Google Scholar会自动计算并显示个人的总引文数量,h-index, 和i10索引。根据Google的说法,截至2014年8月,“学者搜索结果的四分之三……显示了与作者公共资料的链接”。[16]

相关文章

通过其“相关文章”功能,Google Scholar列出了密切相关的文章列表,主要由这些文章与原始结果相似,但也考虑到每篇论文的相关性。[24]

美国法律案件数据库

Google Scholar的美国案件法律数据库广泛。自1950年以来,用户可以搜索并阅读有关美国州上诉和最高法院案件的公开意见,自1923年以来,美国联邦区,上诉,税收和破产法院以及1791年以来美国最高法院案件。[23]Google Scholar嵌入了案例中的可点击引文链接,而引用的标签如何允许律师研究先前的判例法和随后对法院判决的引用。[25]

排名算法

虽然大多数学术数据库和搜索引擎允许用户选择一个因素(例如相关性,引文计数或出版日期)以对结果进行排名,Google Scholar以“研究人员的方式”以“研究人员的方式”来对结果进行排名,权衡每篇文章的全文,作者,出版物,出版物文章出现的文章,以及其他学术文学中引用了该文章的频率”。[21]研究表明,Google Scholar尤其是在引文数[26]以及文档标题中包含的单词。[27]在作者或年份的搜索中,第一个搜索结果通常是高度引用的文章,因为引用的数量是高度决定因素,而在关键字搜索中,引用的数量可能是重量最大的因素,但其他因素也参与其中。[28]

局限性和批评

一些搜索者发现,在某些特定期刊中查看文章的引用时,Google Scholar与基于订阅的数据库具有可比的质量和实用性。[29][30]评论认识到,它的“引用”特征特别构成了激烈的竞争scopus网络科学。一项研究生物医学领域的研究发现,Google Scholar中的引文信息“有时不足,更频繁的更新”。[31]与其他一般数据库相比,Google Scholar的覆盖范围可能因纪律而有所不同。[32]Google Scholar努力包括尽可能多的期刊,包括掠夺性期刊,这可能缺乏学术上的严格。掠夺性期刊的专家说,这些期刊“用伪科学污染了全球科学记录”和“ Google Scholar忠于和盲目地包括其中央指数”。[33]

Google Scholar并未发布包含的期刊或发布者的期刊列表,并且其更新的频率尚不确定。文献计量学有证据表明,Google Scholar对科学和社会科学的报导与其他学术数据库具有竞争力。截至2017年,尚未对学者对艺术和人文科学的报导进行经验研究,学者在这些领域的学科效用仍然模棱两可。[34]尤其是早期,一些出版商不允许学者爬他们的期刊。Elsevier自2007年中期以来,已经包括期刊科学方Google Scholar和Google的网络搜索可用的内容。[35]但是,2014年的研究[4]据估计,Google Scholar可以在用英语编写的网络上找到几乎90%(约1亿)的学术文档。大规模的纵向研究发现,通过Google Scholar Links在全文中获得了40%至60%的科学文章。[36]

Google Scholar在其排名算法中对引文数量的重量很高,因此受到批评马修效应[26]由于高度引用的论文出现在最高位置,因此他们获得了更多的引用,而新论文几乎没有出现在顶级位置,因此Google Scholar的用户的关注较少,因此引用较少。Google Scholar效应是一种现象,当一些研究人员选择并引用Google Scholar的最高结果中出现的作品,无论他们对引用出版物的贡献如何,因为他们会自动假设这些作品的信誉,并相信编辑,审阅者和读者希望看到这些作品的信誉引用。[37]Google Scholar在确定有关的出版物方面存在问题arxiv正确的预印服务器。标题中的互音字符产生了错误的搜索结果,作者被分配给错误的论文,这导致错误的其他搜索结果。甚至没有任何可理解的原因给出了一些搜索结果。[38][39]

Google Scholar很容易受到影响垃圾邮件.[40][41]来自加州大学伯克利分校奥托 - 冯·古圭克大学玛格德堡证明可以对Google Scholar的引文计数进行操作,并通过Scigen被索引在Google Scholar中。[42]这些研究人员得出结论,应谨慎使用Google Scholar的引用计数,尤其是在计算诸如诸如绩效指标的情况下h-index或者影响因子,这本身就是文章质量的糟糕预测指标。[43]Google Scholar随着个人学者页面的出现,于2012年开始计算H-INDEX。几个下游软件包,例如Harzing的出版或灭亡也使用其数据。[44]通过操纵H索引计算器的实用性欺骗Cyril Labbe在2010年证明了Google Scholar约瑟夫·傅里耶大学,在领先的艾尔伯特爱因斯坦通过一大堆Scigen - 由彼此引用的生产文件(有效地是学者链接农场)。[45]截至2010年,Google Scholar无法放牧判例法,作为Lexis可以。[46]与其他学术工作的索引不同,例如scopus网络科学,Google Scholar没有保持应用程序接口可以用来自动数据检索。使用网络刮板来获取搜索结果的内容也受到验证验证的实现严重限制。Google Scholar不显示或出口数字对象标识符(dois),[47]一个事实上所有主要的学术出版商都实施的标准以唯一识别并参考各个学术工作。[48]

Google Scholar的搜索引擎优化

搜索引擎优化(SEO)用于传统的网络搜索引擎,例如谷歌多年来一直很受欢迎。几年来,SEO也已应用于Google Scholar等学术搜索引擎。[49]SEO学术文章也称为“学术搜索引擎优化”(ASEO),并被定义为“学术文献的创建,出版和修改,使学术搜索引擎更容易爬行和索引”。[49]ASEO已被几个组织采用,其中包括Elsevier[50]科学,科学,[51]门德利[52]鼠尾草出版[53]为了优化其文章在Google Scholar中的排名。ASEO有负面因素。[42]

也可以看看

参考

  1. ^“搜索提示:内容覆盖”.谷歌学术.存档来自2016年9月23日的原始。检索4月27日2016.
  2. ^“ Google Scholar帮助”.Scholar.google.com。检索2021-09-01.
  3. ^“ Google Scholar帮助”.Scholar.google.com。检索2021-09-01.
  4. ^一个b趋势观看(2014)自然509(7501),405 - 讨论Madian Khabsa和C Lee Giles(2014)公共网络上的学术文件数量存档2014-08-30在Wayback MachinePLOS ONE9,E93949。
  5. ^吉娜·科拉塔(Kolata)(2017年10月30日)。“许多学者都渴望在毫无价值的期刊上出版”.纽约时报.存档从2017年11月8日的原始。检索11月2日2017.
  6. ^一个b“ UM图书馆/Google Digitization Partnership FAQ,2005年8月”(PDF)。密歇根大学图书馆。2005年8月。存档(PDF)从2020-09-22的原始。检索2021-04-30.密歇根大学与Google的合作包括许多活动和Google产品(例如Google Scholar)。
  7. ^詹妮弗·霍华德(Jennifer Howard)(2017年8月10日)。“ Google扫描数百万个大学图书馆书籍的努力发生了什么?”。 Edsurge。存档来自2017-08-10的原始。检索2021-04-30.
  8. ^Giles,J。(2005)。“网络时代的科学:启动您的引擎”.自然.438(7068):554–55。Bibcode2005 Natur.438..554G.doi10.1038/438554a.PMID 16319857.S2CID 4432132.
  9. ^休斯,特蕾西(2006年12月)。“接受Google Scholar首席工程师Anurag Acharya的采访”.Google Libranian Central.存档从2010-03-01的原始。检索2016-11-14.
  10. ^阿西西,弗朗西斯·C(2005年1月3日)。“ Anurag Acharya帮助Google的学术飞跃”。放置链接。存档原本的在2011-06-08。检索2007-04-19.
  11. ^史蒂文·利维(Steven Levy)(2015)绅士的学者存档2020-11-18Wayback Machine。媒介上的“后频道”。
  12. ^Rozear,Hannah(2009)。“ Google Scholar代表Art:在线数据库中内容覆盖范围的评估”。艺术图书馆杂志.34(2):21–25。doi10.1017/S0307472200015844.S2CID 163504762.
  13. ^Quint,Barbara(2007年8月27日)。“ Google Scholar的变化:与Anurag Acharya的对话”.今天的信息.存档从2011年3月26日的原件。检索2月22日,2008.
  14. ^Madrigal,Alexis C.(2012年4月3日)。“ 20个服务Google认为比Google Scholar更重要”。大西洋。存档从2020年10月31日的原始。检索3月7日2017.
  15. ^阿尔贝托(Martín-Martín)Thelwall,迈克;Orduna-Malea,Enrique;Emilio(2021年1月1日)DelgadoLópez-Cózar。“ Google Scholar,Microsoft Academic,Scopus,Dimensions,Web of Science和Opencitations的COCI:通过引用的覆盖范围的多学科比较”.科学计量学.126(1):871–906。doi10.1007/s11192-020-03690-4.ISSN 1588-2861.PMC 7505221.PMID 32981987.
  16. ^一个bc亚历克斯·维斯塔克(Alex Verstak):“学者概况的新外观存档2016-03-04在Wayback Machine”。GoogleScholar博客,2014年8月21日
  17. ^詹姆斯·康纳(James Connor):“Google Scholar图书馆存档2016-03-04在Wayback Machine“。GoogleScholar博客,2013年11月19日
  18. ^“国际互联网科学杂志 - Google Scholar引用”.存档从2016-05-13的原始。检索2014-08-22.
  19. ^“ Google Scholar图书馆链接”.存档从2012-05-13的原始。检索2016-05-27.
  20. ^一个bVine,丽塔(2006年1月)。“谷歌学术”.医学图书馆协会杂志.94(1):97–99。PMC 1324783.
  21. ^一个b“关于Google Scholar”.存档从2013-02-26的原始。检索2010-07-29.
  22. ^丹妮丝·沃尔夫(Denise Wolfe)(2020-04-07)。“ SUNY与Elsevier - 布法罗图书馆的新闻中心大学谈判新的,修改的协议”.Library.buffalo.edu.布法罗大学.存档从2020-12-06的原始。检索2020-04-18.
  23. ^一个b“ Google Scholar帮助”.存档来自2018-08-10的原始。检索2017-12-15.
  24. ^“探索学术社区”.Google官方博客.存档从2021-02-12的原始。检索2021-02-16.
  25. ^德雷林(Geri)(2011年5月11日)。“如何使用Google Scholar进行法律研究”。律师技术评论。存档从2019年4月2日的原件。检索6月7日,2011.
  26. ^一个bJöranBeel和Bela Gipp。Google Scholar的排名算法:入门概述。在Birger Larsen和Jacqueline Leta的编辑中,第12届国际科学和信息学会议论文集(ISSI'09),第1卷。1,第230–41页,里约热内卢,2009年7月。国际科学计量学和信息学会。ISSN 2175-1935.
  27. ^Beel,J。; Gipp,B。(2009)。Google Scholar的排名算法:引文计数的影响(一项实证研究)(PDF).2009年第三届信息科学研究挑战国际会议。 pp。439–46。doi10.1109/rcis.2009.5089308.ISBN 978-1-4244-2864-9.S2CID 843045。检索2019-12-24.[死链]
  28. ^Rovira,Cristòfol;弗雷德里克(Guerrero-Solé)Codina,Lluís(2018-06-18)。“被引用是Google Scholar结果排名的主要SEO因素”.de lainformación.27(3):559–569。doi10.3145/epi.2018.may.09.ISSN 1699-2407.存档从2021-01-13的原始。检索2020-12-28.
  29. ^鲍尔,凯瑟琳;Bakkalbasi,NISA(2005年9月)。“在新的学术沟通环境中对引文计数的检查”.D-Lib杂志.11(9)。doi10.1045/2005年9月.存档从2011-04-08的原始。检索2006-08-07.open access
  30. ^Kulkarni,A。V。;阿齐兹,b。Shams,我。Busse,J。W.(2009)。“在一般医学期刊上发表的文章中的网络科学,Scopus和Google学术搜索的引文比较”.JAMA:美国医学协会杂志.302(10):1092–96。doi10.1001/jama.2009.1307.PMID 19738094.
  31. ^Falagas,M。E。;Pitsouni,E。I。;Malietzis,G。A。;Pappas,G。(2007)。“ PubMed,Scopus,Web of Science和Google Scholar的比较:优势和劣势”。FASEB杂志.22(2):338–42。doi10.1096/fj.07-9492LSF.PMID 17884971.S2CID 303173.
  32. ^Kousha,K。; Thelwall,M。(2007)。“ Google Scholar引用和Google Web/URL引用:多学科探索性分析”(PDF).美国信息科学与技术学会杂志.57(6):1055–65。Bibcode2007JASIS..58.1055K.doi10.1002/asi.20584.存档(PDF)从2020-09-29的原始。检索2019-12-24.
  33. ^比尔,杰弗里(2014年11月)。“ Google Scholar充满了垃圾科学”.学术开放访问。存档原本的2014-11-07。检索2014-11-10.
  34. ^Fagan,Jody(2017)。“ 2014 - 2016年对学术网络搜索引擎的基于证据的评论:对图书馆员实践和研究议程的影响”.信息技术和图书馆.36(2):7–47。doi10.6017/ital.v36i2.9718.存档从2020-09-30的原始。检索2019-12-24.
  35. ^布兰特利,彼得(2007年7月3日)。“科学直接进入Google”.O'Reilly Radar。存档原本的2008年4月21日。
  36. ^阿尔贝托(Martín-Martín)恩里克(Enrique)Orudña-Malea;Ayllón,Juan Manuel;DelgadoLópez-Cózar,Emilio(2014-10-30)。“ Google Scholar是否包含所有高度引用的文件(1950- 2013年)?”。arxiv1410.8464[cs.dl]。
  37. ^Serenko,A。; Dumay,J。(2015)。“知识管理期刊上发表的引文经典。第二部分:研究研究趋势并发现Google Scholar效应”(PDF).知识管理杂志.19(6):1335–55。doi10.1108/JKM-02-2015-0086.存档(PDF)从2015-10-01的原始。检索2015-09-30.
  38. ^彼得·雅克(Jacso)(2009年9月24日)。“ Google Scholar的幽灵作家,失落的作者和其他问题”.图书馆杂志。存档原本的2011年6月7日。
  39. ^PéterJacsó(2010)。“ Google Scholar中的Metadata Mega Mess”。在线信息评论.34:175–91。doi10.1108/14684521011024191.
  40. ^关于Google Scholar反对垃圾邮件的鲁棒性
  41. ^学术开放访问 - 一位罗马尼亚的研究员成功地游戏了Google Scholar提高了他的引文数量?存档2015-01-22在Wayback Machine
  42. ^一个b比尔,乔兰;Gipp,Bela(2010年12月)。“学术搜索引擎垃圾邮件和Google Scholar对此的韧性”(PDF).电子出版杂志.13(3)。doi10.3998/3336451.0013.305.存档(PDF)从2020-10-01的原始。检索2019-12-24.
  43. ^Brembs B(2018)。“享有声望的科学期刊努力达到平均可靠性”.人类神经科学领域.12:37。doi10.3389/fnhum.2018.00037.PMC 5826185.PMID 29515380.
  44. ^“发布或灭亡”。 Anne-wil harzing.com。存档从2021-01-11的原始。检索2013-06-15.
  45. ^Labbe,Cyril(2010)。“艾克·安卡尔(Ike Antkare)是科学决心中的伟大明星之一”(PDF).Laboratoire d'Informatique de Grenoble RR-LIG-2008(技术报告).约瑟夫·傅里耶大学.存档(PDF)来自2013-04-02的原始版本。检索2011-03-22.
  46. ^本恩,奥利弗(2010年3月9日)。“ Google Scholar是值得的对手吗?”(PDF).录音机.存档(PDF)从2011年5月20日的原始。检索4月19日,2019.
  47. ^霍尔,马克;坦贾(Merčun);里斯,托马斯;Fabien Duchateau(8月25日至27日,2020年)。用于开放知识的数字图书馆.国际数字图书馆理论与实践会议.Springer Science+商业媒体。 p。 104。ISBN 978-3-030-54956-5。检索2022-01-15.
  48. ^阿尔贝托(Martín-Martín)Thelwall,迈克;Orduna -Malea,Enrique;López-Cózar,Emilio Delgado(2020-09-21)。“ Google Scholar,Microsoft Academic,Scopus,Dimensions,Web of Science和Opencitations的COCI:通过引用的覆盖范围的多学科比较”.科学计量学.126(1):871–906。doi10.1007/s11192-020-03690-4.PMC 7505221.PMID 32981987.
  49. ^一个b比尔,约兰;Gipp,Bela;埃里克·王德(Wilde)(2010)。“学术搜索引擎优化(ASEO)”(PDF).学术出版杂志.41(2):176–90。doi10.3138/jsp.41.2.176.S2CID 1913416。检索2019-12-24.
  50. ^“找到 - 优化搜索引擎的研究文章”.存档从2019-10-23的原始。检索2017-01-29.
  51. ^“为什么以及如何优化搜索引擎的学术文章?”。 2014年4月9日。存档从2019-03-30的原始。检索2017-01-29.
  52. ^“学术SEO - 市场(并出版)或灭亡”。 2010-11-29。存档从2019-10-23的原始。检索2017-01-29.
  53. ^“帮助读者找到您的文章”。 2015-05-19。存档从2019-09-27的原始。检索2017-01-29.

进一步阅读

  • Jensenius,F.,Htun,M.,Samuels,D.,Singer D.,Lawrence,A。,&Chwe,M。(2018)。“Google Scholar的好处和陷阱"PS:政治科学与政治,51(4),820–824。

外部链接