语义学者

语义学者
站点类型
搜寻引擎
由...制作 艾伦人工智能研究所
URL 语义Cholar .org
发射 2015年11月2日

语义学者是由人工智能提供支持的科学文献的研究工具。它是在艾伦AI研究所开发的,并于2015年11月公开发布。语义学者在自然语言处理中使用现代技术来支持研究过程,例如,通过提供自动生成的学术论文摘要。语义学者团队正在积极研究人工智能在自然语言处理机器学习人类计算机互动信息检索中的使用。

语义学者最初是计算机科学地球科学神经科学主题的数据库。 2017年,该系统开始在其语料库中包括生物医学文献。截至2022年9月,它包括来自所有科学领域的2亿多个出版物。

技术

语义学者提供了科学文献的一句话摘要。它的目的之一是解决阅读移动设备上众多标题和冗长摘要的挑战。它还试图确保每年发表的三百万个科学论文读者,因为据估计,只有一半的文献才被阅读。

人工智能用于捕获论文的本质,并通过“抽象”技术生成它。该项目结合了机器学习自然语言处理机器视觉,为传统的引文分析方法添加了语义分析,并从论文中提取相关的数字,表格,实体和场所。

AI驱动的另一个关键功能是研究提要,这是一种适应性研究的建议,它使用AI快速学习论文用户关心阅读的内容,并推荐最新的研究,以帮助学者保持最新状态。它使用使用对比度学习训练的最先进的纸张嵌入模型,以查找与每个图书馆文件夹中类似的论文。

语义学者还提供语义读者,这是一个增强的读者,具有使科学阅读更易于访问和丰富的背景来彻底改变科学阅读的潜力。语义读取器提供在线引用卡,使用户可以在阅读和浏览亮点时看到引用TLDR摘要,从而捕获纸张的关键点,从而使用户可以更快地消化。

Google ScholarPubMed相反,语义学者旨在突出论文中最重要,最有影响力的元素。 AI技术旨在确定研究主题之间的隐藏联系和链接。像以前引用的搜索引擎一样,语义学者还利用图形结构,其中包括Microsoft学术知识图,Springer Nature的Scigraph和语义学者Corpus。

语义学者托管的每篇论文均分配了一个唯一的标识符,称为语义学者语料库ID(缩写为S2CID)。以下条目是一个示例:

刘,ying;盖尔(Albert A); Wilder-Smith,Annelies;罗克洛夫(Joacim)(2020年3月)。 “与SARS冠状病毒相比,Covid-19的生殖数量更高”。旅行医学杂志27 (2)。 doi10.1093/jtm/taaa021PMID 32052846S2CID 211099356

语义学者可以免费使用,并且与类似的搜索引擎(IE Google Scholar )不同,没有搜索付费墙背后的材料。

一项研究将语义学者的索引范围与Google Scholar进行了比较,并发现对于计算机科学中的二级研究引用的论文,这两个指数具有可比的覆盖范围,每个指数都缺少少数论文。

用户和出版物的数量

截至2018年1月,随着2017年的一个项目增加了生物医学论文和主题摘要,语义学者语料库包括来自计算机科学生物医学的4000万篇论文。 2018年3月,为亚马逊Alexa平台开发了机器学习计划的道格·雷蒙德(Doug Raymond)被聘请领导语义学者项目。截至2019年8月,在添加Microsoft Academic Graph Records后,包括的论文元数据(不是实际的PDF)已增长到超过1.73亿。 2020年,语义学者与芝加哥大学出版社期刊之间的伙伴关系制作了芝加哥大学出版社在语义学者Corpus上发表的所有文章。在2020年底,语义学者索引了1.9亿篇论文。

2020年,语义学者每月吸引700万用户。这是有问题的,因为它使用了AI,因此无法区分书籍和书籍本身的评论,经常仅列出评论并拒绝包括所评论的书籍。此外,由于它使用了科学标准(Initials和姓氏),因此无法区分具有通用名称的作者。分配给论文的领域也没有明确区分,列出了文献论文和类似问题的“历史”。此断言无需引用,因为用户可以自己验证它:例如,搜索“神圣喜剧”(但丁的十四世纪杰作),并获得诸如“艺术”的书评之类的反馈(请参阅第三行,实际上是实际的下面的响应)。

特里·伊格尔顿(Terry Eagleton)的神圣喜剧

   S. Connor
   Art
   Theory Now Journal of Literature Critique and...
   29 July 2022

这篇文章反映了特里·伊格尔顿(Terry Eagleton)自2000年以来的喜剧与宗教之间的联系。它提出宗教思想提供了相同的场合和必须...

也可以看看