语义学者
![]() | |
站点类型 | 搜索引擎 |
---|---|
由...制作 | 艾伦人工智能研究所 |
URL | 语义cholar |
发射 | 2015年11月 |
语义学者是一个人工智能 - 科学文献的能力研究工具艾伦AI研究所并于2015年11月公开发布。[1]它使用进步自然语言处理提供学术论文的摘要。[2]语义学者团队正在积极研究人工智能的使用自然语言处理,机器学习,人机交互, 和信息检索.[3]
语义学者始于围绕主题的数据库计算机科学,地球科学, 和神经科学.[4]但是,在2017年,该系统开始包括生物医学文学在其语料库中。[4]截至2022年9月,它们现在包括来自所有科学领域的2亿多名出版物。[5]
技术
语义学者提供了一句话的摘要科学文学。它的目的之一是应对阅读移动设备上众多标题和冗长摘要的挑战。[6]它还试图确保每年发表的三百万个科学论文读者,因为据估计,只有一半的文献已被阅读。[7]
人工智能用于捕获论文的本质,并通过“抽象”技术生成它。[2]该项目结合了机器学习,自然语言处理, 和机器视觉添加一层语义分析传统方法引文分析,并提取相关数字,表,论文的实体和场地。[8][9]
与...相比谷歌学术和PubMed,语义学者旨在突出论文中最重要和最有影响力的元素。[10]AI技术旨在确定研究主题之间的隐藏联系和链接。[11]像以前引用的搜索引擎一样,语义学者还利用图形结构,其中包括微软学术知识图,施普林格大自然Scigraph和语义学者语料库。[12]
语义学者托管的每篇论文都被分配了一个独特的标识符称为语义学者语料库ID(缩写为S2CID)。以下条目是一个示例:
语义学者可以免费使用,并且与类似的搜索引擎不同(即谷歌学术)不寻找背后的材料付费墙.[13][4]
一项研究通过系统的方法比较了语义学者的搜索能力,并发现搜索引擎在尝试发现数据时的准确性为98.88%。[13]同一项研究检查了其他语义学者功能,包括调查工具元数据以及几种引用工具。[13]
用户和出版物的数量
截至2018年1月,在2017年的一个项目增加了生物医学论文和主题摘要之后,语义学者语料库包括超过4000万篇论文计算机科学和生物医学.[14]2018年3月,发展机器学习倡议亚马逊Alexa平台被雇用来领导语义学者项目。[15]截至2019年8月,包括的论文元数据数量(不是实际的PDF)已增长到超过1.73亿[16]添加后Microsoft学术图记录。[17]2020年,语义学者与芝加哥大学出版社期刊在芝加哥大学出版社(University of Chicago Press)下发表的所有文章都在语义学者的语料库中获得。[18]在2020年底,语义学者索引了1.9亿篇论文。[19]
2020年,语义学者的用户每月达到700万。[6]
也可以看看
- 引文分析 - 检查文档中引用的频率,图案和图
- 引文指数 - 出版物之间的引文索引
- 知识提取 - 从结构化和非结构化来源创建知识
- 学术数据库和搜索引擎列表
- 科学计量学 - 研究和分析科学,技术和创新
参考
- ^Eunjung Cha,Ariana(2015年11月3日)。“保罗·艾伦(Paul Allen)的AI研究小组揭幕了旨在动摇我们如何搜索科学知识的计划。尝试一下”.华盛顿邮报.存档从2019年11月6日的原始。检索11月3日,2015.
- ^一个bHao,Karen(2020年11月18日)。“ AI可以帮助您总结AI中的最新信息”.麻省理工学院技术评论。检索2021-02-16.
- ^“语义学者研究”.Research.semanticscholar.org。检索2021-11-22.
- ^一个bc苏珊娜(Suzanne)弗里克(Fricke)(2018-01-12)。“语义学者”.医学图书馆协会杂志.106(1):145–147。doi:10.5195/jmla.2018.280.ISSN 1558-9439.S2CID 45802944.
- ^Matthews,David(2021年9月1日)。“淹没在文献中?这些智能软件工具可以帮助”.自然。检索9月5日2022.
...语义学者汇编的公开语料库(由华盛顿西雅图的艾伦人工智能研究所于2015年成立的工具,总计约2亿篇文章,包括预印本。
- ^一个b毕业生,彼得(2020年11月24日)。“ AI工具总结了句子中的冗长论文”.技术Xplore。检索2021-02-16.
- ^“艾伦学院的语义学者现在正在搜索1.75亿个学术论文”.VentureBeat。 2019-10-23。检索2021-02-16.
- ^Bohannon,John(2016年11月11日)。“计算机程序刚刚排名现代最具影响力的大脑科学家”.科学.doi:10.1126/science.aal0371.存档从2020年4月29日的原始。检索11月12日2016.
- ^克里斯托弗·克拉克(Christopher Clark);Santosh Divvala(2016)。pdffigures 2.0:研究论文的采矿数字.第16届ACM/IEEE-CS数字图书馆联合会议论文集.ISBN 978-1-4503-4229-2.WikidataQ108172042。
- ^“语义学者”.国际语言与文学研究杂志。检索2021-11-09.
- ^Svetla Baykoucheva(2021)。在数字时代驱动科学信息发现。 Chandos出版。 p。 91。ISBN 978-0-12-823724-3.
- ^Jose,Joemon M。;Yilmaz,Emine;Magalhães,João;卡斯特尔,巴勃罗;费罗,尼古拉;Silva,MárioJ。;马丁斯,弗拉维奥(2020)。信息检索的进展:第42届欧洲IR研究会议,ECIR 2020,里斯本,葡萄牙,4月14日至17日,2020年,第I部分。瑞士查特:施普林格。p。254。ISBN 978-3-030-45438-8.
- ^一个bc汉诺斯(Abdelhakim)(2021)。“搜索有关软件工程二级研究的相关论文:语义学者的覆盖范围和识别角色”.IET软件.15(1):126–146。doi:10.1049/sfw2.12011.ISSN 1751-8814.S2CID 234053002.
- ^“ AI2扩展语义学者搜索引擎以涵盖生物医学研究”.Geekwire。 2017-10-17。存档从2018-01-19的原始。检索2018-01-18.
- ^“科技举动:艾伦学院聘请亚历克斯机器学习领导者;微软主席担任新的投资者角色;还有更多”。 Geekwire。 2018-05-02。存档来自2018-05-10的原始。检索2018-05-09.
- ^“语义学者”.语义学者.存档来自2019年8月11日的原始。检索8月11日2019.
- ^“ AI2与Microsoft Research联手升级搜索工具进行科学研究”.Geekwire。 2018-12-05。存档从2019-08-25的原始。检索2019-08-25.
- ^“芝加哥大学出版社加入了500多家与语义学者合作的出版商,以改善搜索和可发现性”.RCNI公司有限公司。检索2021-11-22.
- ^邓恩,阿德里亚娜(2020年12月14日)。“语义学者在2020年通过新出版商合作伙伴关系增加了2500万篇科学论文”(PDF).语义学者。检索11月22日,2021.