数字人文科学

数字人文科学( DH )是计算或数字技术与人文学科的交集的学术活动领域。它包括在人文学科中系统地使用数字资源,以及对其应用的分析。 DH可以定义为涉及协作,跨学科和计算参与的研究,教学和出版的新奖学金方式。它将数字工具和方法带入对人文科学的研究,并认识到印刷单词不再是知识生产和分发的主要媒介。
通过生产和使用新的应用程序和技术,DH使新的教学成为可能,同时研究并批评这些教学如何影响文化遗产和数字文化。 DH也用于研究。因此,DH的一个独特特征是它培养了人文与数字之间的双向关系:该领域既采用技术来追求人文研究,并且经常同时同时进行人文质疑和审讯。
定义
数字人文科学的定义是由学者和从业者不断提出的。由于该领域正在不断增长和变化,因此具体的定义可能会迅速过时或不必要地限制未来的潜力。数字人文学科(2016年)中的第二卷辩论承认了定义领域的困难:“与数字档案,定量分析和曾经表征该领域的工具构建项目一起,DH现在涵盖了广泛的方法和广泛的方法和范围实践:大型图像集的可视化,历史文物的3D建模,“天生的数字”论文,主题障碍行动主义及其分析,替代现实游戏,移动创造者空间等等。在所谓的“大帐篷” DH中,它可以有时很难以任何特殊性确定数字人文学科的工作需要什么。”
从历史上看,数字人文科学是根据人文计算而发展的,并与其他领域(例如人文计算,社会计算和媒体研究)相关联。从具体的角度来看,数字人文学科包括各种主题,从策划主要来源的在线收集(主要是文本)到大型文化数据集的数据挖掘到主题建模。数字人文学科既包含数字化(修复)和出生的数字材料,并将传统人文学科的方法(例如修辞,历史,哲学,语言学,文学,艺术,考古学,音乐和文化研究)和社会科学与工具以及工具相结合。通过计算(例如超文本,超媒体,数据可视化,信息检索,数据挖掘,统计,文本挖掘,数字映射)和数字出版提供。数字人文科学的相关子场已经出现了,例如软件研究,平台研究和关键代码研究。与数字人文学科相关的领域包括新的媒体研究和信息科学以及媒体组成理论,游戏研究,特别是在与数字人文研究项目设计和生产以及文化分析有关的领域。每个纪律领域和每个国家都有自己独特的数字人文历史。

Berry和Fagerjord提出,重新概念性人文学科的一种方法可以通过“数字人文堆栈”。他们认为“这种类型的图表在计算和计算机科学中很常见,可以显示技术在越来越多的抽像水平中彼此“堆叠”。在这里,[他们]以更具说明性和创造性的方式使用该方法展示了可以说构成数字人文学科的活动,实践,技能,技术和结构的范围,目的是提供高级地图。”实际上,“图表可以读成底层,表明数字人文堆栈的某些基本要素,例如计算思维和知识表示,然后是后来基于这些的其他元素。”
实际上,数字人文学科中的主要区别是关注正在处理的数据。为了处理文本数据,数字人文学科基于数字版,计算语言学和自然语言处理的悠久而广泛的历史,并开发了独立且高度专业的技术堆栈(在很大程度上累积了文本编码计划的规格) 。因此,该领域的这一部分有时与数字人文科学分开,总体上是“数字语言学”或“计算语言学”。为了创建和分析对像或工件的数字版本,数字语言学家可以访问数字实践,方法和技术,例如光学角色识别,这些识别提供了使该领域适应数字时代的机会。
历史
数字人文科学从人文计算领域降到了1940年代和50年代,始于1946年的耶稣会学者罗伯托·布拉(Roberto Busa)的开创性工作,以及1950年代初的英国教授约瑟芬·里里·里里(Josephine Miles)。与IBM合作,Busa和他的团队与托马斯·阿奎那( Thomas Aquinas )的著作(称为索引thomisticus)创造了一个计算机生成的一致性。 Busa的作品已由Julianne Nyhan和Marco Passarotti收集和翻译。其他学者开始使用大型机计算机来自动化诸如单词搜索,排序和计数之类的任务,这比使用手写或键入索引卡从文本中处理信息要快得多。 Gerhard Sperl在奥地利使用Zuse用于数字化集合学的计算机也取得了类似的第一步。在数十年的时间里,考古学家,古典主义者,历史学家,文学学者以及其他学科中的各种各样的人文研究人员都应用了新兴的计算方法来转变人文学科学术。
正如塔拉·麦克弗森(Tara McPherson)所指出的那样,数字人文学科还继承了从1960年代和1970年代后期开始,通过许多艺术和理论交往,通过许多艺术和理论交往发展。这些范围从诸如Siggraph等组织开发的研究到Charles和Ray Eames等艺术家以及EAT成员(艺术与技术实验)等艺术家的创作。 Eames and Eat探索了新生的计算机文化和创意作品中的中间性,这些创新与艺术相吻合。
数字人文科学中的第一个专业期刊是计算机和人文科学,该期刊于1966年首次亮相。计算机应用和定量方法(CAA)协会成立于1973年。文学和语言计算协会(ALLC)和协会的协会然后分别于1977年和1978年建立了计算机和人文科学(ACH)。
很快,需要制定标准化协议来标记数字文本,并开发了文本编码计划(TEI)。 TEI项目于1987年启动,并于1994年5月发布了TEI指南的第一个完整版本。TEI帮助塑造了电子文本奖学金领域,并导致了可扩展的标记语言(XML),这是用于数字编辑的标签方案。研究人员还开始尝试围绕链接和节点构建的数据库和超文本编辑,而不是标准的线性印刷惯例。在90年代,美国人文计算中心出现了主要的数字文本和图像档案(例如,女性作家项目,罗塞蒂档案馆和威廉·布雷克档案馆),这证明了文本编码文本编码的文学作品的精致和鲁棒性。个人计算和全球网络的出现意味着数字人文科学的工作可能越来越不关心文本,而更多地以设计为中心。互联网的多媒体性质使数字人文学科除文本外还可以合并音频,视频和其他组件。
从“人文计算”到“数字人文科学”的术语变化归因于约翰·恩斯沃思,苏珊·施雷布曼和雷·西门子,他们作为选集的编辑数字人文科学的伴侣(2004年) ,试图阻止该领域被视为为“仅数字化”。因此,混合术语在诸如修辞和组成之类的领域之间产生了重叠,该领域使用“研究数字对象的当代人文学科方法”和数字人文科学,该数字人文使用“数字技术研究传统人文对象”。在人文,艺术和社会科学中,计算系统的使用以及计算媒体的研究通常被称为“计算转弯”。
2006年,国家人文基金会(NEH)启动了数字人文倡议(2008年更名为数字人文科学办公室),该计划在美国广泛采用了“数字人文科学”一词。
数字人文学科从其以前的利基地位出现,并在费城举行的2009年MLA大会上成为“大新闻”,在那里,数字人文主义者将“一些最活跃,最明显的贡献”所做的,并将其田野称为“第一个'下一个大事'在很长的时间。”
2018年11月,第10届全球彼得·德鲁克论坛(Peter Drucker)论坛是关于:“管理”的主题。人类维度”。在其中介绍的文章中,在数字人文科学领域留下了痕迹的文章是:
值和方法
尽管数字人文学科的项目和计划是多种多样的,但它们通常反映出共同的价值和方法。这些可以帮助理解这一难以定义的领域。
值
- 批判性和理论
- 迭代和实验
- 协作和分发
- 多模式和表演
- 开放和访问
方法
- 增强的关键策展
- 增强版和流畅的文字性
- 比例:大量定律
- 远处/关闭,宏观/微观,表面/深度
- 文化分析,聚集和数据挖掘
- 可视化和数据设计
- 位置研究和厚实的映射
- 动画档案
- 分布式知识生产和表演访问
- 人文游戏
- 代码,软件和平台研究
- 数据库纪录片
- 可重新设置的内容和混音文化
- 普遍基础设施
- 无处不在的奖学金
为了保持开放和可访问的价值,许多数字人文学科项目和期刊都是开放式访问和/或在创意共享许可下的开放访问权限,显示了该领域的“对开放标准和开源的承诺”。 Open Access旨在使任何具有Internet设备和Internet连接的人都可以查看网站或阅读文章,而无需付款以及与适当的权限共享内容。
数字人文学者使用计算方法来回答现有的研究问题,或者挑战现有的理论范例,产生新的问题并开创了新方法。一个目标是将计算机技术系统地整合到人文学者的活动中,就像当代经验社会科学中所做的那样。然而,尽管数字人文学科对网络和多模式的知识形式有着重大趋势,但大量数字人文科学以将领域的工作与媒体研究,信息研究,传播研究和社会学中的数字研究与数字研究区分开来关注文档和文本。数字人文科学的另一个目标是创建超越文本资源的奖学金。这包括整合多媒体,元数据和动态环境(请参阅弗吉尼亚大学影子谷,南加州大学的动态白话文化与技术杂志,或哈佛大学的数字先驱项目) 。越来越多的数字人文研究人员正在使用计算方法来分析大型文化数据集,例如Google Books Corpus。人文科学的高性能计算竞赛强调了此类项目的例子,并由数字人文科学办公室在2008年发起,也是由NEH与NSF合作的2009年和2011年组织的数据挑战,并与JISC与JISC合作。英国和加拿大的SSHRC 。除书籍外,还可以通过大数据方法对历史报纸进行分析。对大量历史报纸内容的分析表明,如何自动发现周期性结构,并在社交媒体上进行了类似的分析。作为大数据革命的一部分,基于数以百万计的文档和历史文献编写的文学汉语中的文本挖掘方法分析了性别偏见,可读性,内容相似性,读者偏好甚至情绪。
数字人文学科还参与了软件的创建,并提供了“生产,策划和与“天生数字”并生活在各种数字环境中的知识互动的环境和工具。”在这种情况下,该领域有时被称为计算人文科学。

工具
数字人文科学学者使用各种数字工具进行研究,这些工具可能在像移动设备一样小的环境中或与虚拟现实实验室一样大。 “创建,发布和合作与数字奖学金的环境都包括从个人设备到机构,软件再到网络空间的所有内容”。一些学者使用先进的编程语言和数据库,而另一些学者则根据其需求而使用不太复杂的工具。 DIRT(数字研究工具目录)为学者提供数字研究工具注册表。 Tapor(用于研究的文本分析门户)是通往文本分析和检索工具的门户。在线文本分析程序的一个可访问的,免费的示例是旅行工具,该工具仅要求用户复制和粘贴文本或URL,然后单击“显示”按钮以运行该程序。还有一个在线或可下载的数字人文工具的在线列表,这些工具基本上是免费的,旨在帮助学生和其他缺乏资金或机构服务器的人。 WordPress和Omeka (例如WordPress)的免费开源Web发布平台也是流行的工具。
专案
数字人文学科项目比传统人文学科更有可能涉及团队或实验室,该项目可能由教职员工,员工,研究生或本科生组成,信息技术专家以及画廊,图书馆,档案馆和博物馆的合作伙伴。信用和作者经常被授予多个人来反映这种协作性质,这与传统人文科学的独家作者模型不同(更像是自然科学)。
有成千上万的数字人文项目项目,从有限或没有资金的小规模的项目到具有多年财务支持的大型大型项目。有些不断更新,而另一些则可能不是由于失去支持或兴趣而引起的,尽管它们可能仍在Beta版本或成品表格中保持在线。以下是该领域各种项目的一些示例:
数字档案
女性作家项目(始于1988年)是一个长期的研究项目,旨在通过电子稀有文本收集来使维多利亚女性作家更容易获得。沃尔特·惠特曼档案馆(Walt Whitman Archive)(始于1990年代)试图创建惠特曼作品的超文本和学术版,现在包括照片,声音以及惠特曼批评的唯一全面的当前参考书目。艾米丽·迪金森(Emily Dickinson)档案馆(始于2013年)是狄金森(Dickinson)诗歌手稿的高分辨率图像,以及诗歌中出现的9,000多个单词的可搜索词典。
由简·兰德斯(Jane Landers)执导并在范德比尔特大学(Vanderbilt University)主持的奴隶社会数字档案馆(以前是奴隶社会的教会和世俗资源),保存危害与非洲人和非洲社会非洲人有关的濒临灭绝的教会和世俗文件。该数字档案馆目前拥有500,000张独特的图像,可追溯到16世纪至20世纪,并记录了6至800万个人的历史。它们是大西洋世界中非洲人历史上最广泛的连续记录,还包括与与之同住的土着,欧洲和亚洲人口的宝贵信息。
图书馆员和档案管理员的参与在数字人文项目中起着重要的作用,因为其角色最近的扩大,因此现在涵盖了数字策划,这对于保存,促进和获取数字收藏至关重要学术对数字人文学科项目的取向。一个具体的例子涉及倡议的情况,档案管理员通过评估,实施和定制图书馆收藏的元数据模式来帮助学者和学者来建立他们的项目。
墨西哥国家自治大学的举措是数字人文项目的另一个例子。其中包括17世纪手稿的数字化,墨西哥历史的电子语料库,从16到19世纪,以及3-D中西班牙裔考古遗址的可视化。
文化分析
“文化分析”是指使用计算方法来探索和分析大型视觉收集以及当代数字媒体。该概念是由Lev Manovich于2005年开发的,Lev Manovich随后在2007年在加利福尼亚电信和信息研究所的高通研究所(Calit2)建立了文化分析实验室。该实验室一直在使用计算机科学领域的方法,称为计算机视觉的许多类型的历史和当代视觉媒体,例如, 《时代》杂志的所有封面杂志在1923年至2009年之间发表,现代博物馆收藏的20,000张历史艺术照片纽约的艺术(MOMA),漫画书中的一百万页,在17个全球城市的Instagram上共享1600万张图像。文化分析还包括使用媒体设计和数据可视化中的方法来创建交互式视觉接口,以探索大型视觉收集,例如自我意识,自我性和百老汇。
文化分析研究还解决了许多理论问题。我们如何“观察”当今创建的用户生成和专业媒体内容的巨大文化世界,而不将其减少为平均,离群值或现有类别?如何使用大型文化数据可以帮助我们质疑有关文化的刻板印象和假设?使用新的大型,速度和连通性研究全球数字文化需要哪些新的理论文化概念和模型?
现在,许多其他研究人员都使用了“文化分析”(或“文化分析”)一词,这是由两次学术研讨会举例说明的,这是UCLA的四个月长的研究计划,汇集了来自大学和行业实验室的120名主要研究人员,这是一个,这是一个。学术同行评审文化分析杂志:成立于2016年的CA和学术工作清单。
文本采矿,分析和可视化
Wordhoard(始于2004年)是一个免费的应用程序,它使学术但非技术用户可以以新的方式阅读和分析,其中包括早期的希腊史诗,乔uc ,莎士比亚,莎士比亚和Spenser的典范。信件共和国(始于2008年)试图通过交互式地图和可视化工具来形象化启蒙作家的社交网络。网络分析和数据可视化还用于对现场本身的反思 - 研究人员可能会从有关数字人文学者和项目的数据中生成社交媒体互动的网络图或信息图表。

文档在其时代(dict)分析样式和在线演示工具中允许以交互式方式让用户知道在创建文本时,作者在输入文本中使用的词汇是频繁的Neologisms,并可以在经历了相当大的语义变化的文本中检测术语。
分析文化变革的宏观趋势
培养物学是一种计算词典学的一种形式,通过对数字化文本的定量分析来研究人类行为和文化趋势。研究人员数据挖掘了大型数字档案,以调查语言和单词使用中反映的文化现象。该术语是2010年科学文章中首先描述的美国新博物主义,该文章使用数百万本书,由哈佛大学研究人员让·巴蒂斯特·米歇尔(Jean-Baptiste Michel)和埃雷斯·利伯曼·艾登(Erez Lieberman Aiden)合著。
一项2017年的研究发表在美国美国国家科学院会议录中,比较了2010年科学文章的两本数字化书籍中的N克的轨迹与在联合的大量区域报纸中发现的书籍。王国在150年的时间里。该研究进一步使用了更先进的自然语言处理技术来发现历史和文化的宏观趋势,包括性别偏见,地理重点,技术和政治,以及针对特定事件的准确日期。
数字人文科学的应用可以与其他非人文学科领域(例如纯科学,农业,管理等)一起使用,以生成各种实用解决方案,以解决工业和社会中的问题。
在线出版
斯坦福大学的哲学百科全书(始于1995年)是该领域学者维护的术语,概念和人们的动态参考工作。 MLA Commons提供了一个开放的同行评审站点(任何人都可以发表评论),用于他们正在进行的人文学科中数字教学法中的教学文物集合:概念,模型和实验(2016年)。数字人文平台上的辩论包含同一标题的开放访问书籍(2012年和2016年版),并允许读者通过将句子标记为有趣或将术语添加到众包索引中来与材料进行交互。
Wikimedia项目
例如,一些研究机构与Wikimedia基金会或社区的志愿者合作,以通过Wikimedia Commons提供自由许可的媒体文件,或将数据集链接或加载数据集与Wikidata链接或加载数据集。文本分析已经进行了有关Wikipedia或其姊妹项目的文章贡献历史的贡献。
批评
2012年,Matthew K. Gold确定了对数字人文科学领域的一系列感知批评:“缺乏对种族,阶级,性别和性别问题的关注;偏爱以研究为导向的项目而不是教学项目;缺席;政治承诺;其从业者之间的多样性不足;无法解决版权下的文本;以及资金丰富的研究大学的制度集中”。同样,Berry和Fagerjord也认为,数字人文学科应该“专注于对计算想像的含义进行批判性思考,并在这方面提出一些问题。这也是嵌入政治和规范的重要性。数字技术,算法和软件。我们需要探讨如何在文本的近距离阅读和遥远的读物之间进行谈判,以及如何在人文主义工作中有效地调和微分析和宏观分析。”艾伦·刘(Alan Liu)辩称:“虽然数字人文主义者开发了工具,数据和元数据,因此(例如,辩论内容对象的原则的有序层次结构;争议计算是否最佳地用于真理,还是作为Lisa Samuels和Jerome McGannn和Jerome McGannn说,“畸形”;等等)很少会将批评扩展到社会,经济,政治或文化的完整登记册。”其中一些问题引起了关键数字人文科学(CDH)的新兴子领域:
一些关键问题包括:我们如何使无形的软件研究变得可见?通过代码和软件进行调解时,知识如何转换?大数据,可视化,数字方法等的关键方法是什么?计算如何创建新的学科边界和门户保存功能?数字“ Geons”,“ Pixels”,“ Waves”,“可视化,视觉修辞学等”的新霸权表示?媒体变化如何创造认识论变化,以及如何在计算界面的“屏幕本质主义”背后看?在这里,我们还可以反思可见的实践的方式也需要使得可让您不可思议 - 计算涉及对要捕获的内容做出选择。
负面宣传
劳伦·克莱因(Lauren F. Armand Leroi在《纽约时报》上写道,讨论了对文学文本中主题的算法分析与哈罗德·布鲁姆(Harold Bloom)的作品之间的对比,后者在定性和现象学上分析了文学的主题,随着时间的流逝。 Leroi质疑数字人文学科是否可以对文学和社会现象进行真正的强大分析,或者对它们提供新颖的替代观点。文学理论家斯坦利·菲什(Stanley Fish)声称,数字人文学科追求革命性的议程,从而破坏了常规标准的“预科,权威和学科权力”。但是,数字人文学科学者指出:“数字人文科学是传统知识技能和方法的扩展,而不是对它们的替代者的替代。其独特的贡献并没有消除过去的见解,而是添加和补充人文学科对人文的长期承诺学术解释,知情研究,结构化的论证和实践社区中的对话”。
一些人称赞数字人文科学是为了解决人文科学中明显问题的解决方案,即资金下降,辩论的重复以及一组褪色的理论主张和方法论论点。亚当·基尔希(Adam Kirsch)在新共和国写道,称这是数字人文科学的“虚假承诺”。尽管其余的人文科学和许多社会科学部门的资金或声望下降,但数字人文科学一直在看到越来越多的资金和声望。数字人文学科的负担负担了新颖的问题,要幺将其作为人文科学的革命性替代品,要幺通常是构想的,要幺是旧瓶子中的新葡萄酒。柯希(Kirsch)认为,数字人文学科从业人员遇到了成为营销人员而不是学者的问题,他们比实际进行新的分析更能证明其研究的宏伟能力,而当他们进行新的分析时,只有进行琐碎的客厅研究技巧。其他人重复了这种批评形式,例如在卡尔·斯陶森(Carl Staumshein)中,在高等教育中写道,后者称其为“数字人文泡沫”。在同一出版物的后期,施特劳姆申(Straumshein)声称,数字人文科学是人文科学的“团体主义重组”。有些人认为,数字人文与商业的联盟是一个积极的转变,这会导致商业世界更加关注,从而引起人文学科所需的资金和关注。如果它不被数字人文学科的头衔负担,它可能会避免指控它是精英和不公平的资助。
黑盒子
学者们还批评了使用数字人文工具的使用,他们不完全了解他们输入的数据会发生什么,并对无法充分检查错误的“黑框”对“黑匣子”过多信任。加州大学洛杉矶分校信息研究系教授约翰娜·德鲁克(Johanna Drucker)批评了数字人文学者和一般公众使用的流行可视化工具和技术(例如Google的N-Gram图)中普遍存在的“认识论谬论” ,称一些网络称图表和主题建模工具“对于人文主义工作来说太粗糙了”。她认为,这些程序中缺乏透明度掩盖了数据及其处理的主观性质,因为这些程序“基于用于屏幕显示的常规算法生成标准图...对具有明显的数据处理。”
多样性
在数字人文科学的实践者中,最近在种族和/或身份政治发挥的作用上也引起了一些争议。塔拉·麦克弗森(Tara McPherson)将数字人文科学中的一些种族多样性归因于UNIX和计算机本身的模式。 dhpoco.org上的一个公开主题最近在数字人文科学的种族问题上获得了超过100条评论,学者们争论种族(和其他)偏见会影响可用于数字人文研究的工具和文本的数量。麦克弗森认为,即使分析主题似乎与种族无关,也需要对数字技术和种族的含义有一种理解和理论化。
艾米·E·埃哈特(Amy E.以前丢失或排除的作品在互联网上提供了新家,但是在传统人文科学中发现的许多相同的边缘化做法也发生在数字上。根据厄哈特(Earhart)的说法,“需要研究我们作为数字人文主义者正在建造的佳能,这是一个偏向传统文本的佳能,不包括女性,有色人种和LGBTQ社区的重要工作”。
访问问题
数字人文学科的从业者也无法满足残疾用户的需求。乔治·H·威廉姆斯(George H. Williams)认为,普遍的设计对于从业者提高可用性至关重要,因为“许多原本有价值的数字资源对于例如摔人或难以听见的人以及对盲人的人来说都是无用的。视力低下,或者很难区分特定的颜色。”为了成功地提供可访问性和富有成效的通用设计,重要的是要了解为什么以及如何以及如何使用数字资源使用数字资源,同时记住所有用户都以不同的方式满足他们的信息需求。
文化批评
数字人文科学不仅忽略了人文科学中传统的血统和历史问题,而且缺乏定义人文科学的基本文化批评。但是,为了成为人文,人文学科本身是否必须与文化批评相关,还有待观察。科学可能会认为,数字人文学科是对人文和社会科学的非量化方法的可喜改进。
评估困难
随着领域的成熟,人们已经认识到,工作的学术同行评审的标准模型可能不足以适合数字人文学科项目,这通常涉及网站组件,数据库和其他非印刷对象。因此,对质量和影响的评估需要结合新的和新的同行评审方法。一种回应是创建了DHCommons Journal 。这接受非传统提交,尤其是中期数字项目,并提供了一种创新的同行评审模型,更适合数字人文研究项目的多媒体,跨学科和里程碑式驱动的性质。其他专业人文组织,例如美国历史协会和现代语言协会,也制定了评估学术数字奖学金的指南。
缺乏对教学法的关注
2012年在数字人文学科中的辩论认识到,教学法是“ DH的“继子”的“继子”,其中包括有关数字人文学科的整个部分。部分原因是人文学科的赠款更旨在通过可量化的结果进行研究,而不是教授更难衡量的创新。为了认识到需要在教学领域获得更多奖学金的必要性,编辑的数字人文教学法已出版,并提供了案例研究和策略,以解决如何在各个学科中教授数字人文方法。