联系主管:qq89731

新闻中心

66顺一种叙述中讨论的地方的地图

多年来,人文学者一直致力于将计算技术融入到他们的研究中。这些努力——“数字人文”——激发了公众的辩论,远远超出了研究人员的数量或研究结果的范围。P.T. Barnums和Chicken Littles已经宣称计算将标志着人文探索的结束。这方面的实际文学研究表明,情况并非如此。
这些工作大部分是由工具而不是问题驱动的;当学者们掌握了操纵大量文本的手段时,他们就会摆弄这些数据,看看会发生什么。在数字项目确实有明确的目标的情况下,它们往往会产生可识别的人文主义产品,比如新版本的一本书,一种叙述中讨论的地方的地图,或作者对以前匿名文本的署名。
文学学者弗兰科·莫雷蒂(Franco Moretti)和他的同事,最著名的是马修·赛克斯(Matthew Jockers),都是例外:他们的“远读”项目,在十多年的时间里稳步发展,有一个雄心勃勃的非传统目标。在其最有力的表述中,它试图通过对所有现存的文学文本的定量研究来解释长期的文学稳定模式和变化。形式的改变包括大发展,比如小说流派的兴衰,已经被批评,但也很多小的变化,如改变句子结构,逐渐出现的主题,或表示位置的介词使用的增加,很容易检测到的统计数据,但人类的读者大多是不明显的。骑师在小说情节上的新研究表明,几乎所有的小说都符合半打基本结构,这源于对单个句子的情感情绪的许多小尺度的测量。
这无疑是科学的抱负。不幸的是,很少有科学家或社会科学家注意到这一工作,而人文主义者则以一种极具党派色彩的方式对此做出回应。主要的困难在于两个截然不同的问题被模糊了。首先是对人文探究目标的合理分歧。但批评家和支持者都倾向于直接跳到另一个更大的冲突,即大学的转型和人文学科在教育和学术生活中的适当地位。这些都是重要的价值问题;然而,这些数字人文主义者的工作不应该被期望回答。
这个认真的科学项目的结果好坏参半。莫雷蒂和骑师显然很热情,而且在许多情况下他们的发现是有趣和令人惊讶的。(作为一个经常阅读学术社会科学的人,我希望有更多的学者能让统计数据看起来如此令人兴奋。)但也存在严重的概念上的困难。虽然这项工作对文学的变化提出了广泛的新描述,但它并没有令人信服地解释这种变化的原因。现有的证据还不足以解释这一现象。在这些作品中使用的统计数字主要是描述性的,这些描述中的信仰是有限的。表或图被当作要被解释的对象。在这个和许多其他方面,遥远的阅读仍然是一种被认可的人文实践。
远程阅读的前提很简单:大多数文学学者只知道几十个作品,而且他们大概有几百个。但是,现存的作品,在给定的语言时期,比如19世纪的英语文学,可能是成千上万的数字。这一语料库可能与引起学者注意的作品有显著差异;事实上,因为批判性的注意力是根据他们感知到的意义来引导书籍的,所以一本好书和一本平庸的书之间的区别可能是相当大的。如果目标是随着时间的推移追踪变化或发现情节模式,那么普通的书籍可能会揭示出优秀的人所不能做到的。所以,也可以注意比整本书更小的文本单元。一个学者不能读成千上万的书,也不能读成千上万的句子,但可以用统计学来描述他们的一些特性。以这种方式思考书籍可以促使学者们以不同的方式对待文本;莫雷蒂的一些最有趣的发现根本不需要一台电脑。
在数字人文学科中,数据本身就是一个被“读”的对象,就好像它是一个文本。
在许多情况下,计算技术证实了传统学术已经得出的结论。在《时尚》杂志上,莫雷蒂使用了一份7000本书的目录来展示十八世纪的小说有很多繁琐的标题。骑手们装备着数千本小说的全文,发现《白鲸》主要讲述的是一艘捕鲸船上的生活。事实上,Jockers的宏观分析的一个公平部分就是要证明,计算技术能够再现由训练有素的读者做出的判断。例如,有一章规定,他的技术可以准确地识别出小说的类型。这些看似琐碎的发现让亚当•基尔希(Adam Kirsch)等批评人士嘲笑了一番,但骑师们谦虚地表示,复制已知的发现是一种科学的美德。此外,如果计算方法不能证实我们已经知道的事实,那么就没有理由去考虑更多的冒险的主张。
莫雷蒂和骑师们确实提出了新的要求。“文学的屠场”是莫雷蒂作为一名经验学者的“新开端”的一篇文章,旨在解释为什么阿瑟·柯南·道尔在一段时期内作为杰出的神秘作家幸存下来,而这一时期的小说尤其受欢迎。在一项令人难忘的调查中,莫雷蒂根据他们的线索使用了神秘故事。他发现,获胜的公式为读者提供了清晰易懂的线索,也为解开谜团提供了必要的线索。(许多其他的神秘作家在使用线索方面也出奇地笨拙。)在《网络理论,情节分析》中,莫雷蒂绘制了哈姆雷特中所有人物之间的社会联系网络。他发现,剧中复杂而血腥的结局是由一个简单的网络结构引起的:死亡的人物是那些与哈姆雷特和克劳迪斯都有互动的人。骑师也有很多贡献。在他自己的专业《爱尔兰文学》中,他展示了许多关于爱尔兰裔美国文学的根深蒂固的批判信仰——以及爱尔兰在美国的经历——源于学者们对主要是关于东部城市生活的文本的关注。这幅画的变化很大,但大部分都忽略了爱尔兰人在美国西部的经历。
随着宏观分析的深入,骑手的统计技术的复杂性和应用范围不断增加。在他最后的经验章节“影响力”中,他给出了这些工具在音乐会上能做些什么。从18和19世纪的3,346部小说中,他计算了578个变量的值,包括主题相关词汇的频率(“主题”)和语体特征,如句子长度、语法从句的种类和标点符号的使用。每一个维度上的书籍之间的差异可以理解为抽象空间中的距离。例如,在“印第安人”这个话题上,詹姆斯·费尼莫尔·库珀(James Fenimore Cooper)的《杀鹿人》(the Deerslayer)将会得分很高,而简·奥斯丁(Jane Austen)的曼斯菲尔德公园(Mansfield Park)的得分很低,使他们在这个维度上显得很遥远。在所有578维度之间的距离产生了一种复杂的度量,度量了书籍之间的相似性。然后,Jockers将这些书按出版日期组织起来,产生了一种近似的文学影响力:一个有影响力的作品接近于另一个在抽象空间的作品,并在时间之前。
一些结果并不令人意外。同一性别的作者倾向于写类似的作品,而写在同一时间的小说往往是相似的。人类读者会发现,相似的作品确实是相似的:《近白》是梅尔维尔的其他作品,还有詹姆斯·费尼莫尔·库珀和埃德加·爱伦·坡的小说《亚瑟的故事》。
宾的楠塔基特岛。其他结果是挑衅。最具影响力的作品是劳伦斯·斯特恩的《崔斯特瑞姆·沙迪》、乔治·吉辛的《漩涡》和本杰明·迪斯雷利的《威尼斯人》,这些学者在英国小说的发展中并没有起到决定性的作用。骑师们承认这一令人困惑的结果。我建议部分解释:这里的分析不能解决许多作者可能独立地采用一组新的主题的可能性。第一个这样做的人似乎会受到骑师们的影响,但可能只有先见之明,才会对最近发生的历史事件——比如法国大革命——进行重要或快速的报道。
因此,莫雷蒂和骑师们可以重现一些基本的关键发现,并产生一些看似合理和有意义的新结果。但大部分是失踪。
首先,没有足够的训练有素的学者使用数字技术进行更系统的调查。由于这个原因,骑师的教科书,文本分析与R为学生的文学,可能证明比宏观分析更持久的重要性。由于在人文学科中关于计算的争论,一个成功的编程教科书不能简单地教编程;文本分析虽然在范围上不大,但却显示出一种良好的心理理解。骑师们很欣赏那些希望涉足编程的学者们可能不愿意参加一场革命,所以他强调了计算与传统人文调查相结合的多种方式,并向他的读者保证,计算机永远不会取代专业的读者。此外,骑师们了解到学习计算机编程和统计并相应地设计书籍是多么的困难。没有编程经验的读者将能够跟随。他们也会得到近乎即时的满足:从第二章开始,这些练习帮助学生写出关于真正的文学作品的有意义的结果。
任何介绍性的工作都必须缺少一些东西,特别是如果它是针对那些对企业价值有疑问的学习者。在这种情况下,主要的省略是讨论正在使用的统计方法。尽管骑手对相关的统计数据有很好的把握,但在这方面的遗漏与文献计算研究的广泛弱点是一致的。莫雷蒂和其他与斯坦福的文学实验室有关的作品对统计数据的信心不足,这一点在阅读实验室的免费小册子系列时变得尤为明显。通常的方法可能被称为“描述和解释”。也就是说,这些数据将被用来以图形或图形的形式生成描述性的摘要,然后被研究者当作一个对象来“读”,就好像它是一个文本。(事实上,在2011年的维多利亚时期的研究中,文学实验室的成员谈论“学习阅读”统计数据的方式类似于对文学文本的解读。)这些描述性的陈述通常是信息丰富的,但是批判性的直觉,而不是推理的统计方法,被用来得出结论。
当莫雷蒂和他的同事们注意到他们的研究所产生的量化措施时,他们往往会注意到错误的:统计意义。粗略地说,重要性指的是在数据中观察到的模式可能是偶然产生的低概率。然而,在大型数据集中,许多观察到的模式将会根据标准的度量标准而显著。结果,模式可能具有统计学意义,但实质上是微不足道的:差异的大小(“效应大小”)可能非常小,或者如果研究人员调整模型,它可能完全消失。
在许多学科中,对研究的批评越来越多,这些研究关注的是研究结果的具体意义,或研究设计的连贯性。《研究生医学教育杂志》的编辑对使用这种统计数据的医学研究人员发表了坦率的评论:“效果的大小是定量研究的主要发现。”《基础与应用社会心理学》(The journal Basic and Applied Social Psychology)已经完全禁止了显著性测试,理由是它导致了社会心理学中不可重现的高水平的不可复制的研究。由于数值结果,包括效应大小,通常没有在计算文学研究中报告,因此很难判断许多研究结果的可靠性。
问题的关键在于,那些严肃地解释文学发展模式的学者们仍然需要解决一些方法论上的问题:如何运用特定的技术,结果意味着什么?什么是重要的,而不是具有统计学意义的发现?我们如何对影响或新流派的出现做出因果推论?这些问题目前还没有明确的答案,社会科学也在积极讨论如何利用计算技术来研究文学文本等文化产品。如果像莫雷蒂这样的文学学者是社会科学对话的一部分,那么双方都将从中受益。
与此同时,这些问题不能仅仅通过思考因果推论的性质来解决。如果对文学的计算研究是从理论出发的,那么这个问题将变得更加容易处理。我的意思是,广义地说,一个关于文学如何发展的临时的一般性解释,以及一些可以用数据来探究的具体的主张或预测。
莫雷蒂和骑师们之所以受到阻碍,是因为他们半心半意地使用两种解释:进化和社会变革。数字人文学科产生了诸如文学达尔文主义这样的粗制滥造的进化论理论,认为文学创作是一种进化的人类行为。莫雷蒂和骑师们考虑得更周到。他们用生物进化的概念来描述文学文本和体裁的变化,而不是创造它们的人。莫雷蒂写了整整一章,“进化,世界体系,Weltliteratur”,把文体上的变化比作生物物种的形成。骑师们经过长时间的告诫,质疑进化论的类比,说他“无法抗拒将这些数据比作基因组的巨大诱惑。”“他经常说文学是进化的。”这是进化解释的信号弱点:书籍不能像生物有机体那样自我复制;它们是人为活动的产物。进化推理有时会产生惊人的描述,就像莫雷蒂对线索的讨论一样。然而,从某种程度上说,这种文学观点不包括人类行为者,这是一件无法解释的伟大事情。文本没有自我。它们是由人类书写、阅读和解释的,而对于文学的历史变化的一种有说服力的解释,将需要对文学的社会方面的一些描述,包括诸如作者的做法、出版机构的实践以及阅读的经验等。简而言之,遥远的阅读需要一种理论。
一个更有前途的方法是根据产生文学的社会的变化来审视文学的发展。这种解释具有将文学与生产和消费的媒介联系起来的美德。例如,莫雷蒂和赛克斯都表明,小说体裁的寿命大体上符合代际界限。某些类型的上升和下降更快,如雅各宾和反雅各宾小说,对应重大的历史事件。人口结构的变化似乎可以解释许多文学发展模式,至少在很大程度上是这样。骑师在他的章节“风格”和“国籍”中提出,在某种程度上,体裁和语言比作者更强大,更倾向于约束他们所写的东西。他提出,这就是为什么统计规律首先存在的原因。
当然,社会结构的这些更大的特征对于那些阅读和写作的人来说几乎没有什么意义。正是在这一点上,文学学者比社会科学家有一个明显的优势。关于文化的大社会理论,在处理文学作品的内容或创作和阅读的主观体验时,是最弱的。许多计算技术都公开地对意义或经验漠不关心:如果一个模型产生了一个有用的预测,那么它就不重要了。
在这一点上,批评家们有很多东西可以提供。莫雷蒂认为,他的资产阶级,一本书或多或少与遥远的阅读同时出版,代表了一个非常不同,更传统的项目。恕我难以苟同。资产阶级是对十九世纪欧洲文学的一种解释性研究,它特别注意关键词、情感和散文的创新。尽管如此,它还是试图解释现代中产阶级的出现及其对文学的影响。虽然资产阶级使用了不同的证据,但它的精神与遥远的阅读并没有太大的不同。这类专家知识无疑将在对文学如何随时间变化的有力解释中发挥关键作用,尤其是当广泛的趋势必须与特定的群体、作者或作品相联系时。
在某些方面,我对远程阅读计划的批评是不公平的。我所说的“弱点”——提出因果关系的问题,把数据与主观经验联系起来,解释个人行动受到限制的程度,把大规模的和小规模的现象联系起来——也是过去半个世纪困扰美国社会学的核心理论挑战。这些都是在研究生研讨会上提出的反对意见。但这些困难是真实存在的,随着计算文学研究得到更广泛的关注,它将变得更加紧迫。
我已经提出了人文主义者提出的价值问题,但我希望以一个严肃的价值问题来结束:谁将从这项研究的成功中获益最多?这个企业的核心是使用计算机来理解人类如何使用语言,包括语言对人们的意义以及它如何说服人。就在斯坦福的道路上,有一个巨大的产业,它的盈利能力依赖于理解这一点。学术界和硅谷正汇聚在这片土地上:科技公司渴望雇佣研究人员,他们可以帮助他们将大量的人生成的文本转化为金钱,并渴望与学者合作,以获取学术知识的实际利益。在美国和国外,一个庞大的监控机构同样对从大量文本中提取意义和预测感兴趣。在这两种情况下,问题都不是收集数据,而是已经获得的数据,尽管人们通常不知道这些数据。问题在于,它需要社会科学家和人文主义者。
由于远程阅读的经验项目获得了更大的成功,因此,对于那些将会产生兴趣的外部各方来说,这是不可能的。Jockers肯定知道这一点:他帮助撰写了一篇颇具影响力的“法庭之友”(amicus brief for Authors Guild, Inc.)和HathiTrust(2014),这是数字人文学者和学术图书馆的重大版权胜利,也是谷歌。当然,这不会是私营企业和情报机构首次发现人性化企业的用途。Peircean符号学、包豪斯设计、新批评、爱荷华作家讲习班和后结构主义都被放在公司和政府的目的。知识分子总是迫不及待地想指出,思想具有真正的、高的利害关系。就数字人文而言,他们当然是对的。

  本文收集于网络不代表本站观点,如果您还想了解更多66顺的文章,请点击查看66顺娱乐66顺娱乐注册的其它文章,请关注66顺娱乐公司官网(www.rudse.com).

Copyright © 2014-2016 66顺娱乐平台官网 版权所有 Power by DedeCms 粤ICP备14002280号-2 网站地图

无法在这个位置找到: kefu.htm