计算机科学家由舞台人数和台词数量解读莎翁

“悲剧将人生的有价值的东西毁灭给人看,喜剧将那无价值的撕破给人看”,熟悉鲁迅的人都知道这句著名的评价。我们欣赏戏剧的同时,总是习惯于把它们分成悲剧和喜剧,基于戏剧内容的分类也并不困难。然而现代的计算机科学家总是能想出一些新奇的研究方法,你能想象通过不同时间舞台上的人数来区分悲剧和喜剧吗?Douglas Duhaime做到了,他运用自定义的XML架构(XML schema)技术,展示了对莎翁戏剧全新的分类方法——基于舞台人数的方法。

暴风雨(1611)的图例

这是对《暴风雨》的分析图例,横坐标通过字数表示戏剧的时间流,纵坐标表示舞台人数。当然只看一部戏剧我们看不出什么名堂。再看看他对所有莎翁戏剧的分析图例:

图中红色的是喜剧,绿色是历史剧,蓝色是悲剧。通过对所有类型戏剧的统计处理,他得到了莎翁三种类型的三种图例表示:

通过该图,我们可以发现就人数而言,悲剧和喜剧区别主要在于,对于喜剧而言,舞台上大部分情况下的人数是3-4人,而悲剧的人数多为2-3人。然而其他部分悲剧、喜剧并没有呈现明显的区别。

该研究还发现,莎翁戏剧中最令人难忘的人物,往往出场时间和台词是最多的,这是因为我们因为“出镜率”高而记住某个人,还是因为莎翁有意希望我们记住这些人而让他们频繁登台,这个问题值得我们细仔细琢磨。该研究还有个有趣的发现,就是喜剧往往比悲剧和历史剧要短,而且包含更多的女性角色的对话,这表明了莎翁对女性优雅美丽的赞美吧!

仅是舞台人数和台词数量,就可以从一个新的角度解读莎翁,这就是数字人文的魅力!