美女作家周婉京被曝光在《取出疯石》中化用抄袭照搬了4名中外作家后,周婉京以一次行为艺术般的自杀事件加以回应——她在小红书留下长文遗书,并吞食了数百片辅助睡眠的褪黑素药物。“褪黑素”是“脑白金”的主要成分,是一种激素类药物,医学上并未发现可经验证的毒性,唯一的副作用是长期服用小几率导致不孕。在遗书中,她提及了自己的好友,前《收获》杂志编辑、小说家“走走”(原名曹亚男),这成为了之后的重要线索人物。
网络暴力逼死美人作家,这件事在小红书迅速开始发酵,但周婉京没有意识到,她踢到了一堆铁板。旅日小说家苏枕书很快凭借一张截图发现,周婉京发表在《收获》杂志的长篇小说《半玉抄》数处描写与谷崎润一郎雷同,小说家费滢发现周婉京大篇幅抄袭了马华作家黄锦树与台湾作家白先勇。而当网友们拿到《收获》杂志后,惊讶地发现,这种雷同在《半玉抄》中比比皆是。豆瓣网友自发组成了“抓周分队”,很快,更多的证据被网友曝光出来。
据网友们的不完全比对,周婉京在《半玉抄》中至少拼贴抄袭了40名中外作家、历史学家、诗人,甚至出现了整段抄袭和整页拼贴的现象,她出版的两本短篇小说集《造房子的人》和《取出疯石》也存在相同的行为,抄袭对象涵盖古今中外。这种做法被网友们形象地称为“拼好文”。
最令人错愕的并非周婉京拼贴抄袭的广度,她完全有可能是一位博览群书,且记忆力极好的人。令人百思不解的,是周婉京经常在毫无必要的地方进行原样照搬——例如“梯级巴隆巴隆响了起来”,“巴隆巴隆”则是香港作家西西发明的拟声词。倘若她抄袭的都是“胁下的白缎子小荷包”(抄袭张爱玲)这种描述性语句,我们尚且可以认为她是卡文时候的偷懒行为,但“心里动荡了一下,觉得有一股热气上冲”(张恨水)这样的语句,抄来有什么意义呢?
况且周婉京的抄袭广度也完全说不通。与许多人的臆想不同,大部分阅读量足够大的读者,尤其是写作者,都有自己严格的审美取向与阅读标准,酷爱阅读文豪作品,并同时津津有味地阅读网文的读者,多半是不存在的。甚至于两个文豪之间也会有明确的取舍,我们很难想象一个人会同时热爱纳博科夫与雷蒙德·卡佛——把纳博科夫换成海明威还勉强说得通。而周婉京的抄袭对象中,不但同时存在纳博科夫与雷蒙德·卡佛,甚至有蔡东藩这位以量大管饱的通俗历史演义闻名的民国作家。这未免太过于魔幻。
而一个偶然间发现的链接或许部分解答了这个问题:周婉京“遗书”中提及的作家走走,于2019年开发了大数据文本分析软件“谷臻小简”,可以提取小说的关键情节点并加以概括总结,分析情节起伏。这个软件原本是走走在影视公司筛选网文IP时,苦于数百万字的网文长度而与人合作开发的自然语言处理工具,然而这一工具,极有可能被用在了未曾想过的地方。
根据科幻作家,谷歌软件工程师慕明的分析,“谷臻小简”采用的应该是2019年之前常见的LDA技术,也就是将文章、段落、句子拆解成关键词语,之后通过大数据分析词语出现的频率加以判断分析归类,与目前采用的LLM模型有着本质区别。“谷臻小简”问世后,很长一段时间内的应用场景是“名著精读”系列,将数十万字的名著精简为小册子,供读者快速了解。那么它是否能够自动进行写作呢?慕明的答案是否定的,但她同时指出,这一技术的逆向运用,就是可以根据关键词语,从数据库中查找搜索出和原句结构表述近似的语句,理论上只要数据库足够大,足够全,对于写作可以起到辅助参考的作用——这就是“拼好文”技术来源基础的一种可能。
很快,豆瓣网友ilad发现,走走出版的小说集中,存在对于阿特伍德、库切、奈保尔、纳博科夫、托马斯·曼、汉德克、帕慕克、托宾等著名小说家的抄袭拼贴,其数量与周婉京相比毫不逊色,抄袭拼贴方式与周婉京如出一辙。
小说家丁颜、傅真与周婉京方式极度类似的抄袭拼贴被发现后,“谷臻小简”的存在似乎已成定局。一个未经证实的消息声称,各级作协与各高校创意写作中心已经购买了“谷臻小简”的使用权,有限地开放给体制内作家和创写班学员使用。而一个公开的消息则表明,走走很长一段时间内,都任职于华东师范大学创意写作中心,担任写作导师。