且将旧词翻新声
——也谈“一秒钟变诗人”
栏目:钟鼓楼
作者:阿极客  来源:中国艺术报

  近日,网友yixuan的一篇博文《统计词话(一) 》一石激起千层浪,引发一众原本与诗词绝缘的“死理性派”人士纷纷改行做了词人,利用该博文提供的“宋词密码” ——实际是《全宋词》中排名前一百的高频词,拿各种数理常数对应这些优美的词汇,竟也偶能做出像模像样的词来。《中国艺术报》发表专栏评论《诗文哪会随意得—— “一秒钟变诗人”现象析》 ,对此现象进行质疑。一时间,关于技术冲击传统文化的讨论铺天盖地,以至有论者称其为“现代技术对艺术的纵情解构” ,但笔者倒是觉得大可不必“为其所遮蔽的东西而焦虑” ,因为它所揭示的要远多于它所“遮蔽”的。

  执著于技术理性的人觉得诗词无非就是既有字词的排序和组合,“文章本天成,妙手偶得之” ,必然存在一种方式可以将其度量,然后通过求解优化问题作出优秀的诗词;执著于诗词传统的人认为“欲得妙于笔,当得妙于心” ,以有穷之逻辑去模拟无尽之诗意,注定失败。看似二者都很极端,但是由于各自专业背景、生活经历的不同,分别产生这样的想法都是合情合理的,不过话说回来,信息技术对于填词到底能起什么作用呢?利用频数统计进行作词是一种最粗浅的方法(但是频数统计对于宋词以及作家作品的研究却别有妙用) ,目前比较常用的方式是利用人工智能或者机器学习的方法进行探索性的求解。笔者姑且以实践者的身份对此稍作介绍。

  首先要有一个语料库,比如《全宋词》的全文分词结果,并对所有的词语进行词性、情感、音韵的标注,同时还可以对每首词进行题材的标注和知名度的统计,利用这些数据可以进行文本的关联分析和情感分析,使得系统自动“学习”出好词的标准,当然更简单直接的方式是利用数理逻辑,直接根据词语的搭配、音韵的位置、与主题的切合度等建立优化目标,然后使用遗传算法等方法求得一组解,人工从中选出质量比较高的词作。至于机器填词的质量如何,各人见仁见智,笔者的感觉是虽不如古今名家的大作,但远胜于“频数”填词的游戏之作,甚至要强于很多现代的“词人” 。

  随着技术的进步,可以预见将来会有更先进的算法和更快速的计算机,那么计算机的填词技术是否能赶上或超过诗词名家呢?在可见的未来,答案是否定的。因为现行的计算机的“思维”方式决定了有两个因素注定要掣肘,一是语料库的有限,计算机无法超出语料库的范围;二是优化规则的确定性,无论是函数式的确定规则、还是优秀词作的学习素材,都是有限的。对于人脑来说,则没有这些制约,因为词句没有限度,而美的感觉没有固定的标准。

  都知道作词是“戴着镣铐跳舞” ,作词的过程是文学创作中最接近计算机思维的,因为要严格地搜寻音韵、词义、句法、典故,然后不断遣词酌句,最后妙手偶得。记性不好读书少的人是很难填好词的。计算机没办法给“红杏枝头春意”加一个“闹”字,但是可以帮忙把“琐窗深”改成“琐窗明” ,从这个意义上讲,如果辛弃疾、周邦彦能有计算机作为辅助,相信我们今天可以读到更多的绝妙好词。技术填词并不是“狂欢” ,它只是以填词工具书(古已有之)的方式告诉我们,人类感受世界之美的方式不只有肉体器官,还有作为它们的延伸的有形的工具和无形的技术。