没事写了一个小软件分析词频、符频、段长分布和句长分布,然后发现英文文章的同一性果然是好,《太空堡垒》前十本的上述几个特征几乎都是相同的,差异很小。然后拿大刘的9本小说和我自己写的六篇短小说,发现就散得比较开了,而且我和大刘的区分度不怎么高…作为参考的还有些中文说明书,这个就更散了