很多人只是列举一些他知道的事实(如人们盼望着政府来拆迁)来证明中国的拆迁补偿不是偏低、而是偏高,但这样列举一些事实并不是很好的验证,因为如何确保你列举的事实是大部分情况,而不是个别现象呢?认定拆迁补偿是偏低而不是偏高的人,也可以列举一些于他这观点有利的事实啊。怎么才能确保你不是”以偏概全“,怎么才能证明“总的来说”情况是如此这般呢?如果用数据验证,那就可以运用统计学理论与技巧证明自己的抽样调查是能够“以偏推全”(以局部的抽样数据推导全局情况),但我们这道题是禁止使用数据验证的。事实就是,与社会科学相关的统计数据有太多问题,往往不反映真实情况,还可以搞些不为外人所知的猫腻,在数据的掩饰下其实大行骗术。有一位读者是专门从事“大数据”行业的,他作为行内人就非常清楚这些内部的伎俩,深知绝大部分的所谓大数据分析只是漂亮的骗术而已。所以我这道题禁止使用数据做验证,要求大家使用普通人也不会轻易被骗的方式来做验证,以确保有关的验证是真正可靠的。
那到底怎么办呢?罗列事实又可能以偏概全,怎么才能依然是找到一些事实,却可以巧妙地避开偏概全的问题呢?其实很简单,读者中有两个人的回答都找到了这种巧妙的事实,那就是:“拆二代”这个词汇出现的事实!如果不是拆迁补偿很高——是高到一拆暴富,使原住户一跃而成与“富二代”同等富裕的程度,逻辑上怎么可能出现这样一个词汇?相比之下,英国工业革命时期流传下来的是“羊吃人”这样的词汇。一个现象能进入词汇,必须是普遍并长期地存在于社会之中——即不可能是“以偏概全”,并且不是只持续了很短一段时间的现象。因为在逻辑上,一个现象如果只是在个别情况出现,或者只是昙花一现地短暂出现,它不可能成为一个词汇。诚然,靠炒作是可以搞出一些流行一时的词语或句子,如“你妈喊你回家吃饭”、“叶良辰”之类,但它们会消失得很快,只能成为炒作当年的流行语,没有稳固的社会现象在背后支持,是不可能长期存在的。
前段时间我在帖吧里发过一篇小文章:《中国为什么叫China?》(http://tieba.baidu.com/p/4088818399),用的是同样的逻辑。其实很多语言学家早就指出China一词的来源是“秦”(chin),但我那篇文章的亮点在于我特别地澄清了那个“秦”是指秦国,而不是指秦朝,因为秦朝的时间太短,尽管它在中国历史上非常重要,但也不够时间沉淀为文化进入词汇——反面的例子就是连中国人自己(肯定比外国人更清楚秦朝在中国历史上的重大意义)也是自称“汉人”(汉朝人)而不是“秦人”。事实上,我认为人类学、社会学等学科有一个意义重大的研究方向,就是在这方面,即寻找这类巧妙的事实,比数据验证与一般的事实验证都更可靠!