您好,欢迎来到中国统计出版社!请登录 免费注册     购物车  |   我的订单  |   留言板
关键字:  发展报告 |  统计年鉴 |  年鉴 |
您所在的位置:首页 -> 期刊特稿列表-> 2022.02总482期
2022.02:数据之用

数据之用

李金昌

 

获取数据是为了应用数据。数据作为重要的生产要素,只有得到应用才会体现其应有的价值,并通过交互作用提升其他生产要素的产出效率。让数据说话、而且是说真话,是我们获取数据、研究数据和应用数据的根本目的所在。数据之美,数据之妙,归根结底都要体现在数据之用上。如果数据得不到应用,它就不妙了;如果数据被胡乱应用,它就不美了!

 

关于数据之用,历史上不乏经典案例。例如,威廉•配第在《政治算术》中,应用大量真实的、合理推算的数据——包括人口、土地、资金、资本、主要产品、赋税、价格、海军、船舰、进出口贸易甚至宗教等各个方面的具体数据,分析得出了令人信服的十点主要的结论,这些结论归结为一点就是英国的综合实力高于法国与荷兰,从而为当时的英国统治者提供了称霸全球的信心。毫无疑问,配第是应用数据的高手,可以说既做到了数尽其用又用得恰到好处。《政治算术》用可行的方法和客观的结论,回答了为何要应用数据来研究现实问题,开创了定量归纳分析的先河,成为了统计学的起源之作。

 

但是,应用数据并非易事。皮尔逊学生埃尔德顿1910年发表的“初探父母酗酒对后代的体格及能力的影响”一文,就因数据应用问题引发了著名的皮尔逊论战。皮尔逊与马歇尔、凯恩斯等之间的争论焦点就在于用以测度父母及后代身体与智力状况的数据是否有说服力,因为这些数据不是随机样本数据(它们分别来自于爱丁堡慈善组织协会的报告和曼彻斯特一所接收“心理障碍”孩子的特殊学校的数据集),而以周工资衡量父母的身体与智力状况也可以有不同的解读。对于质疑,皮尔逊强调请拿出你们的数据来,而凯恩斯等则认为要拿出数据,就需要让许多家庭父母在禁酒的情况下结婚生子,又在开始酗酒的情况下生育更多的孩子,然后对相同父母在酗酒前后生育的孩子进行比较。显然,这是不可能的。可见,用什么样的数据、从哪里获得数据来说明问题有时候十分复杂,因为它们不可以假设。

 

上面两个例子,一个是应用数据研究现实问题的成功典范,另一个则引发了该如何选择应用数据的思考。这两个例子至少给我们如下几点启示:一是应用数据要有明确的目标,正如配第的《政治算术》,其应用数据的目的就是为了客观评价英国、法国、荷兰三国的综合实力;二是应用数据一定要抓住问题的本质,数据始终要跟着问题走,《政治算术》为什么选用了那些数据?因为它们能够被用来说明国家的实力和发展后劲;三是应用数据要考虑到其所有可能的来源,因为用以说明某一问题的数据不一定是唯一的,这就需要我们在比较中选择、在选择中应用,皮尔逊论战其实就是该用什么样的数据来测度身体与智力状况之争;四是应用数据首先要准确理解指标的含义,因为数据是指标的具体结果,而每一个指标都只能在一定程度上反映事物的某一个方面的数量特征,任何指标都具有局限性,因此对指标之间的相互替代即数据替换要慎之又慎,皮尔逊论战中对父母周工资的不同解读就说明了这一点;五是应用数据要客观全面、实事求是,不能以自己的主观偏好或私利而乱用数据、扭曲数据甚至篡改数据,例如对人和事的评价,不能只挑选优势数据而忽视短板数据,或者反之。

 

数据既是人类认识世界的密码,也是人类认识世界的结果。你不理数据,数据就不理你;你若理数据,数据就服务于你。当前,我国正致力于建设共同富裕社会。那么,什么是共同富裕?该用哪些方面、什么样的数据来测度共同富裕及其进程?这是摆在我们面前的重要任务。此外,在信息技术快速发展的今天,我们该如何应用好丰富多样的大数据、从而提升我们的统计能力与水平,也是需要我们去积极面对的重要问题。

 

作者单位:浙江财经大学

 

 

数通电子|统计科普|诚招人才|经销商信息|联系我们|版权声明 |
版权所有:中国统计出版社有限公司    技术支持:北京北大方正电子有限公司    京ICP备17030470号-2
地址:北京市西城区月坛南街57号
电话:010-63376840    传真:010-63376840