为什么运动员多是4月~9月出生的呢……统计专家给不利的早生人士的建议
※照片为示意图※本文是对摘要《第一次统计学收银台的队伍走得最快的是哪一个》(综合法令出版)的一部分进行了重新编辑。
■数字是不会说谎的,但人类是会说谎的猜谜。 以下中,正确的是哪个?
①警察较多的地区,犯罪案件较多②冰淇淋畅销的日子里,水边经常发生事故③体重较重的小学生,回答得越快,“都是正确的”。
“啊,是吗? 想着”的人,被统计的把戏骗了。 世界上充满了“做了这个就会变成这样”这样的讴歌。
但是,不能就这样囫囵吞枣。
郑重地说,如果刊登了监视器的售后照片,“也许我也能变成这样! ”虽然很容易相信,但是暂时停下来吧。 因为即使数据本身是正确的,也可以用一个展示方法来操纵人的印象。
数字是不会说谎的,但人类是会说谎的。
在数据社会中,必须能够识破数字的谎言。 就像采取空巢对策的话需要知道空巢的手段一样,为了不被数字所欺骗,需要学习数字的欺骗方法。
■虽然数据是正确的,但解释不同。首先第一个“警察多的地区,犯罪件数多”,但数据是“正确的”。
那么,“你是说减少警察的话,犯罪就会减少吗? ”的解释正确吗? 答案是“不”。
成为这些数据的理由之一是“人口越多的地区警察越多。 人口越多的地区犯罪件数越多。 因此,警察多的地区犯罪件数就会变多”。
这与本书中说明的“每年那个彩票站都会出现高额奖金是真的吗”这一数学法则是正确的,但中奖数量和中奖概率是两回事。
第二个例子,“冰淇淋畅销的日子,水边经常发生事故”,这作为数据也是“正确的”。
那么,“如果不卖冰淇淋,水边的事故就会减少”吗? 答案是“不”。
冰淇淋畅销的日子是夏天。 夏天,因为去海水浴、河里玩耍、游泳池等的人很多,所以水边的事故件数会变多。 虽说限制了冰淇淋的销售,但也不会抑制事故吧。
■操作不是真正原因的东西也不会影响结果的第三个例子,“体重越重的小学生,跑得越快”,这从数据来看也是“正确的”。
那么,“吃多了胖了的话,脚会变快吧? ”的解释正确吗? 答案是“不”。
体重较重的儿童在高年级比较多吧。 高年级的儿童比低年级的儿童跑得更快。 因此,就变成了“体重越重的小学生,跑得越快”的关系。
明白了吗? 在第一个例子中,“人口”隐藏了真正的原因,在第二个例子中是“季节(气温)”,在第三个例子中是“学年(年龄)”。 即使操作不是真正原因的东西,也不会影响结果。
这样,将相关关系与因果关系混淆的情况被称为“错误相关”。
出处=“第一次统计学收银台的队伍走得快,是哪一个”相关是指两个值的关系。
例如,身高和体重是相关的。 个子越高的人,体重越重。 绘制身高和体重的散点图,如图表1所示。 你可以看到它是直线上升的吗?
这叫做“正相关”。 是一方增加的话,另一方也会增加的关系。
■平均气温越低的地区,雪天数越多的情况“负相关”图表2是2016年各都道府县的年平均气温和雪天数的分布图。 一看,是右肩下降的图表。 这是因为平均气温越低的地区,下雪天数越多。
像这样,一方下降,另一方上升的关系称为“负相关”。 在“无相关”的情况下,认为两个值“不能说有某种联系”。
出处=《第一次统计学收银台的队伍走得快,是哪一个》。表示两个值关系程度的指标叫做“相关系数”。 相关系数用11的值表示,关系越强的值绝对值越接近1 (图表3 )。
出处=“第一次统计学收银台的队伍走得更快的是哪一个?”一般来说,如果相关系数在0.5以上,往往会被判断为相关性很强。
要说这有多密切的关系,据说“父母身高与孩子身高的相关系数”大概是0.4?0.5。
相关系数的值,即使是一个Excel函数也能简单地计算出来,但相应地,解释错误的人也相当多。
■使用相关性骗人的方法在开头的猜谜中给出的3个例子是“两个值的相关性很强”。
但是,有必要注意,虽说是相关关系,但那“也不一定是因果关系”。
例如,
警察多的地区,犯罪件数多,这里出现的两个数值如下。
该地区警察人数该地区犯罪案件数
确实,虽然两者存在相关关系,但并没有“警察人数(原因)→犯罪件数(结果)”的关系(虽然不能说完全没有因果关系,但从逻辑上来看很奇怪)。
“该地区的人口”这一看不见的第三个变量,是两者的真正原因。
②冰淇淋畅销的日子里,水边经常发生事故③体重较重的小学生跑得越快
同样,“季节(气温)”“学年(年龄)”分别是第三个变量。
像这样,看不见的第三个变量叫做“潜伏变量”。 根据潜伏变量的不同,经常会将单纯的相关关系误认为因果关系(错误相关),这种关系被称为“表观相关”或“伪相关”。
不熟悉统计的人,有时会混淆相关关系和因果关系进行说明,所以要注意(感觉明确区分相关关系和因果关系进行说明的商务人员更少)。
■“第三个变量是什么? ”正因为这是即使是初学者也能简单做到的手法,所以才能让超级初学者看到“那样”。
例如:“葡萄酒的摄入量和年收入有相关关系! 喝葡萄酒吧! ”的提案,他说:“原来如此! 那么,从今天开始喝葡萄酒! ”这样想太容易了。
本来就有能买到高级葡萄酒的经济实力的人,所以可能经常喝葡萄酒。
同样,当有“成功者越喜欢高级手表”的数据时,“买高级手表就能成为成功者”的解释又如何呢?
“因为是成功者,所以不是在买高级表吗? ”的“因果关系不是相反吗? ”的模式也是错误相关的例子。
像这样,可以让单纯的相关关系看起来像是因果关系,欺骗不擅长统计的人。
相关系数是统计分析中初学者容易掌握的最简单的方法,但也容易被误解,所以使用时需要注意。 然后,不要被骗了。
具体来说,在看到“两件事有关联”的主张和数据时,会说“这不是伪关联吗? 第三个变量(真正的原因)是什么? 这样想就好了。
■为什么运动员很少早熟,那么,试着做点练习吧。
相关关系的示例如下所示。 请想想为什么会成为相关关系。
①开着灯睡觉的孩子会近视②理科的人,无名指比食指长③运动员中早生的人很少,下面就来解说一下。
①开着灯睡觉的孩子近视的房间里的灯光和近视在医学上没有直接的因果关系。 近视好像受遗传的影响很大。
近视的父母经常点灯到很晚,所以取数据好像就成了这种关系。 目前的见解是,开灯睡觉不会影响孩子的视力。
②理科生中,无名指比食指长的理科生多。 而且,男性中睾酮这种男性荷尔蒙较多。
女性也有,但比男性少。 我们知道“睾酮遗传性多的人,无名指比食指长”。
③对运动员中早生的人很少的5000名日本运动员的数据进行分析后,得出了意外的结果。
取得的数据是提取运动种类、选手的出生地、出生年月日、性别、所属队伍、位置、身高、体重等各种属性数据进行分析的(图表4 )。
出处=《第一次统计学收银台排队走得更快的是哪一个》从这个数据中收集了2018年度日本职业棒球选手( NPB )、职业足球( J1 )的1395人的出生年月日,观察结果发现,4月出生的人较多,13月出生的人较少
也试着增加了289名职业篮球选手( B1 ),得到了同样的结果。
“出生月份本来就有偏差吧? ”,并以过去50年的人口统计和出生月的比率进行了比较,因为人口统计和职业运动员的数据有背离,所以可以说有运动员特有的倾向。
从数据来看,“春天出生的孩子更容易成为运动员吗? ”,但我认为有没有“春天出生→容易成为运动员”的直接因果关系。
请回忆起小时候。 确实,我觉得会学习、会运动的孩子中,春夏出生的孩子好像很多。 但是据说那是因为和其他孩子相比,经历学习和运动的时间更长。
■人的性格一半由遗传、一半由人际关系决定的13月早生的孩子,努力、置身于对自己有自信的地方很重要吧。
其实,我知道人的性格有一半是由遗传决定的。 据说另一半几乎都由人际关系决定。
“五大分析”是心理学世界中最值得信赖的性格分析方法(图表5 )。
出处=《第一次统计学收银台的队伍走得快,哪一个》有5个性格特征,其中最能体现工作成果的性格特征被称为“诚实性”。 是指能够孜孜不倦努力的性格特征。 在企业的招聘考试中,也越来越重视诚信。
诚实性也被称为后天容易发展的能力。 提高诚实性最简单的方法是“和诚实性高的人在一起”。
春夏出生的孩子,与早生的孩子相比,和有成果的人们(被推测是诚实性较高的人们)在一起的环境更多,所以必然会有收获的性格吧。
■接受无法改变的东西,操纵人生怎么样?
一言以蔽之,“两件事是相关的”,当时也只能说是“有某种联系”。 相关关系存在6种模式。
①事情a是事情b的直接原因→因果关系
②事情b是事情a的直接原因→因果关系相反
③事情a、事情b是相互的直接原因→销售额(事情a )的20%作为广告费(事情b )的情况(销售额增加的话广告费也增加,广告费增加,所以销售额也增加)。
④事情a是事情b的间接原因→风(事情a )→(诸事)→桶店赚钱(事情b )据说风吹桶店赚钱的占0.8%。 如果把相关的事情积累起来,就不会有很大的相关。 不如说,恰恰相反。
⑤第三变量为两者(事情a和事情b )的原因→年龄(第三变量)→体重(事情a )且年龄(第三变量)→速度(事情b )。
⑥偶然的例子有“上吊自杀数”、“美国科学和航天技术支出”、“游泳池溺水数”、“尼古拉斯凯奇出演电影数”、“美国人均奶酪消费量”和“床单缠绕死亡数”等
“两件事有相关性”和“做事情a的话好像就会变成事情b哦! ”的时候,这6个中,“哪个最有道理? ”来验证一下吧。 直接的因果关系出乎意料地少。
《第一次统计学收银台的队伍走得更快的是哪一个》(综合法令出版),还有“是否存在因果关系”也很重要,“那个可以控制吗? ”这一点也请不要忘记。
例如,假设你知道“携带××基因的人容易得糖尿病”。 但是,有时即使知道了那样的因果关系,自己也无法控制。
这种情况下,只能在自己后天能控制的方面努力。
具体来说,就是“过上良好的生活习惯”吧。 在所有的场合,一边接受自己无法改变的东西,一边处理自己能控制的地方吧。
———-南方数据分析利用顾问联合公司三角洲创作者代表职员。 国立福岛大学经济学系毕业。 一般企业就业后,26岁开始自立更生,数据分析·统计分析事业。 现在正在进行企业的市场调查、需求预测调查、商品开发支援等。 从学生时代开始,他从数学过敏开始走上文科的道路,但与统计学相遇后克服了过敏。 获得株式会社野村综合研究所主办的“市场分析竞赛”奖。 面向学生和社会人,一边享受着数据分析作为现实解谜的乐趣,一边进行着对工作有帮助的实践性训练。 ———-
这里有个小tips~1296334825 备注:汇汇圈!
如若转载,请注明出处:https://www.fx002.com/16129.html