三招教你简单预测未来。
除此之外还有高阶的方法吗?
是的,数学家通过建立模型来预测情景,从而判断未来的大方向。
现在大数据大行其道,我们生活在大数据时代。通过数据的收集,我们可以建立一个数学模型来做出判断,在大量的数据下给我们展示一个可靠的未来。
虽然大数据与我们的生活息息相关,但作为普通人,数据采集已经是一个大问题,更不用说数据采集后的大量算法了。我们似乎没有办法使用这些高端的东西。
的确,现在大数据普及,换到我们老百姓的生活中不太实际。但是,如果生活中有一些小数据,我们可以简单的对这些小数据进行处理和判断。
其实我们一直在用这些方法,靠的是直觉,但是不知道背后的科学原理,比如我们在等车的时候,判断下一趟车什么时候回来?是否值得等待。
250多年前贝叶斯就有这样的疑惑。应该如何判断未来的趋势?没有250多年前大数据的支持,贝叶斯是怎么解决的?
贝叶斯问题是这样的:
如果概率是100%,那么三张彩票的中奖概率也是100%。但如果是50%,三张彩票的中奖概率就变成了1/2×1/2×1/2 = 1/8。如果中奖概率是1%,那么三张彩票的中奖概率就变成了1/100×1/100×1/100。
贝叶斯认为1/8的概率大于100%,1/100×1/100的概率大于100。贝叶斯也就此发表了自己的论文。贝叶斯最重要的贡献在于量化直觉,推断过度假设。
贝叶斯实际上并没有解决这个问题,因为如果你问贝叶斯概率是多少?他不知道,他只是说比那更有可能。
几年后,法国数学家拉普拉斯给出了一个解决方案,答案相当简单。任何N次尝试都有W个赢家的情况,那么未来的情况是:(w+1)/(n+2)。这就是著名的拉普拉斯定律。
拉普拉斯在自己的生活中也使用了这个规则。比如将来人生男生女的概率有多大?通过这个公式可以得到一个结果,男女比例接近1:1。
拉普拉斯为我们的小数据打开了处理现实世界的大门。
小数据也有小数据的美,可能不完美,但足够完美,可以改善我们的生活。经过这么多年的发展,可以说在小数据的应用上已经有了一些阶段性的成果。
为了展开这些小数据,必须有一些先验数据来支撑。肯定没有,至少是猜测,哪怕不现实。
这些猜想和之前验证的数据将决定我们使用的方法。三招教你简单预测未来。以下是三种先验数据和我们的预测方法:
?幂分布中的乘法法则
幂律是指事物的发展,规模和倍数成反比。规模越大,次数越少。比如电影总票房和电影数量的关系,电影票房少的时候,电影数量也很少。到了某一点后,电影数量似乎增加不多,但电影票房却急剧增加。说明有些电影占绝大多数,带来可观的票房。
幂律也被称为2/8定律。人生最重要的部分是由那20%决定的,投资公司的收益主要是由他们那20%的投资决策带来的。电影总票房也主要由20%的电影贡献。
如果要预测一部电影可能带来的票房,符合乘法定律。乘法定律有一个固定的系数,不同的东西有不同的系数。假设一部电影的票房系数是1.4,那么这部电影已经有600万票房了。目前可以预测这部电影会有840的票房。
当事物符合幂分布时,乘法法则有效。
正态分布中的平均法则
在正态分布中,处于两个极端的人很少,大部分在一个地区,所以人类的年龄分布符合正态分布。当我们预测年龄时,我们需要使用平均法则。我们知道非常年轻的人和非常长寿的人属于少数,我们大多数人将在一个地区。
假设人类的平均年龄是79岁,一个孩子只有7岁。你预测他会活几岁?根据平均律,这个孩子处于正态分布的峰值,我们会猜测他大概78岁左右。相反,如果一个老人90岁了,你会预测他多大?同理,按照法律规定,老人可能活到94岁。
一部电影刚上映,你没看过。你觉得要享受多久?按照正态分布的平均规律,一部电影大概是120分钟。除了《泰坦尼克号》那样的几个小时,我们可以估算出自己需要的时间。
?鄂尔多斯分布的常数定律
恒常定律是一个不变的量,不会因其他影响而改变。我们最熟悉的是,当我们在玩游戏或者沉浸在自己喜欢的事情中的时候,我们经常会说我五分钟就结束了,但事实是五分钟过后还有五分钟,似乎没有停下来的趋势。
在赌场里,我们会经常遇到这样的情况,就是多一手,我不玩了,我保证走,结果就是一手接着一手。总是忘记自己说过的话,这也叫遗忘法则。
程三斧定瓦山。下面教你三招预测未来。总结这三招:
如果你玩的是吃角子老虎机,而且吃角子老虎机符合势力分布,你赢一次,就很可能一直赢。如果你输了,不要指望赢,你会一直输。这就是乘法定律,这种效应不断被放大。
老虎机如果符合正态分布,不会一直赢,也不会一直输,而是在这个老虎机的平均值,输赢次数趋于平均。
如果吃角子老虎机符合Erci分布,跟你玩多少次没关系。你玩它多少次,它就注定输或赢。每台老虎机的设置都不一样,所以了解一台老虎机属于什么分布就显得尤为重要。
哈佛大学生物学教授史蒂夫·古尔德(Steve Gould)想知道自己发现自己得了癌症后还能活多久,还为自己做了一个预测。医生只是告诉他,一半的病人在他发现这种癌症后的八个月内死亡。
古尔德认为这只是数据之一,他并不知道这种癌症的存活和分布情况。
如果符合正态分布,那么他八个月左右。如果符合权力分配,那就完全不一样了。他坚持得越久,就活得越久。即使是正态分布,古尔德也认为自己是一个极端的人,可以活得更久。结果,古尔德在癌症被发现后又活了20年。哈佛教授也是用小数据做判断。大数据并不坏,但是当我们有时候很难得到我们想要的大数据的时候,小数据可以帮助我们。
深入来说,这背后的原理其实是用数据建模,区别在于数据量。
当确定事物符合某种分布时,无论数据有多少,我们得到的函数都是固定的。如上图所示,我们可以从几个数据得到一个函数,也可以从几千个点得到一个函数,但是我们可以用最少的数据得到原函数。
小数据的优点是决策快,缺点是可能不完全准确,可能会导致偏差大。大数据的好处是我们更容易得到一个准确的结果,不足的是要花大量的时间去分析数据。
每个行业的成功人士都有在短时间内做出决策的能力,而且决策的成功率还是很高的。为什么?今年4月,哈佛商业评论网对此进行了分析,认为对生活中许多复杂的事情做出快速判断的方法是制定简单的规则。就像三招教你预测未来的简单方法一样,三招是简化的规则,让你判断大方向不会出错。
简单不代表容易。简单三笔的预测,后面是大量的数据和先人的努力。小数据的想法在大数据的趋势下是如此的与众不同,却又是如此的耀眼!
参考数据
复杂决策
https://HBR . org/2017/05/linear-thinking-in-a-nonlinear-world dy & gt;