对频率分布“长尾”现象的统计研究,可以追溯到1948年哈佛大学语言学教授齐夫对英语文献中词频的分析和研究。zipf教授的研究成果指出,英文文献中词频相对于序号的分布呈现幂函
对频率分布“长尾”现象的统计研究,可以追溯到1948年哈佛大学语言学教授齐夫对英语文献中词频的分析和研究。zipf教授的研究成果指出,英文文献中词频相对于序号的分布呈现幂函数分布,而不是正态分布。所以词频分布规律也叫齐夫定律(Zipf & # 8217美国法律).而这种幂函数分布被称为“幂律分布”正态分布在我们的日常生活中很常见。比如某个地区的男性身高,某个省份的高考数学成绩,某个比特币挖矿机的平均使用寿命等等。正态分布是一种“等”分布,因为大多数人的条件都在平均值左右,两者相差不大。特高特低比较少见。。
[2]
同时,正态分配也是一种不公平分配。一个比一般选手高出6个标准差的高手,在数学考试或者体育赛场上几乎总能赢过普通的无名小卒,把后者甩在后面。分数线一划,大部分没过线的人都会被淘汰。Kraut的“定位”理论是指人们对一个产品只能记住第一名,最多能记住另一个竞品和替代品,也就是第二名[3]。而更多平庸的玩家只会被市场遗忘。
幂律分布又是另一番景象。比如人们的收入水平、词频、城市人口、比特币矿工的计算能力等等。幂律分布是相当公平的分布。虽然前20%的玩家占据了80%的市场,但是80%的长尾玩家仍然可以瓜分剩下的20%的市场。大哥吃肉,小弟喝汤。
但与此同时,幂律分布是一种不平等的、两极分化的分布。它有一个流行的说法叫“二八法则”(80/20法则)。20%的产品贡献80%的收入,20%的人赚80%的钱,花20%的时间学80分(剩下的20分要花80%的时间),20%的美女被80%的男生追求,等等。
意大利经济学家维尔弗雷多·帕累托在1896年研究社会收入和财富分配时发现了80/20现象,后人将其理论命名为“帕累托原理”[4]。帕累托在他的《政治经济学》( Cours d & # 8217économie politique)指出,意大利约80%的土地被20%的人占据。
当然,帕累托的研究具有鲜明的时代特征,不能视为绝对的自然规律和永恒真理。在他做研究的时代,欧洲圈地运动已经成功地驱逐和释放了农民,资本主义和雇佣工人阶级已经兴起,土地作为私有财产被集中占有并受到法律保护,这就形成了帕累托所观察到的现象。这种现象是那个时代社会运动的结果。
对于土地,也许应该像阳光、空气水一样平均分配,或者像一夫一妻制、一人一票制一样,立法禁止兼并(就像刑法中的“重婚罪”一样)。因为平均分布比幂律分布更公平。人人平等,利益均分。
八定律的两极分化,尤其是富者愈富,贫者愈贫的社会现象,也被称为“马太效应”[5]。马太效应(Matthew effect),由美国科学史研究者罗伯特·金·默顿于1968年提出,借用圣经《新约·马太福音》:“谁有了,就给谁需要的两倍,叫多余;不会,连他拥有的都会被拿走”,反映了一种赢者通吃的现象。
当我们谈到二八法则或者马太效应的时候,有一个潜台词是我们在关注和强调头部,就是把注意力和精力集中在20%的市场和客户上。因为我们的精力和时间确实有限,所以需要专注于头部的20%,而忽略长尾的剩余80%。
2004年10月,美国《连线》杂志主编克里斯·安德森(Chris Anderson,1961-),在《连线》杂志上发表了一篇关于“长尾理论”的文章[6]。在文章中,他提到了亚马逊、苹果、雅虎等公司,并用“长尾”的概念来解释互联网企业的商业模式。2006年7月,他出版了一本书《长尾理论:为什么商业的未来是少卖给更多的人》,这本书成为全球畅销书,也是企业的必读书籍。当时国内几乎所有的互联网公司都进行了集体学习和专题研讨。
我们要注意,长尾理论,二八法则和马太效应讲的是同一个分布,幂律分布。但是,两者的区别主要在于关注点不同。八大法则强调头部,长尾理论强调长尾。
长尾理论主要试图指出,如果我们能够针对过去被忽视的长尾市场,也就是所谓的“利基市场”,那么我们可能会惊喜地发现,这个狭窄而冗长的市场的需求总和以及整体利润与头部市场的总量相当。主要问题是,服务于这样一个狭窄而个性化的市场的边际成本对于传统的商业模式来说是不经济的。但是,随着互联网技术的发展,我们可以构建大规模的计算机集群,为大量用户提供24小时不间断的高度个性化的服务,并保持极高的服务效率和极低的边际成本。这提高了商业效率,使得从小众市场中提取大量的小价值成为可能,从而改变了传统的只关注头部客户的商业模式。例如,Tiktok的服务器集群可以同时为全球数百万在线用户推送完全个性化的定制内容,而增加一个新用户的边际成本几乎为零。这也是互联网服务和商业模式能够跑赢传统商业模式的主要原因之一。
中本聪在2008年11月3日的邮件中借用了“长尾”的概念,长尾是指大量中小型集群的计算能力之和可以与少量头部集群的计算能力相匹配的情况[7]。如果出现这种情况,取决于比特币游戏规则下的哈希幂分布符合幂律分布。
我们从中本聪的论坛演讲中已经知道,“每天通过网络产生的比特币总量平均保持不变。较快的机器比较慢的机器获得更大的份额。如果每个人都买更快的机器,他们不会比以前得到更多的钱”(中本聪,2009年12月12日论坛帖子)[8]。因为在很短的时间内,每一个新区块中基于货币的交易所发行的新比特币数量就是一个固定大小的蛋糕,而所谓的所有矿工的开采就是为了争夺和瓜分这个蛋糕。
在2009年1月13日写给达斯汀·特拉梅尔的另一封私人邮件中,中本聪写道:“这不像赛车。如果一辆车的速度是它的两倍,它将永远是赢家。这是SHA-256操作,每次耗时不到1毫秒,每次都有独立的成功机会。每台计算机发现哈希冲突的机会与其计算能力成正比。慢一半的电脑会得到一半的比特币。”[9]
这一特性与比特币挖矿比赛中SHA-256哈希运算的设计密切相关。关于这一点,中本聪早在2008年11月15日的密码学邮件列表中就已经公开指出[10]:
“如果你把它看成是一个CPU密集型的数字签名,那么你可能会把它看成是一场先完成一个长运算,以最快速度获胜的比赛。」
但事实上,“工作负载被证明是阿沙-256碰撞搜索像哈希现金。这是一个无记忆的过程。你每秒钟做几百万次哈希计算,每次找到它们的几率都很小。最快的3或4个节点的优势只与它们在总CPU计算能力中的份额成正比。任何人在任何时刻找到答案的几率都与他们的CPU能力成正比。」
就像扔硬币游戏。谁先连续扔出100个人头,谁就赢了。那么我们知道,在任何时刻,你的中奖概率只和你的出手速度成正比,和你在此之前投过多少次硬币无关。这就是所谓的“无记忆过程”。这种游戏保证了随时加入的新玩家能够公平的参与竞争。
这就是基于POW(工作证明(PoW))的共识算法的公平性。相比之下,基于PoS (Proof-of-Stake)权益证明或类似变体的共识算法,会因硬币的历史持有量不同而获得额外的竞争优势,从而获得更多的硬币。如果继续用新币强化自己的权益证明,会进一步提升自己的竞争优势,这对后来进入的新玩家是不公平的。