Quantitative Analysis of the Full Bitcoin Transaction Graph
1.介绍Introduction
比特币是一种电子货币,不由*、银行等组织发布,依靠加密协议和分布式用户网络来生成、存储、转移。该方案于2008年由中本聪首次提出,并于2009年1月全面投入使用。它吸引了大量用户和大量媒体关注,但到目前这几个简单问题还没有精确答案:系统中有多少个不同的用户? 每个帐户通常会有多少比特币?这种余额如何随时间变化? 大多数比特币是由几个大用户保管的吗? 他们将比特币保存在储蓄账户中还是立即花费?有多少用户在某个时间点有大额余额?比特币交易的规模分布是怎样的,有多少是小额支付?
这篇文章中我们回答这些问题。在比特币系统中进行的所有交易都可以在互联网上获得(以匿名方式),在2012年5月13号,我们下载了系统中的所有记录,有大约180000和HTML网页。在解析和处理这些文件之后,我们构建了截至该日期的所有比特币地址和交易的图表,然后我们使利用比特币的内在属性来识别许多情况,我们可以在其中显示不同的地址必须属于同一所有者,并通过合并这些地址来收缩事务图,以获得更多准确了解所有业主的全部财务活动。获得这些图标后我们对其进行统计分析。本文中我们会描述我们所发现的最有趣且有用的分布。除此之外,我们单独分析了系统中所记录的大额交易(交易额超过50000 ),分析这些比特币是如何积累和花费的。我们发现几乎所有的大额交易都是2010.11.8这天所发生的一个超过90000交易额的交易的后代,这些交易的子图中有许多奇怪的looking chains and fork-merge structures,在几个小时里一个大账户通过数以百计的临时中间账户、过着分成许多系哦啊账户,只是为了在另一个新账户中重组。
参考文献5尝试了下载并分析比特币的历史。他们2011年7月12日创建了交易图,在我们的方案之前。所以我们的图表要比他们的大三倍。除此之外,我们希望我们更成熟的图表中的交易能更好地代表系统的典型用途,而他们的图表则主要代表早期采用的运行实验。然而,我们论文之间的最大区别是他们主要感兴趣在隐私问题上,并表明尽管官方匿名也可以识别各种用户,而我们主要感兴趣的是比特币交易图的统计属性。
比特币交易图的另一个分析在2011年12月的Chaos Computer Club Conference上提出。他们的首要想法也是也是打破匿名性(也是同样的想法:collapsing addresses belonging to a common owner)也还包括一些有趣的评论,该方案背后的经济原则、丢失的比特币对其操作的影响、协议的弱点,以及此交易图的一般拓扑属性。
本文在第2节中描述了比特币网络的结构, 在第3节中总结了我们从下载的网络中提取的主要统计分布,它们描述了该方案的许多有趣甚至令人惊讶的属性。 最后,在第4节中,我们提供了最大交易的图表并分析了它的奇怪结构。
2.The Bitcoin Network
比特币是一种去中心化电子货币系统,使用P2P网络,数字签名和加密证据。 它在2008年由中本聪(广泛认为是化名)的论文中第一次被提出。比特币由比特币网络发行和转让的数字货币,支付就通过比特币(BTC)进行。 节点向网络广播交易,网络在使用工作量证明系统验证它们之后将它们记录在称为区块链的公共可用网页中。
参与者首先通过获得一个名为比特币钱包的程序和一个或多个比特币地址开始使用比特币。 比特币地址用于接收比特币,就像电子邮件地址用于接收电子邮件一样。 尽管比特币被认为是一种实验性的支付系统,但它已经大规模使用(从迄今为止发行的所有比特币的当前价值超过100,000,000美元)并吸引了大量的媒体关注。 它的支持者声称它是第一个真正的全球货币,它不会根据公民身份或国家歧视其用户,它可以不停运行,手续费便宜,它不会被扣费等等。 另一方面,它的反对者声称,它被广泛滥用于购买非法物品和洗钱,并且通过网络攻击从钱包中窃取比特币太容易了。
与法定货币不同,它没有内在价值且没有储备支持,也没有集中的发行机构。 该网络被编程为货币供应缓慢增加,直到比特币的总数达到2100万的上限。比特币“矿工”以解决越来越难的工作量证明问题来获得比特币,这承认了交易也防止双重支付。网络目前生成一个区块以获得奖励(目前50个BTC)比确认第一个区块的计算量多一百万倍。
比特币的汇率多年来波动很大,从0.01美元到超过30美元。 今天(2012年10月)每个BTC的价值超过12美元。 比特币网络中的整个活动可通过互联网公开获取,并以从第一个区块(创建于2009年1月3日)开始的区块链的形式记录。 每个块仅报告一个事务就可以报告超过一千个事务,并提供到其他区块的超链接以及每个地址的其他活动。
他们不必透露任何与其地址有关的识别信息; 他们可以使用多个(新生成的)地址反复向他们自己发送不同的BTC部分; 和/或他们可以使用受信任的第三方将其交易与其他所有者的交易混合。 另一方面,一些所有者自愿透露他们自己的某些特定地址的所有权,例如,当他们宣传他们的商品,请求捐赠或作为比特币交换时(例如拥有大量地址的Mt.Gox))
比特币网络的一个非常重要的特征是涉及多个发送地址的交易只能由所有这些地址的共同所有者执行,因为比特币系统要求发送此交易的所有人都拥有所有这些地址。 通过每个收到的金额必须具有从先前交易中解锁的加密数字签名这一事实,技术上也确保了这一要求。只有持有适当地址的人才能创建令人满意的签名, 因此,资金只能由其所有者支出。在这几个可以遍历整个事务列表,并将作为单个事务发送者的地址集合并为单个所有者。这可能导致新的合并级联,直到所有者列表停止收缩。这产生了许多关于地址的共同所有权的信息,但不能保证在此过程中没有合并的两个地址实际上属于不同的所有者。通过汇总所有可以追溯到同一所有者的地址和交易,我们可以更全面地了解他的总资产和金融活动。如果我们有任何关于这些合并地址的实际所有权的外部信息,我们可以更全面地了解这个特定个人或组织的比特币活动。例如,由于维基解密在要求捐款时公开了它的地址之一,我们可以确定维基解密拥有至少83个地址,参与了至少1088笔交易,并且在所有这些地址中积累了2605.25比特币的收入。
解析每个文件以提取其中的所有multisender / multireceiver事务,然后将事务集合编码为本地计算机上的标准数据库。 然后,我们运行了Union-Find图算法[9]的变体,以便合并所有已知属于同一所有者的地址,并组合所有可以与之关联的事务(但不消除内部 转移,在图中成为自循环)。 下一节中描述的所有统计信息都是从这种简化的事务图中派生而来,而不是从原始HTML文件表示的原始图中派生出来的。
3.Statistics Calculated Over the Bitcoin Transaction Graph
在我们下载图表时,有3,730,218个不同的公钥,每个公钥与不同的地址相关联:其中3,120,948个作为发送者参与至少一次交易,而额外的609,270只作为BTC的接收者出现在网络中。通过运行Union-Find算法,我们能够将3,120,948个地址与1,851,544个不同的所有者相关联。由于其他609,270个地址从未被用作发送者,因此它们无法通过Union-Find算法与任何其他地址合并,因此它们都保留为具有单个地址的所有者。通过添加这些单例,我们总共得到2,460,814(可能)不同的所有者,这意味着他们每个人平均有大约1.5个地址。但是,这个统计数据存在巨大差异,实际上一个所有者拥有156,722个不同的地址。通过分析其中一些地址并跟踪他们的交易,很容易确定该所有者是Mt.Gox,这是最受欢迎的比特币交换站点(占网络中所有交换操作的近90%)。表1列出了每个所有者的地址数量的完整分布。(大致意思就是大部分人都拥有不止一个地址,有一小部分人只作为了接收方出现了一次,而大部分的地址的所有者都是同一个人/组织)
在我们的简化事务图中,每个m到n的交易都有一个发送者(因为m个发送地址必然属于同一个所有者)并且最多只有n个接收者。因此,它可以被分解为最多n个不同的m到1交易。如果某些接收地址被识别出属于同一个所有者,则会创建一个1对1的公共交易,交易额为累积的数量。得到的图表有7,134,836个单一发送者和单个接收者交易,其中814,044(约11%)涉及Deepbit(最大比特币矿池),477,526(约7%)涉及Mt.Gox。大约10%的交易是自循环的。交易图是没有连接的,因为它由133,742个不同的连接组件组成,其中许多是大小一个。例如,有多达43,410个组件(约33%)由一个组成地址仅用于接受(一批或几批)新鲜比特币,并且从未参与任何传入或传出交易。
网上有很多统计图表,大多数是关于汇率、数量神马的,我们更进一步,整个交易图可以用来确定每个所有者的财务历史,包括他所有的发送/接收活动,以及他不同地址比特币的每日余额以及它们随时间的变化。在本节的其余部分中,我们将描述到目前为止的一些发现,但是我们希望在不久的将来对这些数据有更深入和更丰富的分析。
第一个发现,系统中BTC的总数与块数成线性关系。每个块都与50个新的BTC的生成有关,因此在我们的所有者图中有9000,050个BTC(从0到180,000号块之间的180,001块生成)。然而,如果我们把609,270个只接收和从不发送比特币的地址加起来,我们会发现,它们的所有者实际上已经在某些储蓄账户中存了7,019,100比特币,这几乎是现有比特币总数的78%。59.7%的比特币是“旧的”(2012年5月13日前3个多月收到的),而且没有任何转出交易。这意味着流通中的比特币数量要比之前估计的少得多。然而,自比特币系统建立以来,参与所有交易的比特币总数(实际铸造操作除外)为423,287,950比特币。这意味着,流通中的每一枚硬币的交易次数都比预期的要多得多。
另一个有趣的发现是,大多数比特币持有者收到的比特币总数可以忽略不计。从表2可以看出,36%的业主一生中收到的比特币(目前价值约12美元)不到1个,52%的业主收到的比特币少于10个,88%的业主收到的比特币少于100个。在分布的另一端,只有4个业主收到了80多万个比特币,80个业主收到了40多万个比特币。
同样,从表3中可以看出,目前(2012年5月13日)近97%的业主的余额低于10 BTC。 如果看所有者曾拥有的最大余额,这个数据会减低到88%, 表4总结了这一统计数据。此外,可以看出,只有78个所有者的当前余额大于10,000 BTC。 在查看历史最大余额时,这个数字增加到3,812。
另一个可能表明所有者活动水平的度量是他参与交易的数量。其分布如表5所示。值得注意的是,97%的所有者每人只有不到10个交易,而75个所有者经常使用网络,并且与至少5000个交易有关联。
我们还计算了比特币交易规模的分布情况,如表6所示。同样,很多交易都是非常小的,28%的交易都小于0.1比特币。比特币方案可以进行10^-8 BTC的交易。当我们考虑中等金额时,我们发现73%的交易不到10个比特币。另一方面,在比特币领域,大宗交易非常罕见:只有364笔交易的交易额超过5万BTC。我们仔细检查了所有这些大型交易,并在下一节描述了我们的发现。
(上面这一段就是说,大部分的资源掌握在少数人手里,这是2013年的数据了,这几年比特币越来越火,普通用户所占用户会更多些吧)
4.The Graph of the Largest Transactions in Bitcoin
我们已确定和分析所有最大的交易(超过5000BTC),并遵循其流程。我们从最早的这样大的交易开始,在2010年11月8日完成了90000比特币的交易。通过跟踪这个类别中的其他363个大型交易,我们能够显示348个是这个初始交易的实际继承者。得到的有向图如图1所示。这张图揭示了比特币交易图中流量的几个特征行为:长串连续的交易链,可能包含自循环的fork-merge模式,排除BTC,通过二叉树结构最终分配大额资金。
。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。
剩下还有老长,反正就是说好多大交易都是一个交易的后代。
看这篇论文主要是因为他的作者Adi Shamir很强,不过论文是13年代的了,估计不那么有代表性了。