为区块链应用设计本地数据库存储结构-唐霜

区块链和区块链应用这两个概念是不一样的。本文作者：唐霜，转载请注明出处。【本文首发于唐霜的博客】对于一个纯区块链而言，只需要保证它拥有三【未经授权禁止转载】【版权所有】唐霜 www.tangshuang.net个要素：1.链表结构的区块存储结构设计，转载请注明出处：www.tangshuang.net【未经授权禁止转载】2.点对点网络，3.加密技术保证不可伪造【未经授权禁止转载】本文作者：唐霜，转载请注明出处。。但是对于一款应用，特别是现代的应用，这【转载请注明来源】【未经授权禁止转载】三个要素完全不够。对于一个应用，还要考虑本文版权归作者所有，未经授权不得转载。【访问 www.tangshuang.net 获取更多精彩内容】：1.用户（账号）体系，2.鉴权体系，3本文作者：唐霜，转载请注明出处。著作权归作者所有，禁止商业用途转载。.业务数据。因此，我们这篇文章要来探讨一本文作者：唐霜，转载请注明出处。【版权所有】唐霜 www.tangshuang.net下，一个区块链应用应该如何设计它本地的数【原创不易，请尊重版权】【本文首发于唐霜的博客】据库存储结构。

选择底层数据库

对于区块链应用而言，有两个部分的数据：区转载请注明出处：www.tangshuang.net【本文首发于唐霜的博客】块链数据和应用状态数据。以比特币为例，区转载请注明出处：www.tangshuang.net【转载请注明来源】块链数据中保存着历史交易数据，而这些数据【关注微信公众号：wwwtangshuangnet】【原创内容，转载请注明出处】包含了上述提到的那几个方面，除了历史交易著作权归作者所有，禁止商业用途转载。【关注微信公众号：wwwtangshuangnet】数据，比特币客户端（应用）还需要保存没有【访问 www.tangshuang.net 获取更多精彩内容】本文作者：唐霜，转载请注明出处。被写入区块链的一些数据，比如过去一段时间【原创不易，请尊重版权】【转载请注明来源】发起的新交易。比特币的区块链数据被存储在转载请注明出处：www.tangshuang.net未经授权，禁止复制转载。很多.dat文件中，它采用的数据结构我至【访问 www.tangshuang.net 获取更多精彩内容】【本文受版权保护】今没有搞懂，阅读了很多材料，都没有明白比【原创内容，转载请注明出处】【关注微信公众号：wwwtangshuangnet】特币raw data使用的是什么技术，不本文版权归作者所有，未经授权不得转载。【关注微信公众号：wwwtangshuangnet】过市面上已经有很多软件可以直接解析比特币原创内容，盗版必究。【版权所有，侵权必究】区块链数据，所以读取比特币区块链也不是什【原创不易，请尊重版权】本文作者：唐霜，转载请注明出处。么问题。而比特币的这些.dat区块数据不【本文受版权保护】【原创不易，请尊重版权】是以我们熟悉的数据结构存储的，所以在查询本文作者：唐霜，转载请注明出处。本文作者：唐霜，转载请注明出处。数据的时候，无法像现代数据库一样通过查询【原创内容，转载请注明出处】【访问 www.tangshuang.net 获取更多精彩内容】语句或方法快速查询。为了解决验证某个交易本文作者：唐霜，转载请注明出处。【本文受版权保护】的速度，比特币采用了leveldb作为k原创内容，盗版必究。【版权所有】唐霜 www.tangshuang.netey-value数据库保存着整个区块链的【本文首发于唐霜的博客】【访问 www.tangshuang.net 获取更多精彩内容】索引，以保证可能通过各种key快速找到需【本文首发于唐霜的博客】转载请注明出处：www.tangshuang.net要的数据。另外，那些还没有写入区块链的c转载请注明出处：www.tangshuang.net本文作者：唐霜，转载请注明出处。hainstate数据也是用leveld本文作者：唐霜，转载请注明出处。本文作者：唐霜，转载请注明出处。b保存在另外一个库中。

未经授权，禁止复制转载。【原创内容，转载请注明出处】原创内容，盗版必究。

那么对于非币应用，或者代币应用，怎么来搞本文作者：唐霜，转载请注明出处。【本文受版权保护】自己的数据库呢？

著作权归作者所有，禁止商业用途转载。本文作者：唐霜，转载请注明出处。未经授权，禁止复制转载。【转载请注明来源】

上面你可以看到，实际上，一个区块链数据库【转载请注明来源】【版权所有】唐霜 www.tangshuang.net结构里面包含三个（或更多）部分：1.只能本文作者：唐霜，转载请注明出处。【访问 www.tangshuang.net 获取更多精彩内容】执行插入和查询动作的块链数据库，2.块链【作者：唐霜】本文作者：唐霜，转载请注明出处。数据的索引，3.chainstate数据【原创内容，转载请注明出处】本文作者：唐霜，转载请注明出处。，这个数据是可变的。而怎么把账号体系、业【原创不易，请尊重版权】【版权所有，侵权必究】务体系等数据加入进去呢？很明显，账号体系【原创内容，转载请注明出处】【原创不易，请尊重版权】、鉴权体系、业务体系的数据全部要入链。在【原创内容，转载请注明出处】【访问 www.tangshuang.net 获取更多精彩内容】p2p同步时，只有block数据被同步，【原创内容，转载请注明出处】未经授权，禁止复制转载。其他数据都是通过网络广播等方式传递和接收【关注微信公众号：wwwtangshuangnet】【作者：唐霜】的，索引数据在同步时创建。

【访问 www.tangshuang.net 获取更多精彩内容】著作权归作者所有，禁止商业用途转载。【转载请注明来源】

用sql数据库保存区块链。

本文版权归作者所有，未经授权不得转载。【关注微信公众号：wwwtangshuangnet】

我们抓住区块链表的特征，即下一个区块保存原创内容，盗版必究。【版权所有】唐霜 www.tangshuang.net着上一个区块的hash，同时通过merk【转载请注明来源】未经授权，禁止复制转载。le算法保存了区块内容的hash。所以，转载请注明出处：www.tangshuang.net【关注微信公众号：wwwtangshuangnet】我们其实很好利用sql数据库来保存blo【原创内容，转载请注明出处】【未经授权禁止转载】ck数据，而且，sql数据库可以自定义索【关注微信公众号：wwwtangshuangnet】未经授权，禁止复制转载。引，所以，索引数据库都省了。因此，我们的【关注微信公众号：wwwtangshuangnet】【原创内容，转载请注明出处】应用里面，可以最终总结为两类数据：块链数本文版权归作者所有，未经授权不得转载。【版权所有】唐霜 www.tangshuang.net据、chainstate数据。其中块链数【关注微信公众号：wwwtangshuangnet】【本文首发于唐霜的博客】据使用sql数据库保存，只具备inser著作权归作者所有，禁止商业用途转载。【作者：唐霜】t和select的权限。而chainst【原创内容，转载请注明出处】【本文首发于唐霜的博客】ate使用kek-value数据库保存，著作权归作者所有，禁止商业用途转载。著作权归作者所有，禁止商业用途转载。读取效率更高。

本文作者：唐霜，转载请注明出处。著作权归作者所有，禁止商业用途转载。原创内容，盗版必究。著作权归作者所有，禁止商业用途转载。

用sqlite和leveldb作为底层数【作者：唐霜】【作者：唐霜】据库。

sql数据库和key-value数据库都【本文首发于唐霜的博客】转载请注明出处：www.tangshuang.net有很多很多，比如orcal、redis等转载请注明出处：www.tangshuang.net本文作者：唐霜，转载请注明出处。等，但是我们开发一个区块链应用，常常需要【未经授权禁止转载】著作权归作者所有，禁止商业用途转载。保证把数据放在客户端本地，而非服务器，所【作者：唐霜】【本文受版权保护】以，这个时候，数据库必须和应用代码一起发本文作者：唐霜，转载请注明出处。【版权所有，侵权必究】布。当然，如果你能强制用户在安装你的应用【版权所有，侵权必究】【本文受版权保护】之前安装一个本地数据库服务，也是可行的，【原创内容，转载请注明出处】原创内容，盗版必究。比如微软的很多软件，就要求你事先安装.n本文版权归作者所有，未经授权不得转载。【版权所有】唐霜 www.tangshuang.netet framework。不过这种需求显【转载请注明来源】【本文受版权保护】然体验感不是很好，除非是企业级用户。

原创内容，盗版必究。本文版权归作者所有，未经授权不得转载。【未经授权禁止转载】【本文受版权保护】

sqlite是非常轻量级的sql数据库，未经授权，禁止复制转载。本文作者：唐霜，转载请注明出处。最重要的是，它是基于文件的，而非内存的，【访问 www.tangshuang.net 获取更多精彩内容】未经授权，禁止复制转载。它的所有数据被保存在一个.db文件里面，【版权所有】唐霜 www.tangshuang.net【访问 www.tangshuang.net 获取更多精彩内容】而且不依赖任何服务。也就是说，你可以将这原创内容，盗版必究。【版权所有】唐霜 www.tangshuang.net个数据库打包进自己的应用，而不用要求用户【原创内容，转载请注明出处】【访问 www.tangshuang.net 获取更多精彩内容】在安装你的应用之前再安装一个其他什么数据【版权所有，侵权必究】【访问 www.tangshuang.net 获取更多精彩内容】库了。不过当然，sqlite的性能在遇到【作者：唐霜】【关注微信公众号：wwwtangshuangnet】大数据量的时候是不怎么理想的，因此，我们【转载请注明来源】【版权所有，侵权必究】需要通过各种优化手段和架构来控制单个数据【关注微信公众号：wwwtangshuangnet】【关注微信公众号：wwwtangshuangnet】库的数据量，采用分库等方式，提高后期可能转载请注明出处：www.tangshuang.net著作权归作者所有，禁止商业用途转载。的查询能力。

leveldb和sqlite一样，也是基【本文受版权保护】【关注微信公众号：wwwtangshuangnet】于文件系统的，可以被打包进应用。它具备非原创内容，盗版必究。【未经授权禁止转载】常高的写性能，由于设计简单，它的读性能也著作权归作者所有，禁止商业用途转载。【原创不易，请尊重版权】完全不输给内存级的key-value数据【访问 www.tangshuang.net 获取更多精彩内容】【作者：唐霜】库。当然，因为它的设计简单，它没有分库等转载请注明出处：www.tangshuang.net【作者：唐霜】功能。我们需要通过合理的控制key的前缀【本文首发于唐霜的博客】【版权所有，侵权必究】，来保证我们可以通过有一定规律的key来【未经授权禁止转载】原创内容，盗版必究。找到想要的数据集合。

数据库表结构

我们以一个博客系统为例来进行分析，毕竟基【关注微信公众号：wwwtangshuangnet】【原创不易，请尊重版权】于数据库技术的应用千变万化，结构不可能只【转载请注明来源】【转载请注明来源】有一种。但是，我们通过这个案例，可以分析【版权所有，侵权必究】本文作者：唐霜，转载请注明出处。出，区块链应用怎么在业务、用户、块链三者转载请注明出处：www.tangshuang.net本文作者：唐霜，转载请注明出处。之间建立“不可篡改”的存储数据。

本文作者：唐霜，转载请注明出处。本文作者：唐霜，转载请注明出处。著作权归作者所有，禁止商业用途转载。

首先是区块表（block table）。

【作者：唐霜】【原创不易，请尊重版权】【本文首发于唐霜的博客】

转载请注明出处：www.tangshuang.net未经授权，禁止复制转载。【原创内容，转载请注明出处】

字段名	类型	长度	备注
version	string	8	客户端的版本
block_hash	string	128	区块hash
previous_block_hash	string	128	上一个区块hash
timestamp	number	16	挖矿时间戳
diffculty	number	32	挖矿难度
nonce	number	16	挖矿随机数
merkle_root	string	128	业务数据的merkle root hash

这就是一个区块链的区块表，这些是基础字段【本文首发于唐霜的博客】【原创不易，请尊重版权】，作为一个应用，可以在这个基础上进行扩展未经授权，禁止复制转载。【本文首发于唐霜的博客】，但是应该遵循一个规则，就是尽可能的保证【本文受版权保护】【版权所有】唐霜 www.tangshuang.net存储的数据更少，能够通过计算得到的数据，本文作者：唐霜，转载请注明出处。本文作者：唐霜，转载请注明出处。就不要设计在sql数据库里面去，可以考虑【访问 www.tangshuang.net 获取更多精彩内容】【访问 www.tangshuang.net 获取更多精彩内容】放在key-value数据库里面去。要知【版权所有】唐霜 www.tangshuang.net【原创不易，请尊重版权】道，当一个应用运行N年以后，即使看上去这【未经授权禁止转载】【版权所有】唐霜 www.tangshuang.net么几个字段的表，也会多到爆炸。

业务数据表。

【关注微信公众号：wwwtangshuangnet】原创内容，盗版必究。本文作者：唐霜，转载请注明出处。【原创内容，转载请注明出处】

下面是业务数据，也就是我们这里假设的博客【本文首发于唐霜的博客】【转载请注明来源】的内容。对于一篇博客，我们必要的字段其实未经授权，禁止复制转载。【本文受版权保护】不多：

本文版权归作者所有，未经授权不得转载。转载请注明出处：www.tangshuang.net转载请注明出处：www.tangshuang.net

字段名	类型	长度	备注
version	string	8	客户端的版本
article_hash	string	128	文章hash（相当于文章ID）
article_title	string	128	文章标题
article_timestamp	number	16	文章时间戳
article_content	longtext		文章内容
article_author	string	128	撰写文章的用户hash
block_hash	string	128	这篇文章所在的区块hash

你看到block_hash可能会觉得奇怪本文版权归作者所有，未经授权不得转载。本文版权归作者所有，未经授权不得转载。，没错，在插入文章数据前，block_h未经授权，禁止复制转载。未经授权，禁止复制转载。ash已经被计算出来了。

【关注微信公众号：wwwtangshuangnet】【本文受版权保护】未经授权，禁止复制转载。【本文受版权保护】

既然是博客系统，那么评论也是必须的：

【关注微信公众号：wwwtangshuangnet】【访问 www.tangshuang.net 获取更多精彩内容】未经授权，禁止复制转载。本文版权归作者所有，未经授权不得转载。

字段名	类型	长度	备注
version	string	8	客户端的版本
comment_hash	string	128	评论hash（相当于评论ID）
comment_article_hash	string	128	这条评论是属于哪一篇文章的
comment_parent_hash	string	128	这条评论是回复给哪一条评论的，默认为0，表示不是回复给评论，而是直接评论给文章
comment_timestamp	number	16	评论时间戳
comment_content	longtext		评论内容
comment_author	string	128	评论的用户hash
block_hash	string	128	这条评论所在的区块hash

上面就是区块链的数据库表了。

等一等，用户数据呢？难道你都不把用户数据【本文首发于唐霜的博客】著作权归作者所有，禁止商业用途转载。保存下来，这顶什么用？难道界面上直接显示【关注微信公众号：wwwtangshuangnet】著作权归作者所有，禁止商业用途转载。用户的hash就算了？别慌。用户数据属于转载请注明出处：www.tangshuang.net【本文首发于唐霜的博客】加密体系的一部分，不会被记录到区块链中，【访问 www.tangshuang.net 获取更多精彩内容】本文版权归作者所有，未经授权不得转载。而是记录在chainstate中，你想想【原创内容，转载请注明出处】著作权归作者所有，禁止商业用途转载。，用户难道还不要经常换换头像、改改昵称什【未经授权禁止转载】【版权所有，侵权必究】么的么？而且，我们可以通过用户的密钥来对【本文受版权保护】【关注微信公众号：wwwtangshuangnet】用户的权限进行验证。这下面的部分再详细阐原创内容，盗版必究。本文作者：唐霜，转载请注明出处。述。

原创内容，盗版必究。原创内容，盗版必究。原创内容，盗版必究。【原创不易，请尊重版权】

未经授权，禁止复制转载。原创内容，盗版必究。【转载请注明来源】本文作者：唐霜，转载请注明出处。

merkle_root = sha256(sha256( article_hash1 + article_hash2 + ... comment_hash1 + comment_hash2 + ... ))

在验证一个数据是否被改动时，利用merk本文作者：唐霜，转载请注明出处。转载请注明出处：www.tangshuang.netle的验证算法，从区块链里面查询出对应的【未经授权禁止转载】【转载请注明来源】数据进行merkle验证就可以知道是不是未经授权，禁止复制转载。本文版权归作者所有，未经授权不得转载。有问题了。

chainstate数据结构

前面提到我们用key-value数据库保【本文受版权保护】本文作者：唐霜，转载请注明出处。存chainstate数据，我们尽量让k【原创不易，请尊重版权】【作者：唐霜】ey-value更加扁平，不要做多层嵌套未经授权，禁止复制转载。转载请注明出处：www.tangshuang.net。现在我们来看下用户数据：

【原创不易，请尊重版权】原创内容，盗版必究。未经授权，禁止复制转载。

"author_03a89fc89aa9c7b7..." => {
  "nickname": "tony",
  "publicKey": "a8fcdc982eda..",
  "avatar": "data:image/png;base64,...",
  "description": "I'm a clear boy."
}

而一个用户的hash是通过该用户的公钥经【原创不易，请尊重版权】著作权归作者所有，禁止商业用途转载。过加密得到的，要验证该用户的真实性，只需本文版权归作者所有，未经授权不得转载。本文作者：唐霜，转载请注明出处。要用他的公钥加密某个随机数，让他用私钥解转载请注明出处：www.tangshuang.net【原创内容，转载请注明出处】密进行验证即可。

另外，有很多发布了但还没有记录到区块链里【版权所有，侵权必究】本文作者：唐霜，转载请注明出处。面的文章，等着被矿工写入。为了防止矿工篡著作权归作者所有，禁止商业用途转载。【原创内容，转载请注明出处】改用户发布的内容，用户发布时，仅广播内容【本文首发于唐霜的博客】【未经授权禁止转载】的hash，原始内容经过加密，矿工仅利用【作者：唐霜】本文作者：唐霜，转载请注明出处。这些hash进行挖矿，挖矿成功后才能解锁【版权所有】唐霜 www.tangshuang.net【关注微信公众号：wwwtangshuangnet】原始内容：

转载请注明出处：www.tangshuang.net本文版权归作者所有，未经授权不得转载。【未经授权禁止转载】本文版权归作者所有，未经授权不得转载。

"block_0ca452ced99..._merkle_hashes" => [
  {
    "author_hash": "03a89fc89aa9c7b7...",
    "article_hash": "0034cd00e37...",
    "article_raw_script": "xxx..."
  },
  ...
]

评论数据也是一样，它们被暂时保存在cha本文作者：唐霜，转载请注明出处。【作者：唐霜】instate里面，等到区块生成之后，这【作者：唐霜】本文作者：唐霜，转载请注明出处。些临时数据就可以从chainstate里著作权归作者所有，禁止商业用途转载。【本文受版权保护】面清除。

总结

本文从一个区块链应用的底层数据库出发去看本文版权归作者所有，未经授权不得转载。本文版权归作者所有，未经授权不得转载。区块链应用。当然，这里面还有很多细节，需【作者：唐霜】本文版权归作者所有，未经授权不得转载。要在开发中去解决，这里只是提供了底层数据【本文受版权保护】转载请注明出处：www.tangshuang.net库选择和设计的一个思路。在一些具体问题上转载请注明出处：www.tangshuang.net【版权所有，侵权必究】，比如共识机制，比如如何刺激用户贡献内容【作者：唐霜】【未经授权禁止转载】等等，都是一个待解决的问题。

【本文首发于唐霜的博客】【未经授权禁止转载】原创内容，盗版必究。【转载请注明来源】【本文受版权保护】未经授权，禁止复制转载。转载请注明出处：www.tangshuang.net【本文受版权保护】【原创不易，请尊重版权】本文作者：唐霜，转载请注明出处。【本文受版权保护】本文版权归作者所有，未经授权不得转载。【访问 www.tangshuang.net 获取更多精彩内容】【关注微信公众号：wwwtangshuangnet】【版权所有，侵权必究】本文版权归作者所有，未经授权不得转载。【本文受版权保护】未经授权，禁止复制转载。【版权所有】唐霜 www.tangshuang.net本文作者：唐霜，转载请注明出处。【未经授权禁止转载】本文作者：唐霜，转载请注明出处。原创内容，盗版必究。【未经授权禁止转载】【本文首发于唐霜的博客】未经授权，禁止复制转载。【转载请注明来源】本文作者：唐霜，转载请注明出处。【转载请注明来源】本文作者：唐霜，转载请注明出处。【本文受版权保护】

2018-04-07 17706 leveldb, sqlite

已有4条评论

dongfeng 2019-04-22 12:32

你好我想请问一下，从哪里能够获得比特币区块数据（就是获得区块链上真实的一个个区块）啊？因为要做实验谢谢啦

回复
- 否子戈 2019-04-22 12:41
  
  你可以下载官方的钱包客户端，同步整个链，然后用一个第三方工具去将链数据格式化为结构化数据。
  不知道有没有第三方提供完整的链数据，你自己谷歌吧。
  
  回复
  - dongfeng 2019-04-24 14:19
    
    你好，文中您说的那个存储区块链数据的.dat文件是在哪里找到的啊？一个.dat文件是不是一个区块？
    
    回复
    - 否子戈 2019-04-28 22:28
      
      .dat文件是最早的比特币钱包的数据文件，是一种非常原始且结构不常见的数据，最早的时候是一个区块一个.dat，但是后来随着技术更新，.dat文件好像已经不用了，钱包采用了新的数据存储形式，我已经没关注很久了，不知道现在的具体情况
      
      回复

唐霜

为区块链应用设计本地数据库存储结构

选择底层数据库

数据库表结构

chainstate数据结构

总结

为价值买单，打赏一杯咖啡

声明

关于

生态