为区块链应用设计本地数据库存储结构

广告位招租
扫码页面底部二维码联系

区块链和区块链应用这两个概念是不一样的。【访问 www.tangshuang.net 获取更多精彩内容】【本文受版权保护】对于一个纯区块链而言,只需要保证它拥有三【原创内容,转载请注明出处】本文版权归作者所有,未经授权不得转载。个要素:1.链表结构的区块存储结构设计,本文版权归作者所有,未经授权不得转载。【转载请注明来源】2.点对点网络,3.加密技术保证不可伪造【未经授权禁止转载】【未经授权禁止转载】。但是对于一款应用,特别是现代的应用,这【本文受版权保护】【版权所有,侵权必究】三个要素完全不够。对于一个应用,还要考虑著作权归作者所有,禁止商业用途转载。著作权归作者所有,禁止商业用途转载。:1.用户(账号)体系,2.鉴权体系,3本文版权归作者所有,未经授权不得转载。【本文受版权保护】.业务数据。因此,我们这篇文章要来探讨一【关注微信公众号:wwwtangshuangnet】【本文受版权保护】下,一个区块链应用应该如何设计它本地的数【本文首发于唐霜的博客】本文版权归作者所有,未经授权不得转载。据库存储结构。

【原创不易,请尊重版权】转载请注明出处:www.tangshua【本文受版权保护】【作者:唐霜】ng.net

选择底层数据库

对于区块链应用而言,有两个部分的数据:区【版权所有】唐霜 www.tangshuang.net【本文受版权保护】块链数据和应用状态数据。以比特币为例,区【访问 www.tangshuang.net 获取更多精彩内容】转载请注明出处:www.tangshuang.net块链数据中保存着历史交易数据,而这些数据【版权所有,侵权必究】原创内容,盗版必究。包含了上述提到的那几个方面,除了历史交易转载请注明出处:www.tangshuang.net未经授权,禁止复制转载。数据,比特币客户端(应用)还需要保存没有【访问 www.tangshuang.net 获取更多精彩内容】转载请注明出处:www.tangshuang.net被写入区块链的一些数据,比如过去一段时间本文作者:唐霜,转载请注明出处。【访问 www.tangshuang.net 获取更多精彩内容】发起的新交易。比特币的区块链数据被存储在转载请注明出处:www.tangshuang.net本文作者:唐霜,转载请注明出处。很多.dat文件中,它采用的数据结构我至【访问 www.tangshuang.net 获取更多精彩内容】转载请注明出处:www.tangshuang.net今没有搞懂,阅读了很多材料,都没有明白比【本文受版权保护】著作权归作者所有,禁止商业用途转载。特币raw data使用的是什么技术,不【访问 www.tangshuang.net 获取更多精彩内容】转载请注明出处:www.tangshuang.net过市面上已经有很多软件可以直接解析比特币原创内容,盗版必究。转载请注明出处:www.tangshuang.net区块链数据,所以读取比特币区块链也不是什【版权所有,侵权必究】【转载请注明来源】么问题。而比特币的这些.dat区块数据不本文版权归作者所有,未经授权不得转载。本文版权归作者所有,未经授权不得转载。是以我们熟悉的数据结构存储的,所以在查询转载请注明出处:www.tangshuang.net转载请注明出处:www.tangshuang.net数据的时候,无法像现代数据库一样通过查询【版权所有】唐霜 www.tangshuang.net【原创内容,转载请注明出处】语句或方法快速查询。为了解决验证某个交易【版权所有】唐霜 www.tangshuang.net【作者:唐霜】的速度,比特币采用了leveldb作为k【本文受版权保护】【原创不易,请尊重版权】ey-value数据库保存着整个区块链的【原创内容,转载请注明出处】【访问 www.tangshuang.net 获取更多精彩内容】索引,以保证可能通过各种key快速找到需【原创内容,转载请注明出处】转载请注明出处:www.tangshuang.net要的数据。另外,那些还没有写入区块链的c【原创不易,请尊重版权】【版权所有,侵权必究】hainstate数据也是用leveld转载请注明出处:www.tangshuang.net未经授权,禁止复制转载。b保存在另外一个库中。

【未经授权禁止转载】本文版权归作者所有,未经授权不得转载。

那么对于非币应用,或者代币应用,怎么来搞【本文首发于唐霜的博客】【版权所有】唐霜 www.tangshuang.net自己的数据库呢?

著作权归作者所有,禁止商业用途转载。【未经授权禁止转载】转载请注明出处:www.tangshua未经授权,禁止复制转载。【版权所有,侵权必究】ng.net

上面你可以看到,实际上,一个区块链数据库未经授权,禁止复制转载。本文作者:唐霜,转载请注明出处。结构里面包含三个(或更多)部分:1.只能【本文首发于唐霜的博客】【访问 www.tangshuang.net 获取更多精彩内容】执行插入和查询动作的块链数据库,2.块链本文作者:唐霜,转载请注明出处。未经授权,禁止复制转载。数据的索引,3.chainstate数据【关注微信公众号:wwwtangshuangnet】原创内容,盗版必究。,这个数据是可变的。而怎么把账号体系、业【原创内容,转载请注明出处】【未经授权禁止转载】务体系等数据加入进去呢?很明显,账号体系转载请注明出处:www.tangshuang.net原创内容,盗版必究。、鉴权体系、业务体系的数据全部要入链。在未经授权,禁止复制转载。转载请注明出处:www.tangshuang.netp2p同步时,只有block数据被同步,【关注微信公众号:wwwtangshuangnet】【转载请注明来源】其他数据都是通过网络广播等方式传递和接收转载请注明出处:www.tangshuang.net【作者:唐霜】的,索引数据在同步时创建。

【转载请注明来源】未经授权,禁止复制转载。【原创不易,请尊重版权】

用sql数据库保存区块链。

本文版权归作者所有,未经授权不得转载。【本文受版权保护】【作者:唐霜】

我们抓住区块链表的特征,即下一个区块保存著作权归作者所有,禁止商业用途转载。【本文首发于唐霜的博客】着上一个区块的hash,同时通过merk未经授权,禁止复制转载。【版权所有,侵权必究】le算法保存了区块内容的hash。所以,原创内容,盗版必究。【版权所有,侵权必究】我们其实很好利用sql数据库来保存blo【版权所有,侵权必究】本文版权归作者所有,未经授权不得转载。ck数据,而且,sql数据库可以自定义索【作者:唐霜】【作者:唐霜】引,所以,索引数据库都省了。因此,我们的【本文受版权保护】本文作者:唐霜,转载请注明出处。应用里面,可以最终总结为两类数据:块链数【作者:唐霜】本文作者:唐霜,转载请注明出处。据、chainstate数据。其中块链数【关注微信公众号:wwwtangshuangnet】本文作者:唐霜,转载请注明出处。据使用sql数据库保存,只具备inser【原创内容,转载请注明出处】未经授权,禁止复制转载。t和select的权限。而chainst原创内容,盗版必究。本文作者:唐霜,转载请注明出处。ate使用kek-value数据库保存,【未经授权禁止转载】【本文受版权保护】读取效率更高。

【关注微信公众号:wwwtangshua【未经授权禁止转载】【版权所有】唐霜 www.tangshuang.netngnet】【版权所有,侵权必究】【关注微信公众号:wwwtangshua【本文受版权保护】著作权归作者所有,禁止商业用途转载。ngnet】【转载请注明来源】

用sqlite和leveldb作为底层数著作权归作者所有,禁止商业用途转载。【原创不易,请尊重版权】据库。

【版权所有】唐霜 www.tangshu【原创内容,转载请注明出处】【访问 www.tangshuang.net 获取更多精彩内容】ang.net本文作者:唐霜,转载请注明出处。

sql数据库和key-value数据库都【访问 www.tangshuang.net 获取更多精彩内容】本文版权归作者所有,未经授权不得转载。有很多很多,比如orcal、redis等【关注微信公众号:wwwtangshuangnet】原创内容,盗版必究。等,但是我们开发一个区块链应用,常常需要未经授权,禁止复制转载。【作者:唐霜】保证把数据放在客户端本地,而非服务器,所【本文受版权保护】【未经授权禁止转载】以,这个时候,数据库必须和应用代码一起发著作权归作者所有,禁止商业用途转载。【转载请注明来源】布。当然,如果你能强制用户在安装你的应用本文作者:唐霜,转载请注明出处。【转载请注明来源】之前安装一个本地数据库服务,也是可行的,本文版权归作者所有,未经授权不得转载。【作者:唐霜】比如微软的很多软件,就要求你事先安装.n【关注微信公众号:wwwtangshuangnet】【版权所有】唐霜 www.tangshuang.netet framework。不过这种需求显【原创不易,请尊重版权】【作者:唐霜】然体验感不是很好,除非是企业级用户。

著作权归作者所有,禁止商业用途转载。【转载请注明来源】【版权所有】唐霜 www.tangshu著作权归作者所有,禁止商业用途转载。著作权归作者所有,禁止商业用途转载。ang.net【版权所有,侵权必究】

sqlite是非常轻量级的sql数据库,【作者:唐霜】著作权归作者所有,禁止商业用途转载。最重要的是,它是基于文件的,而非内存的,【转载请注明来源】【本文受版权保护】它的所有数据被保存在一个.db文件里面,著作权归作者所有,禁止商业用途转载。【原创内容,转载请注明出处】而且不依赖任何服务。也就是说,你可以将这【本文受版权保护】本文作者:唐霜,转载请注明出处。个数据库打包进自己的应用,而不用要求用户【访问 www.tangshuang.net 获取更多精彩内容】【原创不易,请尊重版权】在安装你的应用之前再安装一个其他什么数据【版权所有,侵权必究】【本文首发于唐霜的博客】库了。不过当然,sqlite的性能在遇到原创内容,盗版必究。【版权所有】唐霜 www.tangshuang.net大数据量的时候是不怎么理想的,因此,我们本文版权归作者所有,未经授权不得转载。【本文受版权保护】需要通过各种优化手段和架构来控制单个数据【原创内容,转载请注明出处】【本文受版权保护】库的数据量,采用分库等方式,提高后期可能【版权所有,侵权必究】【版权所有】唐霜 www.tangshuang.net的查询能力。

本文作者:唐霜,转载请注明出处。【作者:唐霜】【关注微信公众号:wwwtangshua【未经授权禁止转载】【关注微信公众号:wwwtangshuangnet】ngnet】

leveldb和sqlite一样,也是基转载请注明出处:www.tangshuang.net未经授权,禁止复制转载。于文件系统的,可以被打包进应用。它具备非【版权所有,侵权必究】本文作者:唐霜,转载请注明出处。常高的写性能,由于设计简单,它的读性能也【关注微信公众号:wwwtangshuangnet】本文作者:唐霜,转载请注明出处。完全不输给内存级的key-value数据【原创内容,转载请注明出处】【本文首发于唐霜的博客】库。当然,因为它的设计简单,它没有分库等原创内容,盗版必究。原创内容,盗版必究。功能。我们需要通过合理的控制key的前缀转载请注明出处:www.tangshuang.net【版权所有】唐霜 www.tangshuang.net,来保证我们可以通过有一定规律的key来转载请注明出处:www.tangshuang.net原创内容,盗版必究。找到想要的数据集合。

【关注微信公众号:wwwtangshua【访问 www.tangshuang.net 获取更多精彩内容】【版权所有,侵权必究】ngnet】【关注微信公众号:wwwtangshua【未经授权禁止转载】本文版权归作者所有,未经授权不得转载。ngnet】著作权归作者所有,禁止商业用途转载。【本文首发于唐霜的博客】

数据库表结构

我们以一个博客系统为例来进行分析,毕竟基原创内容,盗版必究。【转载请注明来源】于数据库技术的应用千变万化,结构不可能只【版权所有】唐霜 www.tangshuang.net著作权归作者所有,禁止商业用途转载。有一种。但是,我们通过这个案例,可以分析本文作者:唐霜,转载请注明出处。【原创内容,转载请注明出处】出,区块链应用怎么在业务、用户、块链三者本文作者:唐霜,转载请注明出处。转载请注明出处:www.tangshuang.net之间建立“不可篡改”的存储数据。

原创内容,盗版必究。未经授权,禁止复制转载。转载请注明出处:www.tangshua【原创内容,转载请注明出处】【版权所有】唐霜 www.tangshuang.netng.net

首先是区块表(block table)。

未经授权,禁止复制转载。未经授权,禁止复制转载。未经授权,禁止复制转载。著作权归作者所有,禁止商业用途转载。

一个区块的表,需要记录这个区块的各种信息【作者:唐霜】【版权所有,侵权必究】,特别是区块头信息。我的设计如下:

【访问 www.tangshuang.n本文版权归作者所有,未经授权不得转载。著作权归作者所有,禁止商业用途转载。et 获取更多精彩内容】【访问 www.tangshuang.n【版权所有】唐霜 www.tangshuang.net【本文首发于唐霜的博客】et 获取更多精彩内容】原创内容,盗版必究。【访问 www.tangshuang.n本文作者:唐霜,转载请注明出处。【版权所有】唐霜 www.tangshuang.netet 获取更多精彩内容】
字段名 类型 长度 备注
version string 8 客户端的版本
block_hash string 128 区块hash
previous_block_hash string 128 上一个区块hash
timestamp number 16 挖矿时间戳
diffculty number 32 挖矿难度
nonce number 16 挖矿随机数
merkle_root string 128 业务数据的merkle root hash

这就是一个区块链的区块表,这些是基础字段【转载请注明来源】本文作者:唐霜,转载请注明出处。,作为一个应用,可以在这个基础上进行扩展【转载请注明来源】【关注微信公众号:wwwtangshuangnet】,但是应该遵循一个规则,就是尽可能的保证【版权所有】唐霜 www.tangshuang.net【原创内容,转载请注明出处】存储的数据更少,能够通过计算得到的数据,【本文首发于唐霜的博客】转载请注明出处:www.tangshuang.net就不要设计在sql数据库里面去,可以考虑未经授权,禁止复制转载。【原创内容,转载请注明出处】放在key-value数据库里面去。要知【原创内容,转载请注明出处】本文版权归作者所有,未经授权不得转载。道,当一个应用运行N年以后,即使看上去这【作者:唐霜】著作权归作者所有,禁止商业用途转载。么几个字段的表,也会多到爆炸。

原创内容,盗版必究。原创内容,盗版必究。【版权所有,侵权必究】本文作者:唐霜,转载请注明出处。

业务数据表。

【版权所有】唐霜 www.tangshu【转载请注明来源】【访问 www.tangshuang.net 获取更多精彩内容】ang.net【关注微信公众号:wwwtangshua著作权归作者所有,禁止商业用途转载。转载请注明出处:www.tangshuang.netngnet】

下面是业务数据,也就是我们这里假设的博客【版权所有】唐霜 www.tangshuang.net原创内容,盗版必究。的内容。对于一篇博客,我们必要的字段其实著作权归作者所有,禁止商业用途转载。原创内容,盗版必究。不多:

【作者:唐霜】著作权归作者所有,禁止商业用途转载。【关注微信公众号:wwwtangshua【访问 www.tangshuang.net 获取更多精彩内容】著作权归作者所有,禁止商业用途转载。ngnet】
字段名 类型 长度 备注
version string 8 客户端的版本
article_hash string 128 文章hash(相当于文章ID)
article_title string 128 文章标题
article_timestamp number 16 文章时间戳
article_content longtext 文章内容
article_author string 128 撰写文章的用户hash
block_hash string 128 这篇文章所在的区块hash

你看到block_hash可能会觉得奇怪本文作者:唐霜,转载请注明出处。【版权所有】唐霜 www.tangshuang.net,没错,在插入文章数据前,block_h【访问 www.tangshuang.net 获取更多精彩内容】转载请注明出处:www.tangshuang.netash已经被计算出来了。

原创内容,盗版必究。本文版权归作者所有,未经授权不得转载。原创内容,盗版必究。

既然是博客系统,那么评论也是必须的:

【版权所有】唐霜 www.tangshu【版权所有,侵权必究】【访问 www.tangshuang.net 获取更多精彩内容】ang.net【关注微信公众号:wwwtangshua转载请注明出处:www.tangshuang.net转载请注明出处:www.tangshuang.netngnet】转载请注明出处:www.tangshua【版权所有】唐霜 www.tangshuang.net【访问 www.tangshuang.net 获取更多精彩内容】ng.net
字段名 类型 长度 备注
version string 8 客户端的版本
comment_hash string 128 评论hash(相当于评论ID)
comment_article_hash string 128 这条评论是属于哪一篇文章的
comment_parent_hash string 128 这条评论是回复给哪一条评论的,默认为0,表示不是回复给评论,而是直接评论给文章
comment_timestamp number 16 评论时间戳
comment_content longtext 评论内容
comment_author string 128 评论的用户hash
block_hash string 128 这条评论所在的区块hash

上面就是区块链的数据库表了。

著作权归作者所有,禁止商业用途转载。【版权所有】唐霜 www.tangshu【本文首发于唐霜的博客】【转载请注明来源】ang.net【本文首发于唐霜的博客】【作者:唐霜】

等一等,用户数据呢?难道你都不把用户数据转载请注明出处:www.tangshuang.net本文版权归作者所有,未经授权不得转载。保存下来,这顶什么用?难道界面上直接显示【版权所有】唐霜 www.tangshuang.net【版权所有,侵权必究】用户的hash就算了?别慌。用户数据属于未经授权,禁止复制转载。【未经授权禁止转载】加密体系的一部分,不会被记录到区块链中,【本文首发于唐霜的博客】未经授权,禁止复制转载。而是记录在chainstate中,你想想著作权归作者所有,禁止商业用途转载。【原创不易,请尊重版权】,用户难道还不要经常换换头像、改改昵称什转载请注明出处:www.tangshuang.net【原创不易,请尊重版权】么的么?而且,我们可以通过用户的密钥来对【本文首发于唐霜的博客】本文版权归作者所有,未经授权不得转载。用户的权限进行验证。这下面的部分再详细阐转载请注明出处:www.tangshuang.net【转载请注明来源】述。

【访问 www.tangshuang.n未经授权,禁止复制转载。【本文受版权保护】et 获取更多精彩内容】【原创内容,转载请注明出处】【作者:唐霜】【转载请注明来源】

总之,对于一个博客系统,就上面这些字段就原创内容,盗版必究。【访问 www.tangshuang.net 获取更多精彩内容】够用啦。但是,要保证区块链数据的不可篡改转载请注明出处:www.tangshuang.net【转载请注明来源】性,我们还要做一些设计。

未经授权,禁止复制转载。转载请注明出处:www.tangshua【原创不易,请尊重版权】未经授权,禁止复制转载。ng.net【原创内容,转载请注明出处】
merkle_root = sha256(sha256( article_hash1 + article_hash2 + ... comment_hash1 + comment_hash2 + ... ))

在验证一个数据是否被改动时,利用merk【转载请注明来源】转载请注明出处:www.tangshuang.netle的验证算法,从区块链里面查询出对应的【作者:唐霜】【转载请注明来源】数据进行merkle验证就可以知道是不是【本文受版权保护】【版权所有】唐霜 www.tangshuang.net有问题了。

本文版权归作者所有,未经授权不得转载。转载请注明出处:www.tangshua【本文首发于唐霜的博客】【版权所有】唐霜 www.tangshuang.netng.net【本文受版权保护】

chainstate数据结构

前面提到我们用key-value数据库保著作权归作者所有,禁止商业用途转载。【关注微信公众号:wwwtangshuangnet】存chainstate数据,我们尽量让k未经授权,禁止复制转载。【作者:唐霜】ey-value更加扁平,不要做多层嵌套转载请注明出处:www.tangshuang.net转载请注明出处:www.tangshuang.net。现在我们来看下用户数据:

转载请注明出处:www.tangshua【本文首发于唐霜的博客】原创内容,盗版必究。ng.net【原创内容,转载请注明出处】
"author_03a89fc89aa9c7b7..." => {
  "nickname": "tony",
  "publicKey": "a8fcdc982eda..",
  "avatar": "data:image/png;base64,...",
  "description": "I'm a clear boy."
}

而一个用户的hash是通过该用户的公钥经原创内容,盗版必究。【版权所有,侵权必究】过加密得到的,要验证该用户的真实性,只需未经授权,禁止复制转载。【未经授权禁止转载】要用他的公钥加密某个随机数,让他用私钥解著作权归作者所有,禁止商业用途转载。未经授权,禁止复制转载。密进行验证即可。

本文版权归作者所有,未经授权不得转载。著作权归作者所有,禁止商业用途转载。

另外,有很多发布了但还没有记录到区块链里原创内容,盗版必究。【本文首发于唐霜的博客】面的文章,等着被矿工写入。为了防止矿工篡【访问 www.tangshuang.net 获取更多精彩内容】【原创内容,转载请注明出处】改用户发布的内容,用户发布时,仅广播内容本文作者:唐霜,转载请注明出处。本文作者:唐霜,转载请注明出处。的hash,原始内容经过加密,矿工仅利用著作权归作者所有,禁止商业用途转载。转载请注明出处:www.tangshuang.net这些hash进行挖矿,挖矿成功后才能解锁原创内容,盗版必究。原创内容,盗版必究。原始内容:

【原创内容,转载请注明出处】【转载请注明来源】【转载请注明来源】
"block_0ca452ced99..._merkle_hashes" => [
  {
    "author_hash": "03a89fc89aa9c7b7...",
    "article_hash": "0034cd00e37...",
    "article_raw_script": "xxx..."
  },
  ...
]

评论数据也是一样,它们被暂时保存在cha本文作者:唐霜,转载请注明出处。【关注微信公众号:wwwtangshuangnet】instate里面,等到区块生成之后,这本文版权归作者所有,未经授权不得转载。转载请注明出处:www.tangshuang.net些临时数据就可以从chainstate里未经授权,禁止复制转载。【转载请注明来源】面清除。

著作权归作者所有,禁止商业用途转载。【版权所有】唐霜 www.tangshu本文作者:唐霜,转载请注明出处。【版权所有】唐霜 www.tangshuang.netang.net

总结

本文从一个区块链应用的底层数据库出发去看著作权归作者所有,禁止商业用途转载。【访问 www.tangshuang.net 获取更多精彩内容】区块链应用。当然,这里面还有很多细节,需【原创内容,转载请注明出处】【本文首发于唐霜的博客】要在开发中去解决,这里只是提供了底层数据原创内容,盗版必究。转载请注明出处:www.tangshuang.net库选择和设计的一个思路。在一些具体问题上【版权所有】唐霜 www.tangshuang.net【作者:唐霜】,比如共识机制,比如如何刺激用户贡献内容【本文受版权保护】本文版权归作者所有,未经授权不得转载。等等,都是一个待解决的问题。

未经授权,禁止复制转载。著作权归作者所有,禁止商业用途转载。本文作者:唐霜,转载请注明出处。

2018-04-07 17177 ,

为价值买单,打赏一杯咖啡

本文价值171.77RMB
已有4条评论
  1. dongfeng 2019-04-22 12:32

    你好  我想请问一下,从哪里能够获得比特币区块数据(就是获得区块链上真实的一个个区块)啊? 因为要做实验 谢谢啦

    • 否子戈 2019-04-22 12:41

      你可以下载官方的钱包客户端,同步整个链,然后用一个第三方工具去将链数据格式化为结构化数据。
      不知道有没有第三方提供完整的链数据,你自己谷歌吧。

      • dongfeng 2019-04-24 14:19

        你好,文中 您说的那个存储区块链数据的.dat文件是在哪里找到的啊?一个.dat文件是不是一个区块?

        • 否子戈 2019-04-28 22:28

          .dat文件是最早的比特币钱包的数据文件,是一种非常原始且结构不常见的数据,最早的时候是一个区块一个.dat,但是后来随着技术更新,.dat文件好像已经不用了,钱包采用了新的数据存储形式,我已经没关注很久了,不知道现在的具体情况