基于策略梯度算法的工作量证明中挖矿困境研究
文档信息
主题 关于论文中的毕业论文”的参考范文。
属性 Doc-01BPTGdoc格式正文2430字。质优实惠欢迎下载
适用
目录
目录. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1
正文. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1
搞要. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1
关键字区块链;工作量证明机制;博弈论;深度强化学习;策略梯度算法. . . . . . . . . . . . . . . . . . . . .2
0引言. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .3
正文
基于策略梯度算法的工作量证明中挖矿困境研究
搞要
摘要摘要针对区块链中工作量证明 PoW共识机制下区块截留攻击导致的挖矿困境问题将矿池间的博弈行为视作迭代的囚徒困境 IPD模型采用深度强化学习的策略梯度算法研究IPD的策略选择。利用该算法将每个矿池视为独立的智能体Agent 将矿工的潜入率量化为强化学习中的行为分布通过策略梯度算法中的策略网络对Agent的行为进行预测和优化最大化矿工的人均收益并通过模拟实验验证了策略梯度算法的有效性。实验发现前期矿池处于相互攻击状态平均收益小于1 出现了纳
什均衡的问题;经过pol icygradient算法的自我调整后矿池由相互攻击转变为相互合作每个矿池的潜入率趋于0 人均收益趋于1。实验结果表明 pol icygradient算法可以解决挖矿困境的纳什均衡问题最大化矿池人均收益
关键字区块链;工作量证明机制;博弈论;深度强化学习;策略梯度算法
中图分类号TP183
文献标志码A
Abstract Inviewof the mining di lemma problem caused byblockwithholding attack under Proof of Work PoW consensusmechanism in the blockchain thegame behavior between miningpoolswas regarded as anIterative Prisoner’ s Di lemma IPDmodel and the pol icygradientalgorithm of deep reinforcementlearning was used to studyIPD’ s strategychoices. Each mining poolwas considered as an independentAgentand the miners infi ltrationratewas quantified as a behaviordistribution in reinforcementlearning.The pol icy networkin the pol icygradientwas used topredictand optimizetheAgent’ s behavior in orderto maximizeminers’ average revenues.And the effectiveness of the pol icygradient algorithm wasval idated through simulation experiments.Experimental results showthat the mining pools attackeach otheratthe beginning with miners’ average revenue less than 1 whichcauses Nash equi l ibrium problem.Afterselfadjustmentbythe pol icy
gradient algorithm the relationship between the mining poolstransforms from mutual attack to mutual cooperation withinfi ltration rate of each mining pool tending to zero and miners’average revenue tending to 1.The results showthat the pol icygradientalgorithm cansolve the Nashequi l ibrium problem ofmining di lemma and maximizethe miners’ average revenue.
英文關键词Key words blockchain; Proof of Work PoW ;game;deep reinforcement learning;pol icygradientalgorithm
0引言
区块链是比特币[1]等加密货币的底层实现技术比特币作为区块链最为成功的应用场景是在工作量证明 Proof of Work PoW的共识机制下完成交易内容的。在比特币系统中每个节点都会参与到区块的生产中并提供一定的PoW首先生产出区块的节点可以获得一定的比特币奖励。这一过程就是“挖矿” 参与挖矿的节点称为“矿工” 。按照比特币系统的设定区块大约10min产生一个意味着大多数矿工挖不到区块为获得相对稳定的收入矿工会选择性地加入矿池进行合作挖矿。矿池由矿池管理员和若干矿工组成矿工会不断地向管理员发送部分工作量证明戒完整的工作量证明矿池管理员会按照各个成员的工作量贡献比分发收益。
然而有些矿工只向管理员发送部分工作量证明若获取到完整的工作量证明会选择丢弃即只获得矿池的部分收益而不贡献有效算力这种行为被称为区块截留攻击blockwithholding attack [2]。矿池可以利用自己的矿工潜入其他矿池对其进行区块截留攻击以增加自己的收益但是当所
有矿池都相互攻击时它们的收益将低于互不攻击的情形此即PoW共识漏洞产生的挖矿困境可视为博弈论中的囚徒困境模型。其存在一个纳什均衡点没有一方可以通过改变自己的行为策略来提高整体收益[3]。本文的核心内容是如何在PoW共识机制下优化矿池行为选择来增加其人均收益以解决区块截留攻击导致的矿难问题。
“基于策略梯度算法的工作量证明中挖矿困境研究”文档源于网络本人编辑整理。本着保护作者知识产权的原则仅供学习交流请勿商用。如有侵犯作者权益请作者留言戒者发站内信息联系本人我将尽快删除。谢谢您的阅读与下载
优林怎么样?优林好不好?优林 是一家国人VPS主机商,成立于2016年,主营国内外服务器产品。云服务器基于hyper-v和kvm虚拟架构,国内速度还不错。今天优林给我们带来促销的是国内东北地区哈尔滨云服务器!全部是独享带宽!首月5折 续费5折续费!地区CPU内存硬盘带宽价格购买哈尔滨电信2核2G50G1M53元直达链接哈尔滨电信4核4G50G1M83元直达链接哈尔滨电信8核8G50G1M131元直...
RackNerd 商家给的感觉就是一直蹭节日热点,然后时不时通过修改配置结构不断的提供低价年付的VPS主机,不过他们家还是在做事的,这么两年多的发展,居然已经有新增至十几个数据中心,而且产品线发展也是比较丰富。比如也有独立服务器业务,不过在他们轮番的低价年付VPS主机活动下,他们的服务器估摸着销路不是太好的。这里,今天有看到RackNerd商家的独立服务器业务有促销。这次提供美国多个机房的高配独立...
老鹰主机HawkHost是个人比较喜欢的海外主机商,如果没有记错的话,大约2012年左右的时候算是比较早提供支付宝付款的主机商。当然这个主机商成立时间更早一些的,由于早期提供支付宝付款后,所以受众用户比较青睐,要知道我们早期购买海外主机是比较麻烦的,信用卡和PAYPAL还没有普及,大家可能只有银联和支付宝,很多人选择海外主机还需要代购。虽然如今很多人建站少了,而且大部分人都用云服务器。但是老鹰主机...