基于策略梯度算法的工作量证明中挖矿困境研究
文档信息
主题 关于论文中的毕业论文”的参考范文。
属性 Doc-01BPTGdoc格式正文2430字。质优实惠欢迎下载
适用
目录
目录. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1
正文. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1
搞要. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1
关键字区块链;工作量证明机制;博弈论;深度强化学习;策略梯度算法. . . . . . . . . . . . . . . . . . . . .2
0引言. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .3
正文
基于策略梯度算法的工作量证明中挖矿困境研究
搞要
摘要摘要针对区块链中工作量证明 PoW共识机制下区块截留攻击导致的挖矿困境问题将矿池间的博弈行为视作迭代的囚徒困境 IPD模型采用深度强化学习的策略梯度算法研究IPD的策略选择。利用该算法将每个矿池视为独立的智能体Agent 将矿工的潜入率量化为强化学习中的行为分布通过策略梯度算法中的策略网络对Agent的行为进行预测和优化最大化矿工的人均收益并通过模拟实验验证了策略梯度算法的有效性。实验发现前期矿池处于相互攻击状态平均收益小于1 出现了纳
什均衡的问题;经过pol icygradient算法的自我调整后矿池由相互攻击转变为相互合作每个矿池的潜入率趋于0 人均收益趋于1。实验结果表明 pol icygradient算法可以解决挖矿困境的纳什均衡问题最大化矿池人均收益
关键字区块链;工作量证明机制;博弈论;深度强化学习;策略梯度算法
中图分类号TP183
文献标志码A
Abstract Inviewof the mining di lemma problem caused byblockwithholding attack under Proof of Work PoW consensusmechanism in the blockchain thegame behavior between miningpoolswas regarded as anIterative Prisoner’ s Di lemma IPDmodel and the pol icygradientalgorithm of deep reinforcementlearning was used to studyIPD’ s strategychoices. Each mining poolwas considered as an independentAgentand the miners infi ltrationratewas quantified as a behaviordistribution in reinforcementlearning.The pol icy networkin the pol icygradientwas used topredictand optimizetheAgent’ s behavior in orderto maximizeminers’ average revenues.And the effectiveness of the pol icygradient algorithm wasval idated through simulation experiments.Experimental results showthat the mining pools attackeach otheratthe beginning with miners’ average revenue less than 1 whichcauses Nash equi l ibrium problem.Afterselfadjustmentbythe pol icy
gradient algorithm the relationship between the mining poolstransforms from mutual attack to mutual cooperation withinfi ltration rate of each mining pool tending to zero and miners’average revenue tending to 1.The results showthat the pol icygradientalgorithm cansolve the Nashequi l ibrium problem ofmining di lemma and maximizethe miners’ average revenue.
英文關键词Key words blockchain; Proof of Work PoW ;game;deep reinforcement learning;pol icygradientalgorithm
0引言
区块链是比特币[1]等加密货币的底层实现技术比特币作为区块链最为成功的应用场景是在工作量证明 Proof of Work PoW的共识机制下完成交易内容的。在比特币系统中每个节点都会参与到区块的生产中并提供一定的PoW首先生产出区块的节点可以获得一定的比特币奖励。这一过程就是“挖矿” 参与挖矿的节点称为“矿工” 。按照比特币系统的设定区块大约10min产生一个意味着大多数矿工挖不到区块为获得相对稳定的收入矿工会选择性地加入矿池进行合作挖矿。矿池由矿池管理员和若干矿工组成矿工会不断地向管理员发送部分工作量证明戒完整的工作量证明矿池管理员会按照各个成员的工作量贡献比分发收益。
然而有些矿工只向管理员发送部分工作量证明若获取到完整的工作量证明会选择丢弃即只获得矿池的部分收益而不贡献有效算力这种行为被称为区块截留攻击blockwithholding attack [2]。矿池可以利用自己的矿工潜入其他矿池对其进行区块截留攻击以增加自己的收益但是当所
有矿池都相互攻击时它们的收益将低于互不攻击的情形此即PoW共识漏洞产生的挖矿困境可视为博弈论中的囚徒困境模型。其存在一个纳什均衡点没有一方可以通过改变自己的行为策略来提高整体收益[3]。本文的核心内容是如何在PoW共识机制下优化矿池行为选择来增加其人均收益以解决区块截留攻击导致的矿难问题。
“基于策略梯度算法的工作量证明中挖矿困境研究”文档源于网络本人编辑整理。本着保护作者知识产权的原则仅供学习交流请勿商用。如有侵犯作者权益请作者留言戒者发站内信息联系本人我将尽快删除。谢谢您的阅读与下载
hostkvm在2021年3月新上线洛杉矶新VPS业务,强制三网接入中国联通优化线路,是当前中美之间性价比最高、最火热的线路之一,性价比高、速度非常好,接近联通AS9929和电信AS4809的效果,带宽充裕,晚高峰也不爆炸。 官方网站:https://hostkvm.com 全场优惠码:2021(全场通用八折,终身码,长期) 美国 US-Plan0【三网联通优化线路】 内存:1G CPU:...
天上云怎么样?天上云隶属于成都天上云网络科技有限公司,是一家提供云服务器及物理服务器的国人商家,目前商家针对香港物理机在做优惠促销,香港沙田机房采用三网直连,其中电信走CN2,带宽为50Mbps,不限制流量,商家提供IPMI,可以自行管理,随意安装系统,目前E3-1225/16G的套餐低至572元每月,有做大规模业务的朋友可以看看。点击进入:天上云官方网站天上云香港物理机服务器套餐:香港沙田数据中...
Boomer.Host是一家比较新的国外主机商,虽然LEB自述 we’re now more than 2 year old,商家提供虚拟主机和VPS,其中VPS主机基于OpenVZ架构,数据中心为美国得克萨斯州休斯敦。目前,商家在LET发了两款特别促销套餐,年付最低3.5美元起,特别提醒:低价低配,且必须年付,请务必自行斟酌确定需求再入手。下面列出几款促销套餐的配置信息。CPU:1core内存:...