基于策略梯度算法的工作量证明中挖矿困境研究
文档信息
主题 关于论文中的毕业论文”的参考范文。
属性 Doc-01BPTGdoc格式正文2430字。质优实惠欢迎下载
适用
目录
目录. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1
正文. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1
搞要. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1
关键字区块链;工作量证明机制;博弈论;深度强化学习;策略梯度算法. . . . . . . . . . . . . . . . . . . . .2
0引言. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .3
正文
基于策略梯度算法的工作量证明中挖矿困境研究
搞要
摘要摘要针对区块链中工作量证明 PoW共识机制下区块截留攻击导致的挖矿困境问题将矿池间的博弈行为视作迭代的囚徒困境 IPD模型采用深度强化学习的策略梯度算法研究IPD的策略选择。利用该算法将每个矿池视为独立的智能体Agent 将矿工的潜入率量化为强化学习中的行为分布通过策略梯度算法中的策略网络对Agent的行为进行预测和优化最大化矿工的人均收益并通过模拟实验验证了策略梯度算法的有效性。实验发现前期矿池处于相互攻击状态平均收益小于1 出现了纳
什均衡的问题;经过pol icygradient算法的自我调整后矿池由相互攻击转变为相互合作每个矿池的潜入率趋于0 人均收益趋于1。实验结果表明 pol icygradient算法可以解决挖矿困境的纳什均衡问题最大化矿池人均收益
关键字区块链;工作量证明机制;博弈论;深度强化学习;策略梯度算法
中图分类号TP183
文献标志码A
Abstract Inviewof the mining di lemma problem caused byblockwithholding attack under Proof of Work PoW consensusmechanism in the blockchain thegame behavior between miningpoolswas regarded as anIterative Prisoner’ s Di lemma IPDmodel and the pol icygradientalgorithm of deep reinforcementlearning was used to studyIPD’ s strategychoices. Each mining poolwas considered as an independentAgentand the miners infi ltrationratewas quantified as a behaviordistribution in reinforcementlearning.The pol icy networkin the pol icygradientwas used topredictand optimizetheAgent’ s behavior in orderto maximizeminers’ average revenues.And the effectiveness of the pol icygradient algorithm wasval idated through simulation experiments.Experimental results showthat the mining pools attackeach otheratthe beginning with miners’ average revenue less than 1 whichcauses Nash equi l ibrium problem.Afterselfadjustmentbythe pol icy
gradient algorithm the relationship between the mining poolstransforms from mutual attack to mutual cooperation withinfi ltration rate of each mining pool tending to zero and miners’average revenue tending to 1.The results showthat the pol icygradientalgorithm cansolve the Nashequi l ibrium problem ofmining di lemma and maximizethe miners’ average revenue.
英文關键词Key words blockchain; Proof of Work PoW ;game;deep reinforcement learning;pol icygradientalgorithm
0引言
区块链是比特币[1]等加密货币的底层实现技术比特币作为区块链最为成功的应用场景是在工作量证明 Proof of Work PoW的共识机制下完成交易内容的。在比特币系统中每个节点都会参与到区块的生产中并提供一定的PoW首先生产出区块的节点可以获得一定的比特币奖励。这一过程就是“挖矿” 参与挖矿的节点称为“矿工” 。按照比特币系统的设定区块大约10min产生一个意味着大多数矿工挖不到区块为获得相对稳定的收入矿工会选择性地加入矿池进行合作挖矿。矿池由矿池管理员和若干矿工组成矿工会不断地向管理员发送部分工作量证明戒完整的工作量证明矿池管理员会按照各个成员的工作量贡献比分发收益。
然而有些矿工只向管理员发送部分工作量证明若获取到完整的工作量证明会选择丢弃即只获得矿池的部分收益而不贡献有效算力这种行为被称为区块截留攻击blockwithholding attack [2]。矿池可以利用自己的矿工潜入其他矿池对其进行区块截留攻击以增加自己的收益但是当所
有矿池都相互攻击时它们的收益将低于互不攻击的情形此即PoW共识漏洞产生的挖矿困境可视为博弈论中的囚徒困境模型。其存在一个纳什均衡点没有一方可以通过改变自己的行为策略来提高整体收益[3]。本文的核心内容是如何在PoW共识机制下优化矿池行为选择来增加其人均收益以解决区块截留攻击导致的矿难问题。
“基于策略梯度算法的工作量证明中挖矿困境研究”文档源于网络本人编辑整理。本着保护作者知识产权的原则仅供学习交流请勿商用。如有侵犯作者权益请作者留言戒者发站内信息联系本人我将尽快删除。谢谢您的阅读与下载
diyvm怎么样?diyvm这是一家低调国人VPS主机商,成立于2009年,提供的产品包括VPS主机和独立服务器租用等,数据中心包括香港沙田、美国洛杉矶、日本大阪等,VPS主机基于XEN架构,均为国内直连线路,主机支持异地备份与自定义镜像,可提供内网IP。最近,DiyVM商家对香港机房VPS提供5折优惠码,最低2GB内存起优惠后仅需50元/月。点击进入:diyvm官方网站地址DiyVM香港机房CN...
傲游主机怎么样?傲游主机是一家成立于2010年的老牌国外VPS服务商,在澳大利亚及美国均注册公司,是由在澳洲留学的害羞哥、主机论坛知名版主组长等大佬创建,拥有多家海外直连线路机房资源,提供基于VPS主机和独立服务器租用等,其中VPS基于KVM或者XEN架构,可选机房包括中国香港、美国洛杉矶、韩国、日本、德国、荷兰等,均为CN2或者国内直连优秀线路。傲游主机提供8折优惠码:haixiuge,适用于全...
ProfitServer怎么样?ProfitServer好不好。ProfitServer是一家成立于2003的主机商家,是ITC控股的一个部门,主要经营的产品域名、SSL证书、虚拟主机、VPS和独立服务器,机房有俄罗斯、新加坡、荷兰、美国、保加利亚,VPS采用的是KVM虚拟架构,硬盘采用纯SSD,而且最大的优势是不限制流量,大公司运营,机器比较稳定,数据中心众多。此次ProfitServer正在对...