基于策略梯度算法的工作量证明中挖矿困境研究
文档信息
主题 关于论文中的毕业论文”的参考范文。
属性 Doc-01BPTGdoc格式正文2430字。质优实惠欢迎下载
适用
目录
目录. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1
正文. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1
搞要. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1
关键字区块链;工作量证明机制;博弈论;深度强化学习;策略梯度算法. . . . . . . . . . . . . . . . . . . . .2
0引言. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .3
正文
基于策略梯度算法的工作量证明中挖矿困境研究
搞要
摘要摘要针对区块链中工作量证明 PoW共识机制下区块截留攻击导致的挖矿困境问题将矿池间的博弈行为视作迭代的囚徒困境 IPD模型采用深度强化学习的策略梯度算法研究IPD的策略选择。利用该算法将每个矿池视为独立的智能体Agent 将矿工的潜入率量化为强化学习中的行为分布通过策略梯度算法中的策略网络对Agent的行为进行预测和优化最大化矿工的人均收益并通过模拟实验验证了策略梯度算法的有效性。实验发现前期矿池处于相互攻击状态平均收益小于1 出现了纳
什均衡的问题;经过pol icygradient算法的自我调整后矿池由相互攻击转变为相互合作每个矿池的潜入率趋于0 人均收益趋于1。实验结果表明 pol icygradient算法可以解决挖矿困境的纳什均衡问题最大化矿池人均收益
关键字区块链;工作量证明机制;博弈论;深度强化学习;策略梯度算法
中图分类号TP183
文献标志码A
Abstract Inviewof the mining di lemma problem caused byblockwithholding attack under Proof of Work PoW consensusmechanism in the blockchain thegame behavior between miningpoolswas regarded as anIterative Prisoner’ s Di lemma IPDmodel and the pol icygradientalgorithm of deep reinforcementlearning was used to studyIPD’ s strategychoices. Each mining poolwas considered as an independentAgentand the miners infi ltrationratewas quantified as a behaviordistribution in reinforcementlearning.The pol icy networkin the pol icygradientwas used topredictand optimizetheAgent’ s behavior in orderto maximizeminers’ average revenues.And the effectiveness of the pol icygradient algorithm wasval idated through simulation experiments.Experimental results showthat the mining pools attackeach otheratthe beginning with miners’ average revenue less than 1 whichcauses Nash equi l ibrium problem.Afterselfadjustmentbythe pol icy
gradient algorithm the relationship between the mining poolstransforms from mutual attack to mutual cooperation withinfi ltration rate of each mining pool tending to zero and miners’average revenue tending to 1.The results showthat the pol icygradientalgorithm cansolve the Nashequi l ibrium problem ofmining di lemma and maximizethe miners’ average revenue.
英文關键词Key words blockchain; Proof of Work PoW ;game;deep reinforcement learning;pol icygradientalgorithm
0引言
区块链是比特币[1]等加密货币的底层实现技术比特币作为区块链最为成功的应用场景是在工作量证明 Proof of Work PoW的共识机制下完成交易内容的。在比特币系统中每个节点都会参与到区块的生产中并提供一定的PoW首先生产出区块的节点可以获得一定的比特币奖励。这一过程就是“挖矿” 参与挖矿的节点称为“矿工” 。按照比特币系统的设定区块大约10min产生一个意味着大多数矿工挖不到区块为获得相对稳定的收入矿工会选择性地加入矿池进行合作挖矿。矿池由矿池管理员和若干矿工组成矿工会不断地向管理员发送部分工作量证明戒完整的工作量证明矿池管理员会按照各个成员的工作量贡献比分发收益。
然而有些矿工只向管理员发送部分工作量证明若获取到完整的工作量证明会选择丢弃即只获得矿池的部分收益而不贡献有效算力这种行为被称为区块截留攻击blockwithholding attack [2]。矿池可以利用自己的矿工潜入其他矿池对其进行区块截留攻击以增加自己的收益但是当所
有矿池都相互攻击时它们的收益将低于互不攻击的情形此即PoW共识漏洞产生的挖矿困境可视为博弈论中的囚徒困境模型。其存在一个纳什均衡点没有一方可以通过改变自己的行为策略来提高整体收益[3]。本文的核心内容是如何在PoW共识机制下优化矿池行为选择来增加其人均收益以解决区块截留攻击导致的矿难问题。
“基于策略梯度算法的工作量证明中挖矿困境研究”文档源于网络本人编辑整理。本着保护作者知识产权的原则仅供学习交流请勿商用。如有侵犯作者权益请作者留言戒者发站内信息联系本人我将尽快删除。谢谢您的阅读与下载
Vultr 商家有新增韩国首尔机房,这个是继日本、新加坡之后的第三个亚洲机房。不过可以大概率知道肯定不是直连中国机房的,因为早期的日本机房有过直连后来取消的。今天准备体验看看VULTR VPS主机商的韩国首尔机房的云服务器的速度和性能。1、全球节点PING速度测试这里先通过PING测试工具看看全球几十个节点的PING速度。看到好像移动速度还不错。2、路由去程测试测试看看VULTR韩国首尔机房的节点...
蓝速数据金秋上云季2G58/年怎么样?蓝速数据物理机拼团0元购劲爆?蓝速数据服务器秒杀爆产品好不好?蓝速数据是广州五联科技信息有限公司旗下品牌云计算平台、采用国内首选Zkeys公有云建设多种开通方式、具有IDC、ISP从业资格证IDC运营商新老用户值得信赖的商家。我司主要从事内地的枣庄、宿迁、深圳、绍兴、成都(市、县)。待开放地区:北京、广州、十堰、西安、镇江(市、县)。等地区数据中心业务,均KV...
Budgetvm(原EZ机房),2005年成立的美国老品牌机房,主打美国4个机房(洛杉矶、芝加哥、达拉斯、迈阿密)和日本东京机房的独立服务器和VPS业务,而且不限制流量,默认提供免费的1800G DDoS防御服务,支持IPv6和IPMI,多种免费中文操作系统可供选择,独立服务器主打大硬盘,多硬盘,大内存,用户可以在后台自行安装系统等管理操作!内存可定制升级到1536G,多块硬盘随时加,14TBSA...