基于策略梯度算法的工作量证明中挖矿困境研究
文档信息
主题 关于论文中的毕业论文”的参考范文。
属性 Doc-01BPTGdoc格式正文2430字。质优实惠欢迎下载
适用
目录
目录. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1
正文. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1
搞要. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1
关键字区块链;工作量证明机制;博弈论;深度强化学习;策略梯度算法. . . . . . . . . . . . . . . . . . . . .2
0引言. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .3
正文
基于策略梯度算法的工作量证明中挖矿困境研究
搞要
摘要摘要针对区块链中工作量证明 PoW共识机制下区块截留攻击导致的挖矿困境问题将矿池间的博弈行为视作迭代的囚徒困境 IPD模型采用深度强化学习的策略梯度算法研究IPD的策略选择。利用该算法将每个矿池视为独立的智能体Agent 将矿工的潜入率量化为强化学习中的行为分布通过策略梯度算法中的策略网络对Agent的行为进行预测和优化最大化矿工的人均收益并通过模拟实验验证了策略梯度算法的有效性。实验发现前期矿池处于相互攻击状态平均收益小于1 出现了纳
什均衡的问题;经过pol icygradient算法的自我调整后矿池由相互攻击转变为相互合作每个矿池的潜入率趋于0 人均收益趋于1。实验结果表明 pol icygradient算法可以解决挖矿困境的纳什均衡问题最大化矿池人均收益
关键字区块链;工作量证明机制;博弈论;深度强化学习;策略梯度算法
中图分类号TP183
文献标志码A
Abstract Inviewof the mining di lemma problem caused byblockwithholding attack under Proof of Work PoW consensusmechanism in the blockchain thegame behavior between miningpoolswas regarded as anIterative Prisoner’ s Di lemma IPDmodel and the pol icygradientalgorithm of deep reinforcementlearning was used to studyIPD’ s strategychoices. Each mining poolwas considered as an independentAgentand the miners infi ltrationratewas quantified as a behaviordistribution in reinforcementlearning.The pol icy networkin the pol icygradientwas used topredictand optimizetheAgent’ s behavior in orderto maximizeminers’ average revenues.And the effectiveness of the pol icygradient algorithm wasval idated through simulation experiments.Experimental results showthat the mining pools attackeach otheratthe beginning with miners’ average revenue less than 1 whichcauses Nash equi l ibrium problem.Afterselfadjustmentbythe pol icy
gradient algorithm the relationship between the mining poolstransforms from mutual attack to mutual cooperation withinfi ltration rate of each mining pool tending to zero and miners’average revenue tending to 1.The results showthat the pol icygradientalgorithm cansolve the Nashequi l ibrium problem ofmining di lemma and maximizethe miners’ average revenue.
英文關键词Key words blockchain; Proof of Work PoW ;game;deep reinforcement learning;pol icygradientalgorithm
0引言
区块链是比特币[1]等加密货币的底层实现技术比特币作为区块链最为成功的应用场景是在工作量证明 Proof of Work PoW的共识机制下完成交易内容的。在比特币系统中每个节点都会参与到区块的生产中并提供一定的PoW首先生产出区块的节点可以获得一定的比特币奖励。这一过程就是“挖矿” 参与挖矿的节点称为“矿工” 。按照比特币系统的设定区块大约10min产生一个意味着大多数矿工挖不到区块为获得相对稳定的收入矿工会选择性地加入矿池进行合作挖矿。矿池由矿池管理员和若干矿工组成矿工会不断地向管理员发送部分工作量证明戒完整的工作量证明矿池管理员会按照各个成员的工作量贡献比分发收益。
然而有些矿工只向管理员发送部分工作量证明若获取到完整的工作量证明会选择丢弃即只获得矿池的部分收益而不贡献有效算力这种行为被称为区块截留攻击blockwithholding attack [2]。矿池可以利用自己的矿工潜入其他矿池对其进行区块截留攻击以增加自己的收益但是当所
有矿池都相互攻击时它们的收益将低于互不攻击的情形此即PoW共识漏洞产生的挖矿困境可视为博弈论中的囚徒困境模型。其存在一个纳什均衡点没有一方可以通过改变自己的行为策略来提高整体收益[3]。本文的核心内容是如何在PoW共识机制下优化矿池行为选择来增加其人均收益以解决区块截留攻击导致的矿难问题。
“基于策略梯度算法的工作量证明中挖矿困境研究”文档源于网络本人编辑整理。本着保护作者知识产权的原则仅供学习交流请勿商用。如有侵犯作者权益请作者留言戒者发站内信息联系本人我将尽快删除。谢谢您的阅读与下载
tmhhost放出了2021年的端午佳节+618年中大促的优惠活动:日本软银、洛杉矶200G高防cn2 gia、洛杉矶三网cn2 gia、香港200M直连BGP、韩国cn2,全都是高端优化线路,所有这些VPS直接8折,部分已经做了季付8折然后再在此基础上继续8折(也就是6.4折)。 官方网站:https://www.tmhhost.com 香港BGP线路VPS ,200M带宽 200M带...
racknerd当前对美国犹他州数据中心的大硬盘服务器(存储服务器)进行低价促销,价格跌破眼镜啊。提供AMD和Intel两个选择,默认32G内存,120G SSD系统盘,12个16T HDD做数据盘,接入1Gbps带宽,每个月默认给100T流量,5个IPv4... 官方网站:https://www.racknerd.com 加密数字货币、信用卡、PayPal、支付宝、银联(卡),可以付款! ...
ucloud香港服务器优惠降价活动开始了!此前,ucloud官方全球云大促活动的香港云服务器一度上涨至2核4G配置752元/年,2031元/3年。让很多想购买ucloud香港云服务器的新用户望而却步!不过,目前,ucloud官方下调了香港服务器价格,此前2核4G香港云服务器752元/年,现在降至358元/年,968元/3年,价格降了快一半了!UCloud活动路子和阿里云、腾讯云不同,活动一步到位,...