算法基于云平台的矩阵分解协同过滤算法在煤炭销售系统中的研究

云销售系统  时间:2021-01-07  阅读:()

基于云平台的矩阵分解协同过滤算法在煤炭销售系统中的研究

祝振欣

河北政法职业学院河北石家庄050000

摘 要协同过滤技术被广泛地应用在推荐系统中。随着电子商务的快速发展煤炭产业也引进了电子销售系统。近年来矩阵分解的协同过滤算法得到了煤炭销售系统的广泛应用。但是随着互联网的快速发展煤炭电子销售记录呈现指数级增长传统的基于矩阵分解的协同聚类算法不能有效、快速地完成销售系统的推荐工作。文章针对大规模煤炭数据推荐工作提出了分布式矩阵分解协同过滤算法该算法基于云计算平台能够分布式、高效地完成推荐系统的推荐工作。通过实验结果进一步展示了本算法与传统协同过滤算法相比具有很高的加速比以及很好的可扩展性。

关键词矩阵分解协同过滤推荐工作煤炭销售系统云计算

中图分类号 TP 393 09 TP 31 1 13 文献标志码 A 文章编号 1008  8725 201401  0247  02

Research and Application of Cloud Platform Based Matrix

Factorization Collaborative Filtering Algorithm in Coal Sale System

commerce, coal industry also induces electronic sale system In recent years,matrix factorization based collaborative filtering algorithm is popularly used in coal website recommender system However, with the high development of E-commerce area, the sale records of coal sale are increasing exponentially and traditional matrix factorization based collaborative filtering algorithm could not complete recommendation work effectively in sale system In this paper, focusing on recommendation works of big scale coal sale data,we propose distributed matrix factorization collaborative filtering algorithm This algorithm is based on cloud platform, and could complete the recommendation work distributed and effectively Through the results, we show that the algorithm has high speed-up and good scalability, comparing with traditional collaborative filtering

Key words:matrix factorization collaborative filtering recommender work coal sale system cloud computing

综合这些相似用户对某一信息的评价形成系统对该 计算pq上面公式的最小值完成不同用户p和

应用并能够更加准确的预测推荐排名工作。但是 定义eui=rui-puTqi

1 基于矩阵分解的协同过滤算法  1将训练数据集平均分布到N个计算结点中收稿日期20130222修订日期2013-1 1-16

作者简介祝振欣1972-  男河北保定人硕士讲师研究方向数据库技术电子商务安全。

·248· 煤 炭 技 术 第33卷

并将用户p和项目q的初始值分布到各个计算结点中 分为两组实验分别测试算法的效率以及可扩展

2针对在不同计算结点中的训练集得到该结 性。在第一组实验中比较分布式矩阵分解协同过滤点中的用户集、项目并利用初始值计算 算法DMFCF与传统基于矩阵分解的协同过滤算法

数传递重复1和3 直至迭代终止。 在第二组数据中主要测试算法的可扩展性为

下面是基于Map Reduce的分布式矩阵分解协同 了测试算法的可扩展性从数据集D4中等比例抽过滤算法的伪代码 取四组数据 S1  S2 S3  S4含有的记录个数分别为

3:for each item i 呈现等比例增大。同时随着计算结点个数的增大针

4: computeeui=rui-puTqi; 对相同数据集的分布式矩阵分解协同过滤算法的执

5: qi←qi+γeuipuλqi 行时间成比例减少。可以看出当数据规模增大的情

6:pu←p u+γeuiqi-λpu 况下可以通过增加计算结点的个数提高算法的执行

7:end for 效率减少算法的执行时间。说明算法具有很好的可

8:end for 扩展性。

9:e nd for

Output:r^ ui 图1 加速比实验 图2 可扩展性实验

1: Mapper(); 5 结语

6 r^ ui=puTqi; 解协同过滤算法。该算法能够分布式完成推荐系统的

7: end for 推荐工作实验结果也进一步证明了算法能够高效地

8:e nd for 完成推荐工作。

9:return 0; 参考文献

4 实验结果 [1 ] Kore n

系统整合应用

D4 873 232 责任编辑 丛培建

GreenCloudVPS$20/年多国机房可选,1核@Ryzen 3950x/1GB内存/30GB NVMe/10Gbps端口月流量2TB

GreencloudVPS此次在四个机房都上线10Gbps大带宽VPS,并且全部采用AMD处理器,其中美国芝加哥机房采用Ryzen 3950x处理器,新加坡、荷兰阿姆斯特丹、美国杰克逊维尔机房采用Ryzen 3960x处理器,全部都是RAID-1 NVMe硬盘、DDR4 2666Mhz内存,GreenCloudVPS本次促销的便宜VPS最低仅需20美元/年,支持支付宝、银联和paypal。Gree...

香港E3-1230v2 16GB 30M 326元/月 数脉科技

官方网站:https://www.shuhost.com/公司名:LucidaCloud Limited尊敬的新老客户:艰难的2021年即将结束,年终辞旧迎新之际,我们准备了持续优惠、及首月优惠,为中小企业及个人客户降低IT业务成本。我们将持续努力提供给客户更好的品质与服务,在新的一年期待与您有美好的合作。# 下列价钱首月八折优惠码: 20211280OFF (每客户限用1次) * 自助购买可复制...

Spinservers:美国圣何塞机房少量补货/双E5/64GB DDR4/2TB SSD/10Gbps端口月流量10TB/$111/月

Chia矿机,Spinservers怎么样?Spinservers好不好,Spinservers大硬盘服务器。Spinservers刚刚在美国圣何塞机房补货120台独立服务器,CPU都是双E5系列,64-512GB DDR4内存,超大SSD或NVMe存储,数量有限,机器都是预部署好的,下单即可上架,无需人工干预,有需要的朋友抓紧下单哦。Spinservers是Majestic Hosting So...

云销售系统为你推荐
中国互联网域名注册什么叫做网络域名 怎么注册网络域名 以及它的收费方式免费虚拟主机申请求免费可以申请的域名和虚拟主机域名服务域名系统主要是什么?便宜的虚拟主机免费、便宜的虚拟主机哪里有?要好用的 ,速度快的美国服务器托管美国服务器托管好还是租用好论坛虚拟主机最近想买虚拟主机,用来做论坛。广西虚拟主机江西服务器托管,但要接入专线,问了很多代理都说不可以,如何解决?域名批量查询如何进行域名批量查询注册花生壳动态域名如何用花生壳将免费域名和本机的动态IP绑定?个人域名注册怎么申请个人网站域名?
国外服务器租用 cn域名备案 免费ddos防火墙 500m空间 空间论坛 国外免费asp空间 万网主机管理 东莞idc 服务器维护 游戏服务器出租 学生服务器 国外网页代理 cdn服务 服务器托管价格 开心online 美国vpn代理 web是什么意思 阿里云宕机故障 neicun 赵蓉 更多