算法基于云平台的矩阵分解协同过滤算法在煤炭销售系统中的研究

云销售系统  时间:2021-01-07  阅读:()

基于云平台的矩阵分解协同过滤算法在煤炭销售系统中的研究

祝振欣

河北政法职业学院河北石家庄050000

摘 要协同过滤技术被广泛地应用在推荐系统中。随着电子商务的快速发展煤炭产业也引进了电子销售系统。近年来矩阵分解的协同过滤算法得到了煤炭销售系统的广泛应用。但是随着互联网的快速发展煤炭电子销售记录呈现指数级增长传统的基于矩阵分解的协同聚类算法不能有效、快速地完成销售系统的推荐工作。文章针对大规模煤炭数据推荐工作提出了分布式矩阵分解协同过滤算法该算法基于云计算平台能够分布式、高效地完成推荐系统的推荐工作。通过实验结果进一步展示了本算法与传统协同过滤算法相比具有很高的加速比以及很好的可扩展性。

关键词矩阵分解协同过滤推荐工作煤炭销售系统云计算

中图分类号 TP 393 09 TP 31 1 13 文献标志码 A 文章编号 1008  8725 201401  0247  02

Research and Application of Cloud Platform Based Matrix

Factorization Collaborative Filtering Algorithm in Coal Sale System

commerce, coal industry also induces electronic sale system In recent years,matrix factorization based collaborative filtering algorithm is popularly used in coal website recommender system However, with the high development of E-commerce area, the sale records of coal sale are increasing exponentially and traditional matrix factorization based collaborative filtering algorithm could not complete recommendation work effectively in sale system In this paper, focusing on recommendation works of big scale coal sale data,we propose distributed matrix factorization collaborative filtering algorithm This algorithm is based on cloud platform, and could complete the recommendation work distributed and effectively Through the results, we show that the algorithm has high speed-up and good scalability, comparing with traditional collaborative filtering

Key words:matrix factorization collaborative filtering recommender work coal sale system cloud computing

综合这些相似用户对某一信息的评价形成系统对该 计算pq上面公式的最小值完成不同用户p和

应用并能够更加准确的预测推荐排名工作。但是 定义eui=rui-puTqi

1 基于矩阵分解的协同过滤算法  1将训练数据集平均分布到N个计算结点中收稿日期20130222修订日期2013-1 1-16

作者简介祝振欣1972-  男河北保定人硕士讲师研究方向数据库技术电子商务安全。

·248· 煤 炭 技 术 第33卷

并将用户p和项目q的初始值分布到各个计算结点中 分为两组实验分别测试算法的效率以及可扩展

2针对在不同计算结点中的训练集得到该结 性。在第一组实验中比较分布式矩阵分解协同过滤点中的用户集、项目并利用初始值计算 算法DMFCF与传统基于矩阵分解的协同过滤算法

数传递重复1和3 直至迭代终止。 在第二组数据中主要测试算法的可扩展性为

下面是基于Map Reduce的分布式矩阵分解协同 了测试算法的可扩展性从数据集D4中等比例抽过滤算法的伪代码 取四组数据 S1  S2 S3  S4含有的记录个数分别为

3:for each item i 呈现等比例增大。同时随着计算结点个数的增大针

4: computeeui=rui-puTqi; 对相同数据集的分布式矩阵分解协同过滤算法的执

5: qi←qi+γeuipuλqi 行时间成比例减少。可以看出当数据规模增大的情

6:pu←p u+γeuiqi-λpu 况下可以通过增加计算结点的个数提高算法的执行

7:end for 效率减少算法的执行时间。说明算法具有很好的可

8:end for 扩展性。

9:e nd for

Output:r^ ui 图1 加速比实验 图2 可扩展性实验

1: Mapper(); 5 结语

6 r^ ui=puTqi; 解协同过滤算法。该算法能够分布式完成推荐系统的

7: end for 推荐工作实验结果也进一步证明了算法能够高效地

8:e nd for 完成推荐工作。

9:return 0; 参考文献

4 实验结果 [1 ] Kore n

系统整合应用

D4 873 232 责任编辑 丛培建

特网云-新上线香港五区补货资源充足限时抢 虚拟主机6折,低至38元!

官方网站:点击访问特网云官网活动方案:===========================香港云限时购==============================支持Linux和Windows操作系统,配置都是可以自选的,非常的灵活,宽带充足新老客户活动期间新购活动款产品都可以享受续费折扣(只限在活动期间购买活动款产品才可享受续费折扣 优惠码:AADE01),购买折扣与续费折扣不叠加,都是在原价...

Hostiger 16G大内存特价VPS:伊斯坦布尔机房,1核50G SSD硬盘200Mbps带宽不限流量$59/年

国外主机测评昨天接到Hostigger(现Hostiger)商家邮件推送,称其又推出了一款特价大内存VPS,机房位于土耳其的亚欧交界城市伊斯坦布尔,核50G SSD硬盘200Mbps带宽不限月流量只要$59/年。 最近一次分享的促销信息还是5月底,当时商家推出的是同机房同配置的大内存VPS,价格是$59.99/年,不过内存只有10G,虽然同样是大内存,但想必这次商家给出16G,价格却是$59/年,...

特网云,美国独立物理服务器 Atom d525 4G 100M 40G防御 280元/月 香港站群 E3-1200V2 8G 10M 1500元/月

特网云为您提供高速、稳定、安全、弹性的云计算服务计算、存储、监控、安全,完善的云产品满足您的一切所需,深耕云计算领域10余年;我们拥有前沿的核心技术,始终致力于为政府机构、企业组织和个人开发者提供稳定、安全、可靠、高性价比的云计算产品与服务。公司名:珠海市特网科技有限公司官方网站:https://www.56dr.com特网云为您提供高速、稳定、安全、弹性的云计算服务 计算、存储、监控、安全,完善...

云销售系统为你推荐
域名代理域名在万网买好还是在它的代理商那里买asp主机请问虚似主机和Asp服务器软件都是一个意思吗域名购买如何购买域名?网站域名空间哪个网站的域名空间的便宜?重庆网站空间重庆建网站选择哪家比较好,还有域名空间等,虚拟主机是什么什么是虚拟主机虚拟主机管理系统急!高分!比较好用的虚拟主机管理系统有哪些?1g虚拟主机1G虚拟空间大约多少钱?花生壳域名一个花生壳使用域名的限制买域名买域名怎么买?
济南域名注册 vps论坛 西安服务器 国内免备案主机 新加坡主机 site5 便宜服务器 国外私服 60g硬盘 info域名 搜狗抢票助手 好看的桌面背景图 mysql主机 天互数据 北京双线机房 亚马逊香港官网 isp服务商 美国网站服务器 中国电信测速器 购买空间 更多