算法基于云平台的矩阵分解协同过滤算法在煤炭销售系统中的研究

云销售系统  时间:2021-01-07  阅读:()

基于云平台的矩阵分解协同过滤算法在煤炭销售系统中的研究

祝振欣

河北政法职业学院河北石家庄050000

摘 要协同过滤技术被广泛地应用在推荐系统中。随着电子商务的快速发展煤炭产业也引进了电子销售系统。近年来矩阵分解的协同过滤算法得到了煤炭销售系统的广泛应用。但是随着互联网的快速发展煤炭电子销售记录呈现指数级增长传统的基于矩阵分解的协同聚类算法不能有效、快速地完成销售系统的推荐工作。文章针对大规模煤炭数据推荐工作提出了分布式矩阵分解协同过滤算法该算法基于云计算平台能够分布式、高效地完成推荐系统的推荐工作。通过实验结果进一步展示了本算法与传统协同过滤算法相比具有很高的加速比以及很好的可扩展性。

关键词矩阵分解协同过滤推荐工作煤炭销售系统云计算

中图分类号 TP 393 09 TP 31 1 13 文献标志码 A 文章编号 1008  8725 201401  0247  02

Research and Application of Cloud Platform Based Matrix

Factorization Collaborative Filtering Algorithm in Coal Sale System

commerce, coal industry also induces electronic sale system In recent years,matrix factorization based collaborative filtering algorithm is popularly used in coal website recommender system However, with the high development of E-commerce area, the sale records of coal sale are increasing exponentially and traditional matrix factorization based collaborative filtering algorithm could not complete recommendation work effectively in sale system In this paper, focusing on recommendation works of big scale coal sale data,we propose distributed matrix factorization collaborative filtering algorithm This algorithm is based on cloud platform, and could complete the recommendation work distributed and effectively Through the results, we show that the algorithm has high speed-up and good scalability, comparing with traditional collaborative filtering

Key words:matrix factorization collaborative filtering recommender work coal sale system cloud computing

综合这些相似用户对某一信息的评价形成系统对该 计算pq上面公式的最小值完成不同用户p和

应用并能够更加准确的预测推荐排名工作。但是 定义eui=rui-puTqi

1 基于矩阵分解的协同过滤算法  1将训练数据集平均分布到N个计算结点中收稿日期20130222修订日期2013-1 1-16

作者简介祝振欣1972-  男河北保定人硕士讲师研究方向数据库技术电子商务安全。

·248· 煤 炭 技 术 第33卷

并将用户p和项目q的初始值分布到各个计算结点中 分为两组实验分别测试算法的效率以及可扩展

2针对在不同计算结点中的训练集得到该结 性。在第一组实验中比较分布式矩阵分解协同过滤点中的用户集、项目并利用初始值计算 算法DMFCF与传统基于矩阵分解的协同过滤算法

数传递重复1和3 直至迭代终止。 在第二组数据中主要测试算法的可扩展性为

下面是基于Map Reduce的分布式矩阵分解协同 了测试算法的可扩展性从数据集D4中等比例抽过滤算法的伪代码 取四组数据 S1  S2 S3  S4含有的记录个数分别为

3:for each item i 呈现等比例增大。同时随着计算结点个数的增大针

4: computeeui=rui-puTqi; 对相同数据集的分布式矩阵分解协同过滤算法的执

5: qi←qi+γeuipuλqi 行时间成比例减少。可以看出当数据规模增大的情

6:pu←p u+γeuiqi-λpu 况下可以通过增加计算结点的个数提高算法的执行

7:end for 效率减少算法的执行时间。说明算法具有很好的可

8:end for 扩展性。

9:e nd for

Output:r^ ui 图1 加速比实验 图2 可扩展性实验

1: Mapper(); 5 结语

6 r^ ui=puTqi; 解协同过滤算法。该算法能够分布式完成推荐系统的

7: end for 推荐工作实验结果也进一步证明了算法能够高效地

8:e nd for 完成推荐工作。

9:return 0; 参考文献

4 实验结果 [1 ] Kore n

系统整合应用

D4 873 232 责任编辑 丛培建

IMIDC彩虹数据:日本站群多ip服务器促销;30Mbps带宽直连不限流量,$88/月

imidc怎么样?imidc彩虹数据或彩虹网络现在促销旗下日本多IP站群独立服务器,原价159美元的机器现在只需要88美元,而且给13个独立IPv4,30Mbps直连带宽,不限制月流量!IMIDC又名为彩虹数据,rainbow cloud,香港本土运营商,全线产品都是商家自营的,自有IP网络资源等,提供的产品包括VPS主机、独立服务器、站群独立服务器等,数据中心区域包括香港、日本、台湾、美国和南非...

云基Yunbase无视CC攻击(最高500G DDoS防御),美国洛杉矶CN2-GIA高防独立服务器,

云基yunbase怎么样?云基成立于2020年,目前主要提供高防海内外独立服务器,欢迎各类追求稳定和高防优质线路的用户。业务可选:洛杉矶CN2-GIA+高防(默认500G高防)、洛杉矶CN2-GIA(默认带50Gbps防御)、香港CN2-GIA高防(双向CN2GIA专线,突发带宽支持,15G-20G DDoS防御,无视CC)。目前,美国洛杉矶CN2-GIA高防独立服务器,8核16G,最高500G ...

触摸云 26元/月 ,美国200G高防云服务器

触摸云触摸云(cmzi.com),国人商家,有IDC/ISP正规资质,主营香港线路VPS、物理机等产品。本次为大家带上的是美国高防2区的套餐。去程普通线路,回程cn2 gia,均衡防御速度与防御,防御值为200G,无视UDP攻击,可选择性是否开启CC防御策略,超过峰值黑洞1-2小时。最低套餐20M起,多数套餐为50M,适合有防御型建站需求使用。美国高防2区 弹性云[大宽带]· 配置:1-16核· ...

云销售系统为你推荐
域名空间注册免费空间域名注册?虚拟主机服务器虚拟主机和站点服务器什么区别asp主机请问虚似主机和Asp服务器软件都是一个意思吗免费国外空间国外免费空间有哪些好用?域名注册查询如何知道域名注册信息?国内ip代理谁给我几个北京或国内的IP代理啊,高分,能用的网站空间域名网站制作 域名和空间北京网站空间自己弄一个简单的网站,大概需要办理什么,大概需要多少钱?免备案虚拟主机哪家免备案虚拟主机好,而且便宜点的?韩国虚拟主机香港和韩国的虚拟主机哪个比较好?
西安域名注册 过期备案域名查询 香港bgp机房 韩国俄罗斯 css样式大全 合肥鹏博士 有奖调查 福建铁通 1元域名 英国伦敦 网络速度 cx域名 神棍节 screen dmz主机 电脑主机启动不了 iis配置web服务器 海贼王789 电信带宽测试 亿库课件网 更多