基于MP I的并行文件传输服务器群
基于MPI的并行文件传输服务器群
黄松林 1 王鹏 1,2严伟才 1 李裕森 1 聂治 3
(1. 成都信息工程学院并行计算实验室 四川成都
610225 2.电子科技大学 四川成都610054 3.
成都理工大学 四川成都610059)
摘 要本文运用MPI 、 C OM/ActiveX和面向缓存等技术设计并实现了文件并行传输理论的新模型 将传统的最小负载均衡调度单位缩小至低于单文档大小
并将命令处理和数据服务相分离。 文中给出了系统拓
扑图、命令处理流程图和核心模块的设计原理图。 实际测试结果表明 该系统增强了处理并发请求的能力
和带宽大大提高了数据传输速率 证明了这一设计
方案的可行性和有效性。
关键词并行文件传输协议 MP I 并行文件I/O 集群监控
中图分类号 TP393 文献标识码 A
Tree-Structure Web Server Clusters Based on MPI
Huang Songlin
LiYusen 1 NieZhi 3
(1.Parallel Computing Laboratory,Chengdu
University of Information Technology,Sichuan,
Chengdu,610225;2.University of Electronic
Science and Technology of China,Sichuan,
Chengdu,610054;3.Chengdu University of
Technology,Sichuan Chengdu 610059)
Abstract This paper discusses a new model of paralleled transfer theory of files in detail with technology of MPI COM/ActiveX and caching-oriented,which effectively reduce to single document for traditional least load balance scheduling units.System topology graph 、 the deal flow charts of command and the diagram of central module are described in the same time.The circulation result shows:this system enhances the ability of parallel query and increases the data transfer velocity,moreover,validates the feasibility of this model.
Key Words PFTP; MPI; Paralleled File I/O;Cluste Monitor.
1 引言
随着网络技术的发展和普及人们对 FTP传输的速度与稳定性要求越来越高。从结构上讲 FTP 属于客户/服务器结构是一种简单的多对一结构
即多台客户机向一台服务器发出请求 此服务器对各
个客户机分时作出应答。随着并行 FTP用户的增加,服务器的网络传输效率会显著下降 ,表现为 数据传输速度不稳定 服务器对请求响应迟缓 甚至拒绝应答,传统的解决方法是限制客户的连接数。本文将并
行计算理论应用到传统的 FTP系统中通过增加服务器结点的数量来增加带宽和同时访问连接数 并对这些服务器结点进行集中控制和管理 以确保整个系
统中对用户是透明的 多台服务器节点并行地传输同
一个文件的不同块 因而既增大了系统带宽又提高了
文件传输速度。基于这种思想的并行文件传输服务器
群可以有效地解决现有 FTP系统存在问题[1-5] 。
2 MPI及相关技术
MPI(Message Passing Interface)是由MPI论坛
开发的一个非专利且独立于平台的消息传递函数库
的与语言无关的标准规范而不特指某一具体实现
[6] 。MP I是目前最重要的并行编程工具它具有移
植性好、 功能强大、 效率高等优点 而且有多种不同的实现版本几乎所有的并行计算机厂商都提供对它
的支持 这是其他并行编程环境所无法比拟的。 MP I 不仅提供了多种通讯模式其打 /解包收发不连续数据功能有效的减少了通讯次数 他的扩充版本MP I-2
提供文件并行 I/O 能够方便的实现文件的并行读
写。基于这些原因本文选用了 MP I作为服务端系统的开发平台。
3 基于MPI的并行文件传输服务器群模型
3.1并行服务器群的拓扑结构
结点服 构排调列度服务分器为可调能度在节下点层与搜子寻负载最轻的子节点和进行并行I/O操作。子结点有
一个独立于服务器群。如图 1
【注 1 1 接收用户请求。 12分析消息中包含的文档大小文件并行 I/O 。
13本地数据服务。 14 MP I消息传递。 15 响应客户请求
21,收集各结点监控数据。 22读取监控数据】
3.2并行服务器群的调度策略
传统的分布式调度策略和负载均衡算法所采用的
最小调度单位为文件甚至为本次连接 很难实现理想
中的负载均衡。 我们的目标是要设计并行服务的调度
策略。模型中主服务器 单台 所维护的文件索引列表面向缓存 当解析到用户发出信息为列表目录时
立即在该索引表中应列表信息并返回用户 对应解析为下载信号时则根据用户所创线程数和子服务器实
时负载对任务分解、 动态调度并由子服务器 多台并行提供数据服务 调度算法遵循在并行粒度范围内
按最轻网络流量负载节点优先调度的法则 使得各子服务器在任意时刻其负载量均趋于一致 整体负载更
加均衡。具体流程请参考表 1 。
表1主服务器处理用户的不同命令
a.用户命令 b.主服务器处理步骤
在
主服务器的内存中文件索引列表覆盖了镜像子服
务器内共享目录的全部信息。 对应在子服务器内存有
简化版的文件索引表 只具有文件编号和路径的映射
功能。主服务器直接返回列表信息于用户避免的大量
的费时的tcp转接操作而在所有服务器均设置文件
索引表则优化了任务分配时的内部网络通信。
主服务器申请load集合用于缓存当前各子服务
器实际文件服务负载信息 该全局信息为任务的精确
调度提高了依据。 该load集合的维护采用异步模式
即能在每次调度时直接于内存中获得信息又能根据
子服务器的状态改变或当前文件服务完毕而发往主
服务器的信号引起主服务器动态改变 load集合的值。
子服务器申请一队列用于缓存主服务器分配的任
务该队列设有超时功能 在规定时限内一旦有用户
通过连接验证立即将对应任务取出并按任务规定的
偏移量I/O和提高数据服务。
3.3并行服务器群的M PI实现
3.3.1文件索引表
本文提出的并行文件传输服务器群建立在 MP I的消息传递机制之上.为了减少主服务器给子服务器
通信的数据量,在各子服务器内存中维护了同样的
文件索引表(字符串数组), 数组的下标代表文件编号,相应的字符串代表此文件的完整路径。 主服务
器只需告诉子服务器文件编号 ,子服务器就能从文件索引表得到完整路径。 但这样做的结果是主服务器每更改一次文件列表都要对子服务器上的索引表
进行更新。而对数组进行增加/减少元素开销比较大,但稳定运行的服务器都不会经常变动文件 ,这种运行期间的文件列表更新操作是很少的 ,所以不会对服务器性能造成影响。
3.3.2服务器命令处理流程图
根据不同命令的处理情况 ,将常用的命令分为以下5个组。 1申请数据通道命令,用于主服务器传送
文件列表信息给客户 2读文件列表命令 3写文
件列表命令 4读写文件命令 5其它命令。 主
服务器初始化完成后等待客户发送命令请求 ,接收到客户端命令后,通过命令解析 根据以上分类 进行不同的处理。流程图如下
COM(Component Object Model, 组件对象模型)是Microsoft 创建的一种编程规范,它允许任意两个组件互相通信,在二进制级别上重用代码。
近日CloudCone商家对旗下的大硬盘VPS云服务器进行了少量库存补货,也是悄悄推送了一批便宜VPS云服务器产品,此前较受欢迎的特价20美元/年、1核心1G内存1Gbps带宽的VPS云服务器也有少量库存,有需要美国便宜大硬盘VPS云服务器的朋友可以关注一下。CloudCone怎么样?CloudCone服务器好不好?CloudCone值不值得购买?CloudCone是一家成立于2017年的美国服务...
麻花云怎么样?麻花云公司成立于2007年,当前主打产品为安徽移动BGP线路,数据中心连入移动骨干网。提供5M,10M大带宽云主机,香港云服务器产品,数据中心为香港将军澳机房,香港宽频机房 cn2-GIA优质线路、采用HYPER-V,KVM虚拟技术架构一、麻花云官网点击直达麻花云官方网站合肥网联网络科技有限公司优惠码: 专属优惠码:F1B07B 享受85折优惠。最新活动 :双11 云上嗨购 香港云主...
6元虚拟主机是否值得购买?近期各商家都纷纷推出了优质便宜的虚拟主机产品,其中不少6元的虚拟主机,这种主机是否值得购买,下面我们一起来看看。1、百度云6元体验三个月(活动时间有限抓紧体验)体验地址:https://cloud.baidu.com/campaign/experience/index.html?from=bchPromotion20182、Ucloud 10元云主机体验地址:https:...