基于萤火虫算法和动态优先级的多Qos云工作流调度 - 博士论文 - 一起赢论文辅导网--专业代写代发SCI、EI、核心期刊、代写MBA、硕博毕业论文。QQ910330594

欢迎访问一起赢论文辅导网

加入收藏 | 设为主页 | 联系我们

本站动态

联系我们

QQ：3949358033

微信：paperwinner

工作时间：9:00-24:00

成功案例

博士论文

当前位置：首页 > 博士论文

基于萤火虫算法和动态优先级的多Qos云工作流调度

来源：一起赢论文网日期：2018-09-10 浏览数：2475 【字体：大中小】

计算机集成制造系统第２３卷的计算节点上。刘晓等［３－４］构建了一种吞吐量一致性模型来评估工作流应用中任务按时完成的概率，同时可对局部吞吐量约束条件进行分配，从而有效减少时间开销。以上两种调度策略的主要目的是优化完成时间。关于在截止时间约束下优化工作流费用问题，ＢｙｕＢｙｕｎ等［５］针对云计算环境提出分区平衡时间规划（Ｐａｒｔｉｔｉｏｎｅｄ　Ｂａｌａｎｃｅｄ　Ｔｉｍｅ　Ｓｃｈｅｄｕｌｉｎｇ，ＰＢＴＳ）算法，该算法将工作流截止期划分为多个时间段，并用平衡时间规划（Ｂａｌａｎｃｅｄ　Ｔｉｍｅ　Ｓｃｈｅｄｕ－ｌｉｎｇ，ＢＴＳ）算法［６］为每个时间段计算工作流需要的最少资源量，但该算法针对的是同构资源模型。ＨＥＮＤＲＩＫ等［７］提出一种服务器数量约束（ＳｅｒｖｅｒＣｏｕｎｔ　Ｂｏｕｎｄ，ＳＣＢ）算法，在服从截止时间约束的同时，寻找最小资源分配方案以减少用户费用。ＳＡＥＩＤ等［８］提出一种带有期限分布的ＩａａＳ云部分关键路径（ＩａａＳ　Ｃｌｏｕｄ　Ｐａｒｔｉａｌ　Ｃｒｉｔｉｃａｌ　Ｐａｔｈｓ　ｗｉｔｈＤｅａｄｌｉｎｅ　Ｄｉｓｔｒｉｂｕｔｉｏｎ，ＩＣ－ＰＣＰＤ２）算法［８］，首先初始化关键路径上任务的截止时间，采用递归的方法依次求取其他路径上任务的截止时间，然后循环求取偏序关键路径，在截止时间约束下将偏序关键路径的任务放置到最便宜的虚拟机实例上，直到工作流中的所有任务分配完毕。现有的工作流调度算法主要从时间和费用两方面进行研究，但这些算法都没有考虑可靠性，均假设任务执行过程和数据传输过程没有中断、不会失败，但在实际系统中，资源和网络的不可用都会对工作流的执行造成负面影响［９］。因此，本文在考虑工作流的完成时间和执行费用的基础上，将工作流执行的可靠性也作为一个服务质量（Ｑｕａｌｉｔｙ　ｏｆ　Ｓｅｒｖｉｃｅ，ＱｏＳ）约束考虑在内，针对时间和可靠性双重约束下费用最小化的云工作流调度问题，使用随机搜索算法实现云工作流的调度。在具体实现中，将萤火虫算法（Ｆｉｒｅｆｌｙ　Ａｌｇｏｒｉｔｈｍ，ＦＡ）［１０］作为基本思路，提出一系列改进措施，以解决时间和可靠性双重约束的云工作流调度问题。相比于其他智能搜索算法，ＦＡ具有简单易懂、参数少和易实现等特点。然而，传统ＦＡ的解空间属于连续的实数域，而云工作流优化调度的解空间属于离散的整数域空间。为了使面向连续问题的ＦＡ适用于求解云工作流优化调度问题，本文对其进行改进、使其离散化，并结合云工作流调度问题重新定义了ＦＡ中的距离、位置、亮度和萤火虫的移动方式，采用动态优先级方式确定任务的执行顺序，从而提高算法的寻优能力。１　工作流和云资源描述１．１　工作流工作流由一系列任务和任务间具有依赖关系的数据组成［１１］，一般通过有限无环图（Ｄｉｒｅｃｔｅｄ　Ａｃｙ－ｃｌｉｃ　Ｇｒａｐｈ，ＤＡＧ）描述，图中的节点表示任务，边表示任务间的依赖关系。工作流可以记为Ｗ＝｛Ｔ，Ｅ，Ｄ｝。其中：Ｔ＝｛ｔ１，ｔ２，…，ｔｉ，…，ｔＮ｝表示一系列任务的集合，Ｎ表示任务个数，ｔｅｎｔｒｙ表示开始任务，即没有父节点的任务，ｔｅｘｉｔ表示结束任务，即没有子节点的任务；Ｅ为有向边的集合，Ｅ＝｛（ｔｉ，ｔｊ）｜ｔｉ，ｔｊ∈Ｔ｝，（ｔｉ，ｔｊ）表示任务ｔｉ和ｔｊ之间的依赖关系，任务ｔｉ是任务ｔｊ的前驱任务，任务ｔｊ是任务ｔｉ的后继任务。任务ｔｉ的直接前驱任务集合为ｐｒｅ（ｔｉ），直接后继任务集合为ｓｕｃｃ（ｔｉ）；Ｄ＝｛ｄｔｉ，ｔｊ｜ｔｉ∈Ｔ，ｔｊ∈Ｔ｝为任务ｔｉ和ｔｊ间传输数据量的大小，表示两个任务之间的通信开销，当任务ｔｉ和任务ｔｊ调度在同一虚拟机上时通信开销忽略不计。１．２　云资源假设云服务提供商可提供不同租赁价格与配置的虚拟机资源来执行工作流任务，这些资源可表示为ＶＭ＝｛ｖｍ１，ｖｍ２，…，ｖｍＭ｝，其中Ｍ表示虚拟机的个数。对于每一个虚拟机ｖｍｍ，ｖｍｃｍ表示虚拟机的计算能力即每秒处理的指令数，ｖｍｆｍ表示虚拟机的失败率，ｖｍｐｍ表示虚拟机的单位时间租赁费用。２　问题描述设一个云工作流包括Ｎ个任务，云服务商提供了Ｍ个虚拟机。云工作流调度问题实际上是建立Ｎ个任务和Ｍ个虚拟机间的映射关系。本文的主要目标是寻找一种调度方案，以满足用户要求的完成时间和可靠性双重约束，同时使云资源租赁成本最低。下面分别介绍完成时间、费用和可靠性的计算方式。２．１　完成时间假设任务ｔｉ被分配到虚拟机ｖｍｔｉ上执行。由于受工作流结构的约束，任务ｔｉ必须在其前驱任务执行完毕后，将数据传输到任务ｔｉ所在的虚拟机ｖｍｔｉ上才可以执行。若此时虚拟机ｖｍｔｉ上还有其他未完成的任务，则任务ｔｉ必须等待虚拟机ｖｍｔｉ其他６９４郑宏升等：基于萤火虫算法和动态优先级的多ＱｏＳ云工作流调度任务执行完成后才能开始执行，因此任务ｔｉ的开始时间为ＳＴ（ｔｉ，ｖｍｔｉ）＝ｍａｘ｛ｔａｖａｉｌｉ，ＡｖａｉＴｉｍｅ（ｖｍｔｉ）｝ｔａｖａｉｌｉ＝ｍａｘｔｊ∈ｐｒｅ（ｔｉ）｛ＥＦＴ（ｔｊ，ｖｍｔｊ）＋ＣＴ（ｔｉ，ｔｊ，ｖｍｔｉ，ｖｍｔｊ）｝。（１）式中，假设任务ｔｉ的前驱任务ｔｊ调度到虚拟机ｖｍｔｊ上，ＥＦＴ（ｔｊ，ｖｍｔｊ）表示任务ｔｊ的完成时间，数据从ｔｉ传输给ｔｊ的时间ＣＴ（ｔｉ，ｔｊ，ｖｍｔｉ，ｖｍｔｊ）可用ｄｔｉ，ｔｊ／Ｂ（ｖｍｔｉ，ｖｍｔｊ）计算。其中：ＡｖａｉＴｉｍｅ（ｖｍｔｉ）表示虚拟机执行完ｔｉ之前的任务后空闲下来的时间，ｔａｖａｉｌｉ表示任务ｔｉ的所有前驱任务都已经执行完毕并且将数据都传输到ｔｉ上的时间，Ｂ（ｖｍｔｉ，ｖｍｔｊ）表示虚拟机ｖｍｔｉ与ｖｍｔｊ之间的带宽。任务ｔｉ的完成时间为ＦＴ（ｔｉ，ｖｍｔｉ）＝ＳＴ（ｔｉ，ｖｍｔｉ）＋ＥＴ（ｔｉ，ｖｍｔｉ）。（２）式中，任务ｔｉ在虚拟机ｖｍｔｉ上的执行时间ＥＴ（ｔｉ，ｖｍｔｉ）＝ｗ（ｔｉ）／ｖｍｃｔｉ，ｗ（ｔｉ）为任务ｔｉ的指令数，从第一个任务开始执行到最后一个任务结束的时间段称为整个工作流的完成时间，因此工作流的完成时间ｍａｋｅｓｐａｎ＝ｍａｘｉ∈（１，Ｎ）｛ＦＴ（ｔｉ，ｖｍｔｉ）｝。（３）２．２　费用对于虚拟机ｖｍｍ，ｔｓｉ和ｔ　ｅｉ分别为虚拟机ｖｍｍ上第一个与最后一个被执行的任务，ＳＴ（ｔｓｉ，ｖｍｍ）为ｔｓｉ的最早开始时间，ＦＴ（ｔｅｉ，ｖｍｍ）为ｔｅｉ的完成时间，则ｖｍｍ的费用ｃｏｓｔ（ｖｍｉ）＝ !ＦＴ（ｔｅｉ，ｖｍｍ）－ＳＴ（ｔｓｉ，ｖｍｍ）"×ｖｍｐｉ。（４）因此，整个工作流的费用等于所有虚拟机的费用之和，即ｃｏｓｔ＝∑Ｍｍ＝１ｃｏｓｔ（ｖｍｍ）。（５）２．３　可靠性工作流的可靠性是所有任务都执行成功的可能性，即每个资源上任务执行成功的可能性和任务之间传输路径上传输成功的可能性之和。假设系统的调度方案表示为Ｓ：Ｔ×Ｒ→｛０，１｝，矩阵Ｓ表示工作流中所有任务到所有虚拟机资源的有效映射，若其中的元素Ｓｉ，ｍ值为１，则表示任务ｔｉ被调度到虚拟机ｖｍｍ上执行。根据文献［１２－１３］，虚拟机ｖｍｍ在时间段ｔ内的可靠性为ｅ－ｖｍｆｍ·ｔ，则虚拟机ｖｍｍ在传输时间段ｔ内将数据传输到虚拟机ｖｍｎ的可靠性为ｅ－ｔｆ（ｖｍｍ，ｖｍｎ）·ｔ，其中ｔｆ（ｖｍｍ，ｖｍｎ）表示虚拟机ｖｍｍ与ｖｍｎ之间的传输失败率。在调度方案Ｓ中，虚拟机ｖｍｍ上所有任务的执行时间ＥＴ（ｖｍｍ）＝∑Ｎｉ＝１ｓｉ，ｍＥＴ（ｔｉ，ｖｍｍ），（６）则虚拟机ｖｍｍ的可靠性Ｐ（ｖｍｍ）＝ｅ－ｆ（ｖｍｍ）·ＥＴ（ｖｍｍ）。（７）同理可得数据在虚拟机ｖｍｍ和ｖｍｎ间的传输时间ＣＴ（ｖｍｍ，ｖｍｎ）＝∑Ｎｉ＝１∑ｊ≠ｉｓｉ，ｍｓｊ，ｎＣＴ（ｔｉ，ｔｊ，ｖｍｍ，ｖｍｎ），（８）则虚拟机ｖｍｍ和ｖｍｎ间的传输可靠性为ＴＰ（ｖｍｍ，ｖｍｎ）＝ｅ－ｔｆ（ｖｍｍ，ｖｍｎ）·ＣＴ（ｖｍｍ，ｖｍｎ）。（９）综上所述，可得整个工作流的可靠性即流程成功执行的可能性ｒｅｌｉａｂｉｌｉｔｙ＝∏Ｍｍ＝１Ｐ（ｖｍｍ）∏Ｍｍ＝１∏ｎ≠ｍＴＰ（ｖｍｍ，ｖｍｎ）。（１０）２．４　调度目标本文研究的调度问题描述如下：ｍｉｎ　ｃｏｓｔ。ｓ．ｔ．ｍａｓｋｓｐａｎ≤Ｄｅａｄｌｉｎｅ；ｒｅｌｉａｂｉｌｉｔｙ ≥ ＭｉｎＲｅｌｉａｂｉｌｉｔｙ。（１１）式中：Ｄｅａｄｌｉｎｅ表示用户预先确定的工作流截止时间，ＭｉｎＲｅｌｉａｂｌｉｔｙ表示用户要求的最低可靠性。３　基于萤火虫算法和动态优先级的云工作流调度３．１　标准萤火虫算法ＦＡ是一种智能搜索算法，它将搜索及优化过程模拟成萤火虫之间相互吸引和位置迭代更新的过程，从而将求解最优值的问题看作为寻找最亮萤火虫的问题，搜索过程即为位置好的萤火虫不断取代位置不好的萤火虫的过程。发光亮的萤火虫会吸引发光弱的萤火虫向它移动，发光越亮表示萤火虫的位置越好，最亮萤火虫表示函数的最优解。萤火虫之间的吸引度只与发光强度和距离有关，发光强的萤火虫会吸引周围发光弱的萤火虫，但是其吸引度随距离的增大而逐渐减小。定义１　萤火虫ｉ对萤火虫ｊ的吸引度为βｉ，ｊ＝β０ｅ－γｒ２ｉｊ。（１２）式中：β０为最大吸引度，即在光源处的吸引度；γ 为６９５计算机集成制造系统第２３卷光吸收系数，一般取值０～１，其值越大，表明被空气介质吸收的荧光越多，被接收到的亮度越小，吸引度越小；ｒｉｊ为萤火虫之间的距离，用笛卡尔距离表示，距离越远，吸引度越小。定义２　萤火虫ｉ被萤火虫ｊ吸引而向其移动的位置更新由式（１３）计算：ｘｉ（ｔ＋１）＝ｘｉ（ｔ）＋βｉｊ（ｘｊ（ｔ）－ｘｉ（ｔ））＋α（ｒａｎｄｏｍ（）－０．５）。（１３）式中：ｔ为迭代次数，ｘｉ和ｘｊ为萤火虫ｉ和ｊ所在的空间位置；βｉｊ为萤火虫ｉ和ｊ间的吸引度大小；α 为步长因子，一般取［０，２］区间内的数。３．２　适用于云工作流调度的萤火虫算法标准ＦＡ的解空间属于连续的实数域空间，云工作流调度的解空间属于离散的整数域空间。为了使面向连续问题的ＦＡ能适用于求解云工作流调度优化问题，本文对标准ＦＡ进行改进，提出适用于云工作流调度问题的萤火虫算法云工作流调度问题的萤火虫算法（Ｃｌｏｕｄ　Ｗｏｒｋｆｌｏｗ　Ｆｉｒｅｆｌｙ　Ａｌｇｏｒｉｔｈｍ，ＣＷＦＡ）。（１）位置编码对萤火虫的位置进行重新编码，使重新编码后的位置都代表一种调度方案，即任务和虚拟机之间的映射关系。假设萤火虫的个数为ｃ，工作流中任务的个数为Ｎ，可用来进行调度的虚拟机个数为Ｍ，则第ｉ个萤火虫的位置可用一个Ｎ维向量ｘｉ＝（ｘｉ，１，ｘｉ，２，…，ｘｉ，ｊ，…，ｘｉ，Ｎ）表示，其中ｘｉ，ｊ ∈（１，２，…，Ｍ）。一个萤火虫的位置向量表示一种可行的调度方案，该位置向量中的每一个元素表示了流程中的一个任务由哪个虚拟机调度执行。（２）适应度函数为了体现费用为目标、时间和可靠性为约束的特点，本文定义某一种调度方案Ｓ的适应度函数ｆ（Ｓ）＝１－ｍｉｎ＿ｃｏｓｔＳ．ｃｏｓｔ，Ｓ．ｍａｋｅｓｐａｎ ≤ Ｄｅａｄｌｉｎｅ　ａｎｄ　Ｓ．ｒｅｌｉａｂｌｉｔｙ ≥ ＭｉｎＲｅｌｉａｂｌｉｔｙ；ＭｉｎＲｅｌｉａｂｌｉｔｙＳ．ｒｅｌｉａｂｌｉｔｙ＋１－ｍｉｎ＿ｃｏｓｔＳ．ｃｏｓｔ，Ｓ．ｍａｋｅｓｐａｎ ≤ Ｄｅａｄｌｉｎｅ　ａｎｄ　Ｓ．ｒｅｌｉａｂｌｉｔｙ＜ＭｉｎＲｅｌｉａｂｌｉｔｙ；１－ｍｉｎ＿ｃｏｓｔＳ．ｃｏｓｔ＋Ｓ．ｍａｋｅｓｐａｎｅＤｅａｄｌｉｎｅ，Ｓ．ｍａｋｅｓｐａｎ＞Ｄｅａｄｌｉｎｅ　ａｎｄ　Ｓ．ｒｅｌｉａｂｌｉｔｙ ≥ ＭｉｎＲｅｌｉａｂｌｉｔｙ；１－ｍｉｎ＿ｃｏｓｔＳ．ｃｏｓｔ＋Ｓ．ｍａｋｅｓｐａｎｅＤｅａｄｌｉｎｅ＋ＭｉｎＲｅｌｉａｂｌｉｔｙＳ．ｒｅｌｉａｂｌｉｔｙ，Ｓ．ｍａｋｅｓｐａｎ＞Ｄｅａｄｌｉｎｅ　ａｎｄ　Ｓ．ｒｅｌｉａｂｌｉｔｙ ≤ ＭｉｎＲｅｌｉａｂｌｉｔｙ烅烄烆。（１４）式中：ｍｉｎ＿ｃｏｓｔ表示流程执行的最低费用，ＭｉｎＲｅ－ａｌｉａｂｉｌｉｔｙ表示用户要求的最低可靠性，Ｄｅａｄｌｉｎｅ表示截止时间。当调度方案Ｓ不满足时间或可靠性约束时，用Ｓ．ｍａｋｅｓｐａｎｅ／Ｄｅａｄｌｉｎｅ，ＭｉｎＲｅａｌｉａｂｉｌｉ－ｔｙ／Ｓ．ｒｅｌｉａｂｉｌｉｔｙ对时间和可靠性进行惩罚；当调度方案Ｓ满足所有约束时，用１－ｍｉｎ＿ｃｏｓｔ／Ｓ．ｃｏｓｔ限制费用的取值范围。（３）萤火虫距离定义两只萤火虫之间的距离（即两种调度方案的距离）ｒｉｊ＝∑ｎｋ＝１（ｌ（ｘｉ，ｋ ≠ｘｊ，ｋ））槡２。（１５）式中ｌ（·）为指示函数，当参数为真时函数值为１，否则为０（ｌ（ｔｒｕｅ）＝１，ｌ（ｆａｌｓｅ）＝０）。（４）萤火虫位置更新若萤火虫ｉ的周围有比其更亮的萤火虫，则该萤火虫向比它亮的萤火虫移动。假定比它亮的萤火虫为ｊ，移动时根据吸引度的大小进行位置更新，定义如下位置更新公式：ｘｉ，ｋ（ｔ＋１）＝ｘｊ，ｋ（ｔ），βｉ，ｊ＞θ；ｘｉ，ｋ（ｔ），βｉ，ｊ ≤θ烅烄烆。（１６）式中βｉ，ｊ表示萤火虫ｉ对萤火虫ｊ的吸引度。吸引度作为一个概率，用来决定ｘｉ是否从ｘｊ继承某个解维度。在判定前，随机得到０～１范围内的取值θ，当吸引度大于θ时，ｘｉ从ｘｊ处继承某个解维度的值，否则保留原始的值。若萤火虫ｉ的周围没有比其更亮的萤火虫，则萤火虫ｉ为最优萤火虫，其移动方式与普通萤火虫并不同，本文定义了最优萤火虫的位置更新规则，命名为“最优调整规则”，该规则的核心思想为：在不满足时间约束的情况下，优先满足截止时间，因为整个工作流的完成时间取决于最终完成时间最大的虚拟机，所以减少这个虚拟机的最终完成时间，理论上能减少整个工作流的完成时间；在满足截止时间的情况下则随机移动。３．３　ＣＷＦＡ算法流程３．３．１　动态优先级现有的大部分云工作流调度算法在确定任务执６９６６；修订日期：２０１６－０９－１３。Ｒｅｃｅｉｖｅｄ　２６Ｆｅｂ．２０１６；ａｃｃｅｐｔｅｄ　１３Ｓｅｐ．２０１６．基金项目：国家自然科学基金资助项目（６１４７２１１２）。Ｆｏｕｎｄａｔｉｏｎ　ｉｔｅｍ：Ｐｒｏｊｅｃｔ　ｓｕｐｐｏｒｔｅｄ　ｂｙ　ｔｈｅ　Ｎａｔｉｏｎａｌ　Ｎａｔｕｒａｌ　Ｓｃｉｅｎｃｅ　Ｆｏｕｎｄａｔｉｏｎ，Ｃｈｉｎａ（Ｎｏ．６１４７２１１２）．基于萤火虫算法和动态优先级的多ＱｏＳ云工作流调度郑宏升，俞东进＋，张　蕾（杭州电子科技大学计算机学院，浙江　杭州　３１００１８）摘　要：为了提高用户的满意程度、降低运营成本，考虑时间、费用和可靠性３个重要的服务质量因素，针对时间和可靠性双重约束下费用最小化的云工作流调度问题，提出基于萤火虫算法和动态优先级的最优调度方案。结合云工作流调度问题的特点，重新定义了萤火虫算法中的位置、距离以及位置更新方式，同时对于每一种调度方案，采用动态优先级算法确定任务顺序，以减少工作流完成时间。在ＷｏｒｋｆｌｏｗＳｉｍ平台上进行模拟调度仿真实验，证明了该方法在收敛速度和最优值方面均优于传统的云工作流调度算法。关键词：云工作流；调度；可靠性；动态优先级；服务质量；萤火虫算法中图分类号：ＴＰ３１１　　　文献标识码：ＡＭｕｌｔｉ－ＱｏＳ　Ｃｌｏｕｄ　Ｗｏｒｋｆｌｏｗ　Ｓｃｈｅｄｕｌｉｎｇ　Ｂａｓｅｄ　ｏｎ　Ｆｉｒｅｆｌｙ　Ａｌｇｏｒｉｔｈｍ　ａｎｄ　Ｄｙｎａｍｉｃ　ＰｒｉｏｒｉｔｉｅｓＺＨＥＮＧ　Ｈｏｎｇｓｈｅｎｇ，ＹＵ　Ｄｏｎｇｊｉｎ＋，ＺＨＡＮＧ　Ｌｅｉ（Ｓｃｈｏｏｌ　ｏｆ　Ｃｏｍｐｕｔｅｒ，Ｈａｎｇｚｈｏｕ　Ｄｉａｎｚｉ　Ｕｎｉｖｅｒｓｉｔｙ，Ｈａｎｇｚｈｏｕ　３１００１８，Ｃｈｉｎａ）Ａｂｓｔｒａｃｔ：Ｔｏ　ｉｍｐｒｏｖｅ　ｔｈｅ　ｕｓｅｒ　ｓａｔｉｓｆａｃｔｏｒｙ　ａｎｄ　ｒｅｄｕｃｅ　ｔｈｅ　ｏｐｅｒａｔｉｎｇ　ｃｏｓｔｓ，ｔｈｒｅｅ　ｉｍｐｏｒｔａｎｔ　ａｔｔｒｉｂｕｔｅｓ　ｏｆ　Ｑｕａｌｉｔｙ　ｏｆＳｅｒｖｉｃｅ（ＱｏＳ）ｗｈｉｃｈ　ｉｎｃｌｕｄｅｄ　ｔｉｍｅ，ｃｏｓｔｓ　ａｎｄ　ｒｅｌｉａｂｉｌｉｔｙ　ｗｅｒｅ　ｔａｋｅｎ　ｉｎｔｏ　ａｃｃｏｕｎｔ．Ｔｏ　ｓｏｌｖｅ　ｔｈｅ　ｓｃｈｅｄｕｌｉｎｇ　ｐｒｏｂｌｅｍｏｆ　ｃｌｏｕｄ　ｗｏｒｋｆｌｏｗ　ｗｉｔｈ　ｍｉｎｉｍｉｚｅｄ　ｃｏｓｔ　ａｎｄ　ｃｏｎｓｔｒａｉｎｓ　ｂｅｔｗｅｅｎ　ｔｉｍｅ　ａｎｄ　ｒｅｌｉａｂｉｌｉｔｙ，ａｎ　ｏｐｔｉｍａｌ　ｓｃｈｅｄｕｌｉｎｇ　ａｐｐｒｏａｃｈｂａｓｅｄ　ｏｎ　ｆｉｒｅｆｌｙ　ａｌｇｏｒｉｔｈｍ　ａｎｄ　ｄｙｎａｍｉｃ　ｐｒｉｏｒｉｔｉｅｓ　ｗａｓ　ｐｒｏｐｏｓｅｄ．Ｔｈｅ　ｐｏｓｉｔｉｏｎ，ｄｉｓｔａｎｃｅ　ａｎｄ　ｕｐｄａｔｉｎｇ　ｍｏｄｅ　ｏｆ　ｐｏｓｉ－ｔｉｏｎ　ｉｎ　ｆｉｒｅｆｌｙ　ａｌｇｏｒｉｔｈｍ　ｗｅｒｅ　ｒｅｄｅｆｉｎｅｄ　ａｎｄ　ｔｈｅ　ｐｒｉｏｒｉｔｉｅｓ　ｗｅｒｅ　ｄｙｎａｍｉｃａｌｌｙ　ｓｅｔ　ｆｏｒ　ｔａｓｋ　ｏｒｄｅｒ　ｔｏ　ｒｅｄｕｃｅ　ｔｈｅ　ｏｖｅｒａｌｌｃｏｍｐｌｅｔｉｏｎ　ｔｉｍｅ．Ｔｈｅ　ｅｘｐｅｒｉｍｅｎｔａｌ　ｒｅｓｕｌｔｓ　ｃｏｎｄｕｃｔｅｄ　ｏｎ　ＷｏｒｋｆｌｏｗＳｉｍ　ｄｅｍｏｎｓｔｒａｔｅｄ　ｔｈａｔ　ｔｈｅ　ｐｒｏｐｏｓｅｄ　ａｐｐｒｏａｃｈ　ｗａｓｓｕｐｅｒｉｏｒ　ｔｏ　ｔｈｅ　ｔｒａｄｉｔｉｏｎａｌ　ｃｌｏｕｄ　ｗｏｒｋｆｌｏｗ　ｓｃｈｅｄｕｌｉｎｇ　ａｌｇｏｒｉｔｈｍ　ｗｉｔｈ　ｒｅｇａｒｄ　ｔｏ　ｂｏｔｈ　ｔｈｅ　ｃｏｎｖｅｒｇｅｎｃｅ　ｓｐｅｅｄ　ａｎｄ　ｔｈｅｏｂｔａｉｎｅｄ　ｏｐｔｉｍａｌ　ｖａｌｕｅ．Ｋｅｙｗｏｒｄｓ：ｃｌｏｕｄ　ｗｏｒｋｆｌｏｗ；ｓｃｈｅｄｕｌｉｎｇ；ｒｅｌｉａｂｉｌｉｔｙ；ｄｙｎａｍｉｃ　ｐｒｉｏｒｉｔｙ；ｑｕａｌｉｔｙ　ｏｆ　ｓｅｒｖｉｃｅ；ｆｉｒｅｆｌｙ　ａｌｇｏｒｉｔｈｍ０　引言近年来，随着云计算技术的迅猛发展，越来越多的组织将传统的业务过程与应用迁移到云计算环境。云工作流调度指将相互之间具有依赖关系的工作流任务映射到虚拟机资源上执行的过程，它决定了工作流实例执行的成败和执行效率的高低［１］。一般说来，云工作流调度问题是一个ＮＰ－ｈａｒｄ问题，对于用户给定的工作流实例，调度过程存在较大的改进和优化空间。目前国内外学者在工作流优化调度方面做了许多有价值的研究工作。关于优化工作流完成时间（ｍａｋｅｓｐａｎ）问题，Ｓｈｉｓｈｉｒ等［２］针对单工作流应用，提出一种针对异构资源的工作流调度经典算法———异构最早完成时间（Ｈｅｔｅｒｏｇｅｎｅｏｕｓ　Ｅａｒｌｉｅｓｔ　ＦｉｎｉｓｈＴｉｍｅ，ＨＥＦＴ），该算法根据任务的平均执行时间和通信时间计算出一个优先级，在任务分配时选择具有最大优先级的任务，并将其调度到完成时间最小郑宏升等：基于萤火虫算法和动态优先级的多ＱｏＳ云工作流调度行顺序时采用静态优先级的方式，如ＨＥＦＴ算法。这种方法使用任务平均执行时间，只要计算一次便可确定优先级。然而在实际中，当分配方案确定时，任务的执行时间根据其被具体分配到的虚拟机进行计算。因此，可以根据实际分配方案动态调整任务的优先级，称之为动态优先级。该方法的主要思想是每次在可执行任务列表中找到完成时间最早的任务分配高优先级，具体算法如算法１所示。这里用变量ｅｎｔｉｔｙＮｕｍ表示每个任务还有多少父任务未确定优先级，用变量ｉｄｘ表示优先级（ｉｄｘ越小优先级越高），用ｖｍＴａｓｋＬｉｓｔ表示每个虚拟机中的可执行任务列表。算法的具体执行过程如下：① 将起始任务添加到对应的虚拟机可执行列表中（ｖｍＴａｓｋＬｉｓｔ，第５～６行），初始化ｅｎｔｉｔｙＮｕｍ为每个任务对应的父任务个数（第８行）；② 遍历每个虚拟机的可执行列表，计算可执行任务的完成时间（第１２～１５行）；③在所有可执行任务中找到完成时间最早的任务ｔｔａｓｋ＿ｓｅｌ（第１６～１８行）；④为ｔｔａｓｋ＿ｓｅｌ分配优先级，删除对应虚拟机中可执行任务列表中的该任务（第１９～２１行）；⑤ 更新ｔｔａｓｋ＿ｓｅｌ所有子任务在ｅｎｔｉｔｙＮｕｍ中的状态，若变为可执行任务，则添加到对应虚拟机的可执行列表中（第２２～２５行）；⑥重复步骤②～⑤，直到每个虚拟机都没有可执行的任务。算法１　动态优先级算法。输入：Ｍ　／／任务与资源的映射关系，Ｍ（ｔｉ）表示任务ｔｉ分配到的虚拟机。输出：ｒａｎｋ（ｔｉ），１≤ｉ≤Ｎ　／／任务优先级。０１：ｉｄｘ＝０；　／／动态０２：ｅｎｔｉｔｙＮｕｍ（Ｔａｓｋ→ｐａｒｅｎｔＮｕｍ）←　　／／该任务还有多少父任务未分配优先级０３：ｖｍＴａｓｋＬｉｓｔ（ＶＭ→Ｔａｓｋｓ）←　　　／／虚拟机中可以开始执行的任务０４：ｆｏｒ　ｅａｃｈ　ｔａｓｋ　ｔｉ０５：　ｉｆ　ｔｉｈａｓ　ｎｏｔ　ｐａｒｅｎｔｓ　ｔｈｅｎ０６：　　ｖｍＴａｓｋＬｉｓｔ．ｇｅｔ（ｖｍＭｉ）．ａｄｄ（ｔｉ）０７：　ｅｌｓｅ０８：　　ｅｎｔｉｔｙＮｕｍ．ｇｅｔ（ｔｉ）←ｔｉ的父任务数０９：ｗｈｉｌｅ　ｖｍＴａｓｋＬｉｓｔ．ｉｓＮｏｔＥｍｐｔｙ（）ｄｏ　／／还有虚拟机有任务要分配１０：　ｍｉｎ＿ｅｎｄ←∞１１：　ｔａｓｋ＿ｓｅｌ←ｎｕｌｌ１２：　ｆｏｒ　ｅａｃｈ　ｒｅｓｏｕｒｃｅ　ｖｍｊｉｎ　ｖｍＴａｓｋＬｉｓｔ１３：　　Ｔａｓｋｓｊ← ｖｍＴａｓｋＬｉｓｔ．ｇｅｔ（ｖｍｊ）１４：　　ｆｏｒ　ｅａｃｈ　ｔａｓｋ　ｔｉｉｎ　Ｔａｓｋｓｊ１５：　　　ｒｕｎｔｉｍｅ← 根据式（２）计算得到任务的完成时间；１６：　　　ｉｆ　ｒｕｎｔｉｍｅ＜ｍｉｎ＿ｅｎｄ１７：　　　　ｍｉｎ＿ｅｎｄ← ｒｕｎｔｉｍｅ１８：　　　　ｔａｓｋ＿ｓｅｌ←ｉ１９：　ｒｅｓ＿ｓｅｌ←Ｍ（ｔａｓｋ＿ｓｅｌ）２０：　ｖｍＴａｓｋＬｉｓｔ．ｇｅｔ（ｒｅｓ＿ｓｅｌ）．ｒｅｍｏｖｅ（）２１：　ｒａｎｋ（ｔａｓｋ＿ｓｅｌ）＝ｉｄｘ＋＋２２：　ｆｏｒ　ｅａｃｈ　ｔａｓｋ　ｔｉｉｎ　ｓｕｃｃ（ｔａｓｋ＿ｓｅｌ）２３：　　ｅｎｔｉｔｙＮｕｍ．ｇｅｔ（ｔｉ）－－２４：　　ｉｆ　ｅｎｔｉｔｙＮｕｍ．ｇｅｔ（ｔｉ）＝＝０２５：　　　ｖｍＴａｓｋＬｉｓｔ．ｇｅｔ（ｖｍＭｉ）．ａｄｄ（ｔｉ）２６：ｒｅｔｕｒｎ　ｒａｎｋ３．３．２　算法流程算法２给出了基于ＣＷＦＡ的云工作流调度算法的伪代码实现方案。算法的输入为任务列表和虚拟机列表，输出为最优适应度值ｂｅｓｔＦｉｔｎｅｓｓ和最优分配方案ｂｅｓｔＤｏｐ。算法执行主要分为以下几个步骤：（１）初始化算法基本参数。设置萤火虫的数目ｖ、光吸收系数γ、最大迭代数ｉｔＭａｘ、步长因子α，对应算法２中的第１～２行。（２）生成初始萤火虫种群。随机生成萤火虫位置，根据式（１４）计算适应度函数值作为萤火虫的亮度。设置最优适应度值ｂｅｓｔＦｉｔｎｅｓｓ为初始萤火虫中的最优适应度值、最优分配方案ｂｅｓｔＤｏｐ为相应的萤火虫位置，对应算法２中的第３～６行。（３）萤火虫的移动。在一只萤火虫ｉ的搜索范围内，找到所有比它亮的萤火虫并放到集合Ｎｉｔｉ＝｛ｎｉｔｉ，１，ｎｉｔｉ，２，…，ｎｉｔｉ，ｎｉ｝中，其中：ｎｉ表示集合中萤火虫的个数，ｎｉｔｉ，ｊ表示萤火虫的编号。遍历集合Ｎｉｔｉ，萤火虫ｉ被萤火虫ｎｉｔｉ，ｊ吸引而向ｎｉｔｉ，ｊ移动，１≤ｊ≤ｎｉ。根据式（１２）计算萤火虫ｎｉｔｉ，ｊ对萤火虫ｉ的吸引度，根据式（１３）进行位置更新。若周围没有比它更亮的萤火虫（Ｎｉｔｉ为空集），则该只萤火虫为最优萤火虫；若对应的调度方案没有满足时间约束，则在最终完成时间最大的虚拟机上挑选出运行时间最短的任务，将其分配到最终完成时间最小的虚拟机上，优先满足时间约束。若满足截止时间，则随机移动，对应代码的１０～１３行。（４）更新亮度。更新萤火虫位置后，重新计算适应度值，若适应度值大于ｂｅｓｔＦｉｔｎｅｓｓ，则设置ｂｅｓｔ－Ｆｉｔｎｅｓｓ为该适应度值，并更新ｂｅｓｔＤｏｐ，对应算法２中的第１４～１７行。６９７计算机集成制造系统第２３卷（５）当前迭代次数ｉｔ＝ｉｔ＋１，若ｉｔ＜ｉｔＭａｘ，则转步骤（３）。（６）输出最优适应度值ｂｅｓｔＦｉｔｎｅｓｓ和最优分配方案ｂｅｓｔＤｏｐ。算法２　云工作流调度算法（ＣＷＦＡ）。输入：Ｔ＝｛ｔ１，ｔ２，…，ｔｉ，…，ｔｎ｝／／任务列表；　ＶＭ＝｛ｖｍ１，ｖｍ２，…，ｖｍｍ｝／／虚拟机列表。输出：ｂｅｓｔＦｉｔｎｅｓｓ，ｂｅｓｔＤｏｐ／／最优适应度值，最优分配方案。０１：　初始化：萤火虫数ｖ、最大迭代次数ｉｔＭａｘ、光吸收系数γ０２：　最大吸引度βｏ、步长因子α．０３：　萤火虫位置空间ｄｐｏｓ←ｎ＊ｖ的矩阵；０４：　萤火虫亮度空间ｆｖａｌｕｅ←ｎ维向量；０５：　［ｄｐｏｓ，ｆｖａｌｕｅ］←ｉｎｉｔＶａｌｕｅ（）；０６：　ｂｅｓｔＦｉｔｎｅｓｓ，ｂｅｓｔＤｏｐ←ｆｖａｌｕｅ［ｉ］＝ｍａｘ｛ｄｏｐｓ［ｉ］｝，ｄｐｏｓ［ｋ］０７：　ｆｏｒ　ｉｔ＝１ｔｏ　ｉｔＭａｘ　ｄｏ０８：　　ｆｏｒ　ｉ＝１ｔｏ　ｖ　ｄｏ０９：　　萤火虫集合Ｎｉｔ←选择更亮的萤火虫１０：　　ｉｆ　Ｎｉｔ≠ ｄｏ１１：　　　根据式（１２）更新吸引度β，根据式（１３）更新ｄｐｏｓ［ｉ］１２：　　ｅｌｓｅ１３：　　　根据“最优调整规则”进行位置更新　　　／／该萤火虫为最亮萤火虫１４：　　ｕｐｄａｔｅ　ｆｖａｌｕｅ［ｉ］１５：　　　ｉｆ　ｆｖａｌｕｅ［ｉ］＜ｂｅｓｔＦｉｔｎｅｓｓ　ｄｏ１６：　　　　ｂｅｓｔＦｉｔｎｅｓｓ＝ｆｖａｌｕｅ［ｉ］１７：　　　　ｂｅｓｔＤｏｐ＝ｄｏｐｓ［ｉ］１８：ｒｅｔｕｒｎ　ｂｅｓｔＤｏｐ４　实验分析４．１　实验配置实验使用ＷｏｒｋｆｌｏｗＧｅｎｅｒｔｏｒ［１４］生成任务数为５０，１００，２００和３００的激光干涉引力波天文台（Ｌａ－ｓｅｒ　Ｉｎｔｅｒｆｅｒｏｍｅｔｅｒ　Ｇｒａｖｉｔａｔｉｏｎａｌ　ｗａｖｅ　Ｏｂｓｅｒｖａｔｏ－ｒｙ，ＬＩＧＯ）应用的工作流模型。ＬＩＧＯ是一个通过分析压缩双星系统（如中子星和黑洞）获取到的数据来探测引力波的天体物理学应用。ＬＩＧＯ中生成的任务同质化程度较低，其基本结构如图１所示。所有实验基于以下环境：处理器为Ｉｎｔｅｌ（Ｒ）Ｃｏｒｅ（ＴＭ）ｉ５－２４５０Ｍ，２．５ＧＨｚ；４ＧＢ内存；Ｗｉｎｄｏｗｓ　７６４位操作系统。假设有一个数据中心，其有１０个虚拟机，每个虚拟机的计算速度在５００～１　５００ＭＩＰＳ之间随机选取，虚拟机之间的带宽是一个５００Ｍｂｐｓ～１．５Ｇｂｐｓ之间的随机数。假设虚拟机的失败率和虚拟机之间的传输失败率符合均匀分布，其取值范围为１０－３／ｈ～１０－４／ｈ［１５］。虚拟机的收费模拟亚马逊的收费模式，即虚拟机速度越快、费用越高。生成的虚拟机具体配置如表１所示，其中虚拟机之间的传输数据带宽按照双方最小的带宽计算。表１　不同类型虚拟机实例参数设置编号计算速度／ＭＩＰＳ带宽／Ｍｂｐｓ单价／（＄·ｈ－１）失败率／（×１０－４·ｈ－１）１　１　４１９　７７７　４．２６　５．９０２　５１５　９６１　１．５４　６．２０３　１　０５５　５３８　３．１７　４．０９４　１　４２１　１　００４　４．２６　３．４５５　１　０８３　１　４３５　３．２５　３．１０６　５１０　１　４３３　１．５３　４．２１７　１　４７４　１　４３８　４．４２　８．９０８　５５１　１　２６４　１．６５　８．１５９　１　３９９　７２１　４．２０　２．９８１０　８２５　７２４　２．４７　６．４５实验需要用户给出一个截止时间和可靠性约束，这两个取值要求在合理范围之内。本文选取的截止时间依据ＨＥＦＴ算法的实验结果设置，即将截止时间设置为ＨＥＦＴ算法的１．１５倍。选取的可靠性约束要大于一个最低可靠性，这个最低可靠性是将所有任务都分配到可靠性最差的虚拟机上时流程执行的可靠性。完成时间和可靠性约束的取值如表２所示。６９８郑宏升等：基于萤火虫算法和动态优先级的多ＱｏＳ云工作流调度表２　完成时间和可靠性约束实例类型完成时间约束可靠性约束ＬＩＧＯ－５０　２　６００　０．６５ＬＩＧＯ－１００　４　６００　０．６３ＬＩＧＯ－２００　１５　０００　０．５４ＬＩＧＯ－３００　２７　０００　０．５０４．２　参数分析本文有萤火虫数目ｖ和步长因子α两个重要参数。经过实验分析，步长因子对实验结果几乎没有影响，因此下面只分析萤火虫数目对算法目标值的影响。实验分析了任务数为５０，１００，２００，３００共４种ＬＩＧＯ工作流模型下，参数ｖ在２５～１００范围内对算法目标值的影响。对于每种参数组合，运行ＣＷ－ＦＡ　１００次，选取平均适应度值来分析萤火虫数目ｖ对算法结果的影响，如表３所示。从表３可以看出，在选定数据集的情况下，随着萤火虫数目的增加，适应度值越来越好。这是因为萤火虫数目的增加会扩大解的搜索范围，使得到更优解的概率增加。从表３也可以看出，随着萤火虫数目的增加，满足约束的解的个数也随之增加。表３　参数ｖ在不同数据集下对适应度值的影响适应度值２５　５０　７５　１００ＬＩＧＯ－５０　１．５０４　１．３３９　１．２１１　１．１０８ＬＩＧＯ－１００　１．４６３　１．２８７　１．０００　０．８５９ＬＩＧＯ－２００　０．２６４　０．２１６　０．２１２　０．１９９ＬＩＧＯ－３００　０．１４３　０．１０４　０．０９０　０．０８５４．３　结果对比４．３．１　与标准萤火虫算法对比经过实验分析得到了模型参数取值：萤火虫个数ｖ＝５０，步长因子α＝１。此外，取迭代次数为１００。在实验中，首先对算法收敛次数进行比较。在任务数为５０，１００，２００，３００时，ＣＷＦＡ和标准萤火虫算法（ＦＡ）所得调度方案的适应度值变化情况如图２所示。从图２可以看出，ＣＷＦＡ在不同任务数情况下得出的最优调度方案的适应度值均比标准萤火虫低。在任务数为５０～１００时，ＣＷＦＡ在迭代次数较少时就已经找到了近似最优解，说明本文算法可以较快地寻找到较优的调度方案。同时在不同任务数下，可以发现ＣＷＦＡ生成的调度方案的适应度值均比标准ＦＡ低。６９９计算机集成制造系统第２３卷在任务数为５０，１００，２００，３００时，两种算法的最优调度方案费用值比较如图３所示。从图３可以看出，随着任务量从５０增长至３００，ＣＷＦＡ生成的调度方案费用值均较低，并且其调度方案费用值与标准ＦＡ的差值越来越大。说明ＣＷＦＡ更加适用于任务数较多的情况，这是因为在任务数较多的情况下，ＣＷＦＡ可以在较大范围内搜索，体现了算法全局搜索能力的优势。４．３．２　与ＧＡ，Ｓ－ＣＬＰＳＯ算法对比下面将ＣＷＦＡ与遗传算法（Ｇｅｎｅｔｉｃ　Ａｌｇｏ－ｒｉｔｈｍ，ＧＡ）、基于集合的全面学习的离散粒子群优化（ｄｉｓｃｒｅｔｅ　ｖｅｒｓｉｏｎ　ｏｆ　Ｃｏｍｐｒｅｈｅｎｓｉｖｅ　ＬｅａｒｎｉｎｇＰａｒｔｉｃｌｅ　Ｓｗａｒｍ　Ｏｐｔｉｍｉｚｅｒ　ｂａｓｅｄ　ｏｎ　ｓｅｔ－ｂａｓｅｄ　ｐａｒ－ｔｉｃｌｅ　ｓｗａｒｍ　ｏｐｔｉｍｉｚａｔｉｏｎ，Ｓ－ＣＬＰＳＯ）算法两种随机搜索算法进行对比，这两种算法都考虑了时间、费用和可靠性３种约束。（１）ＧＡ　文献［１６］提出一种费用为约束、完工时间最小且任务执行失败率最低的ＧＡ，用来解决云工作流调度问题。实验设定：初始种群１００，迭代次数１００，交叉概率０．５，变异概率０．０１。（２）Ｓ－ＣＬＰＳＯ　该方法将ＰＳＯ算法离散化，用于求解云工作流调度问题，并允许用户自定义不同类型的ＱｏＳ约束［１７］。其中Ｓ－ＣＬＰＳＯ有惯性权重ｗ、学习因子ｃ１和ｃ２３个重要参数。根据实验得到较优的参数：ｗ＝０．８；学习因子ｃ１＝１，ｃ２＝１。表４给出了不同任务数的ＬＩＧＯ工作流模型下，３种算法在本文实验环境下运行１００次得出的调度方案各个指标的平均值。表４　不同任务数下３种算法的最优调度结果对比调度结果ＣＷＦＡ　ＧＡ　Ｓ－ＣＬＰＳＯ费用完成时间可靠性费用完成时间可靠性费用完成时间可靠性ＬＩＧＯ－５０　８８　２　５７９　０．６３　１０３　２　５３４　０．６７　１０１　２　４３６　０．６７ＬＩＧＯ－１００　１６８　４　５０５　０．６４　１９４　４　５７６　０．６６　１８７　４　６６２　０．６６ＬＩＧＯ－２００　３４２　７　９１４　０．６２　３８８　８　８５４　０．６１　３７５　１０　９３４　０．６１ＬＩＧＯ－３００　５１７　１２　５３６　０．６１　５６９　１６　０５８　０．６１　５５３　１８　３４２　０．５６在费用优化方面（如图４ａ），随着任务量从５０增长至３００，３种算法的费用均越来越高，但是ＣＷＦＡ生成的调度方案费用值均最低。Ｓ－ＣＬＰＳＯ和ＧＡ的费用随着任务数的增多远高于ＣＷＦＡ。在完成时间方面（如图４ｂ），当任务数为５０时，ＣＷＦＡ的完工时间高于Ｓ－ＣＬＰＳＯ和ＧＡ。但随着任务数的增加，ＣＷＦＡ调度结果的完成时间均明显优于其他算法，这是因为ＣＷＦＡ采用动态优先级调整任务之间的执行顺序，使得完成时间更短。５　结束语本文针对时间和可靠性双重约束下费用最小化的云工作流调度问题，提出基于ＦＡ和动态优先级的最优调度方案搜索方法。重新定义了ＦＡ中的位置、距离和位置更新方式，同时对每一种调度方案，采取动态优先级确定任务顺序。通过仿真实验结果证明了本文所提算法在费用和完工时间方面不但均优于传统ＦＡ，而且优于ＧＡ和Ｓ－ＣＬＰＳＯ算法。７９０

[返回]

上一篇：面向二进制程序的空指针解引用错误的检测方法
下一篇：基于凸多面体抽象域的自适应强化学习技术研究