算法导论 — 思考题8-4 水壶

水壶)假设给了你nn个红色的水壶和nn个蓝色的水壶。它们的形状和尺寸都各不相同。所有红色水壶的容量都不一样多,蓝色水壶也是如此。而且,对于每一个红色水壶来说,都有一个对应的蓝色水壶,两者容量相等;反之亦然。
  你的任务是找出所有的容量相等的红色水壶和蓝色水壶,并将它们配成一对。为此,可以执行如下操作:挑出一对水壶,其中一个是红色的,另一个是蓝色的,将红色水壶中倒满水,再将水倒入蓝色水壶中。通过这一操作,可以判断出这个红色水壶的容量是否比蓝色水壶的容量更多,或是两者一样多的。假设这样的比较需要花费一个单位时间。你的目标是找出一个算法,它能够用最少的比较次数来确定所有水壶的配对。注意,你不能直接比较两个红色或两个蓝色的水壶。
  a. 设计一个确定性算法,它能够用Θ(n2)Θ(n^2)次比较来完成所有水壶的配对。
  b. 证明:解决该问题算法的比较次数下界为Ω(nlgn)Ω(n{\rm lg}n)
  c. 设计一个随机算法,其期望的比较次数为O(nlgn)O(n{\rm lg}n),并证明这个界是正确的。对你的算法来说,最坏情况下的比较次数是多少?
  
  
  a.
  依次选取红色水壶,将当前的红色水壶与所有的蓝色水壶进行比较,从中挑出与当前红色水壶容量一样的蓝色水壶。下面给出该算法的伪代码。
  算法导论 — 思考题8-4 水壶
  显然,输出数组MM<1,2,,n><1, 2, …, n>的一个排列。M[i]M[i]表示第ii个红色水壶与第几个蓝色水壶配对。从伪代码可以看出,M[i]M[i]也表示第ii个红色水壶参与比较的次数,因为第M[i]M[i]个蓝色水壶是与第ii个红色水壶比较的最后一个蓝色水壶。因此,总的比较次数为
    i=1nM[i]=i=1ni=n(n+1)2\sum_{i=1}^{n}{M[i]} = \sum_{i=1}^{n}{i} = \frac{n(n+1)}{2}
  因此,这一算法需要进行Θ(n2)Θ(n^2)次比较。
  
  b.
  用决策树模型来证明。考虑一个简单的例子,33个红色水壶为<a,b,c><a, b, c>33个蓝色水壶为<d,e,f><d, e, f>,决策树如下所示。
  算法导论 — 思考题8-4 水壶
  在决策树中,每个叶结点都是可能的配对情况,每个非叶结点表示一次比较。如果红蓝水壶各有nn个,那么根据排列组合原理,可能的配对情况一共有n!n!种,也就是说决策树一共有n!n!个叶结点。假设该决策树的高度为hh,那么它最多包含2h2^h个叶结点。于是有
    n!2hn!≤2^h
  对该不等式两边取对数,得到hlg(n!)=Ω(nlgn)h≥{\rm lg}(n!)=Ω(n{\rm lg}n)。所以,解决水壶配对问题的算法的比较次数的下界为Ω(nlgn)Ω(n{\rm lg}n)
  
  c.
  按照题目意思,每一个红色水壶都有一个蓝色水壶与之容量相等。比较简单的一个想法是,将所有红色水壶按照容量由小到大进行排序,再将所有蓝色水壶按照容量由小到大进行排序,排序后处于相同位置的红色水壶和蓝色水壶一定是容量相等的。排序可以采用随机化的快速排序,期望时间复杂度为O(nlgn)O(n{\rm lg}n)。然而,这个想法违反了题目要求。因为题目只允许红色水壶与蓝色水壶进行比较,而不允许相同颜色的水壶进行比较。
  为了满足题目要求,可以考虑对快速排序做出修改,详见下面的伪代码BOTTLEMATCH2{\rm BOTTLE-MATCH-2}。每次调用BOTTLEMATCH2{\rm BOTTLE-MATCH-2},从红色水壶RR中随机选出一个rr,将rr与所有蓝色水壶BB比较,从而将蓝色水壶分为33类:容量小于rr的蓝色水壶BlessB_{less},容量大于rr的蓝色水壶BmoreB_{more},容量等于rr的蓝色水壶bb。类似地,用蓝色水壶bb将红色水壶也分为33类:容量小于bb的蓝色水壶RlessR_{less},容量大于bb的蓝色水壶RmoreR_{more},容量等于bb的蓝色水壶rr。红色水壶rr与蓝色水壶bb的容量相等,二者配成一对。再递归的调用BOTTLEMATCH2(Rless,Bless){\rm BOTTLE-MATCH-2}(R_{less}, B_{less})BOTTLEMATCH2(Rmore,Bmore){\rm BOTTLE-MATCH-2}(R_{more}, B_{more})
  算法导论 — 思考题8-4 水壶
  该算法实际上是对两个数组进行快速排序,根据第7章对快速排序的分析,期望的比较次数为O(nlgn)O(n{\rm lg}n)。在最坏情况下,比较次数为O(n2)O(n^2)