背景
在电商业务中, 一个核心的生产环节是打包: 把用户购买的商品打包装入纸箱.
纸箱成本一般与纸板面积成正比. 为了节约打包成本, 我们希望从候选纸箱中选择最小的纸箱来装用户购买的商品. 在实际操作中, 工人一般倾向于选择较大的纸箱, 不仅能减少选择纸箱的时间, 而且能降低装箱难度, 从而加快生产效率. 但这样做会显著增加生产成本.
能不能利用算法来告诉工人如何选择纸箱, 从而节约纸箱成本?
装箱问题
从算法角度解决上述问题有如下难点:
-
商品的形状不规则. 有些商品没有外包装, 例如啤酒瓶是圆柱状, 而垃圾桶是中空的.
-
商品的材质软硬不同. 毛巾, 衣服等商品可以折叠, 那么如何测量其几何形状? 装箱时是否可以折叠?
-
商品的摆放方式*. 在业务允许的前提下, 商品可以旋转, 倾斜, 折叠等方式进行摆放.
-
判定纸箱是否能装下商品. 给定商品信息和纸箱三维长度, 如何判定商品能否装下?
因此, 需要把问题适当简化. 我们做如下假设:
- 把每个商品看成长方体, 并测量其长宽高.
- 不考虑可以折叠和中空的商品.
- 所有商品能够以90°旋转.
剩下的问题是如何用算法来判定给定的商品是否能装入给定的纸箱. (如果这个问题得到解决, 我们就可以对每个纸箱求解一次该问题, 从而选择能装下所有商品的最小箱子.)
装箱问题
-
输入: 给定n个商品和一个纸箱, 商品的长宽高为(li,wi,hi), i=1,2,…,n, 纸箱的长宽高为(L,W,H). 假设商品是长方体, 长度不可变(没有弹性). 装箱时可以对商品进行90度旋转, 但不能倾斜.
-
输出: 判断所有商品是否能装入纸箱.
从计算复杂性的角度来, 该问题属于NP-complete1. 在NP= P的假设下2, 该问题不能在多项式时间内求解. 换句话说, 我们找不到"又快又好"的算法求解该问题. 在实际中, 我们经常采用效率换质量的策略来求解这一类问题. 即, 允许算法不是最优解, 但要求在可以接受的时间内返回可行解(feasible solution).
这样一来可能出现算法推荐不正确的问题:
-
推大用小. 算法推荐的纸箱比工人实际使用的纸箱大. 在这种情况下, 工人的操作会比算法推荐更节约成本.
-
推小用大. 算法推荐的纸箱比工人实际使用的纸箱小. 在这种情况下, 工人的操作会失败, 不仅会误导工人, 而且降低生产效率.
因此, 算法要避免产生推小用大的错误. 换句话说, 算法推荐的纸箱一定要能装下所有商品.
启发式算法
比较容易想到的是设计一些装箱的规则, 例如最大体积优先, 最大面积优先等, 其缺点是我们无法保证得到最优解. 我们以二维装箱为例, 下图的例子考虑5个商品, 方块中的数字代表长×宽, 箱子的大小为8×4. 最大面积优先和最长边优先的装箱策略均无法得到最优解.
整数线性规划
下面介绍一种求最优解的方法. 基本思想是把该问题用数学语言来描述, 从而建立优化目标和不等式组. 利用数学规划求解器来解对应的数学问题, 从而得到最优解. 难点在于如何建立该问题的数学模型3.
1. 下标
为方便描述, 我们用下标i,j代表商品, k代表商品摆放方式.
-
i,j∈{1,2,…,n} – 商品
-
k∈{1,2,…,6} – 商品的摆放方式(对应σk)
2. 输入参数
算法的输入称为参数. 该问题的参数如下.
-
n – 商品数量
-
L,W,H – 箱子的长宽高
-
li,wi,hi – 商品i的长宽高
3. 决策变量
我们把算法需要求解的变量称为决策变量. 下面我来定义该问题的决策变量. 给定长方体(L,W,H)(代表商品或纸箱), 我们用如图所示的左手坐标系, 把长方体置于原点(使得长方体中所有点的坐标非负). 因此, 任意一个长方体可以用图中的a,b两点来确定位置. 我们把**a点称为长方体的位置**.
定义商品的a点和b点坐标:
-
xi∈[0,L],yi∈[0,W],zi∈[0,H] – 商品i的位置坐标(即a点坐标)
-
l^i∈[0,L],w^i∈[0,W],h^i∈[0,H] – 商品i的b点坐标
如图所示, 上述长方体的位置为(0,0,0), b点坐标为(L,W,H). 允许90°旋转的条件下, 它一共有6种摆放方式, 即(L,W,H)的所有置换(Permutation):
σ1:(L,W,H)σ2:(L,H,W)σ3:(W,L,H)σ4:(W,H,L)σ5:(H,L,W)σ6:(H,W,L)
k=1,2,…,6表示按上述第k种摆放方式σk. 我们用δik来表示商品i是否按照第k种方式摆放.
-
δik∈{0,1} – 商品i按第k种方式摆放.
考虑任意两个商品i,j. 它们一共有6种相对位置:
-
aij – i在j的左侧
-
bij – i在j的右侧
-
cij – i在j的后面
-
dij – i在j的前面
-
eij – i在j的下面
-
fij – i在j的上面
-
aij,bij,cij,dij,eij,fij∈{0,1} – 商品i和j的6种位置关系
4. 约束
下面我们建立(li,wi,hi)与(l^i,w^i,h^i)之间的对应关系. 回顾δik代表商品i的第k种摆放方式, 我们有
l^i=δi1li+δi2li+δi3wi+δi4wi+δi5hi+δi6hiw^i=δi1wi+δi2hi+δi3li+δi4hi+δi5li+δi6wih^i=δi1hi+δi2wi+δi3hi+δi4li+δi5wi+δi6li
注意到商品i不能同时存在两种摆放方式, 因此
k=1∑6δik=1.
考虑任意两个商品i,j, 它们之间有6种位置关系: i在j的左侧, 右侧, 后面, 前面, 下面, 上面. 分别用aij,bij,cij,dij,eij,fij表示. 回顾商品i的位置坐标为(xi,yi,zi). 以i在j的左侧为例, 即, 当aij=1时, 我们有xi+l^i≤xj. 如图所示.
类似地, 我们有
- aij=1⇒xi+li^≤xj
- bij=1⇒xj+lj^≤xi
- cij=1⇒yi+wi^≤yj
- dij=1⇒yj+wj^≤yi
- eij=1⇒zi+hi^≤zj
- fij=1⇒zj+hj^≤zi
把上述关系写成不等式, 我们得到
xi+li^≤xj+(1−aij)Lxj+lj^≤xi+(1−bij)Lyi+wi^≤yj+(1−cij)Wyj+wj^≤yi+(1−dij)Wzi+hi^≤zj+(1−eij)Hzj+hj^≤zi+(1−fij)H.
在上述6种相对位置中, (左, 右), (前, 后), (上, 下)每一对关系不能同时存在, 因此
aij+bij≤1cij+dij≤1eij+fij≤1.
但是, 这6种相对位置至少有一种必须存在. 我们有
aij+bij+cij+dij+eij+fij≥1.
已知商品i的位置是(xi,yi,zi), 它的b点坐标为
(xi+l^i,yi+w^i,zi+z^i).
由于装入纸箱的商品不能超过纸箱的长宽高, 因此
xi+l^i≤Lyi+w^i≤Wzi+h^i≤H.
5. 数学模型
综上所述, 我们得到如下的数学规划问题.
min s.t. 0aij+bij≤1,∀i<jcij+dij≤1,∀i<jeij+fij≤1,∀i<jaij+bij+cij+dij+eij+fij≥1,∀i<jk=1∑6δik=1,∀il^i=δi1li+δi2li+δi3wi+δi4wi+δi5hi+δi6hi,∀iw^i=δi1wi+δi2hi+δi3li+δi4hi+δi5li+δi6wi,∀ih^i=δi1hi+δi2wi+δi3hi+δi4li+δi5wi+δi6li,∀ixi+l^i≤xj+(1−aij)L,∀i<jxj+l^j≤xi+(1−bij)L,∀i<jyi+w^i≤yj+(1−cij)W,∀i<jyj+w^j≤yi+(1−dij)W,∀i<jzi+h^i≤zj+(1−eij)H,∀i<jzj+h^j≤zi+(1−fij)H,∀i<jxi+l^i≤L,∀iyi+w^i≤W,∀izi+h^i≤H,∀iδik,aij,bij,cij,dij,eij,fij∈{0,1},∀i<j,∀kxi,yi,zi≥0,∀i
利用开源工具OR-Tools或商用求解器(例如Gurobi)求解上述问题, 如果有可行解则表示纸箱能装入所有商品.
Remark 该精确算法的计算时间随商品数量成指数增长. 因此仅限于求解小规模问题, 例如商品数量限定在10个以内. 在实际应用中, 小规模问题我们可以使用精确算法, 而大规模问题可以考虑启发式算法.
参考文献
-
https://en.wikipedia.org/wiki/NP-completeness ↩︎
-
https://en.wikipedia.org/wiki/P_versus_NP_problem ↩︎
-
Chen C S, Lee S M, Shen Q S. An analytical model for the container loading problem[J]. European Journal of Operational Research, 1995, 80(1): 68-76. ↩︎