0%

求解 SDP 问题—使用 SeDuMi 和 YALMIP

SDP(SemiDefinite Programing,半定规划)是凸优化(Convex Optimization)的一种,貌似近些年来比较热,反正这个东西常常出现在我看的论文中。论文里一般是把一个问题转化为 SDP,然后极不负责任的扔了一句可以使用 SeDuMi 等工具箱解决就完事了,搞的本人非常迷茫,于是决定一探究竟,谁知还搞了个意外收获,那就是 YALMIP 工具箱。SeDuMiYALMIP都是 Matlab 的工具箱,下载和安装请参见它们的主页。下面我就分别谈谈怎么样将两个工具箱应用于 SDP 求解吧。

SDP 问题的对偶原型及求解步骤

下面就是一个典型的 SDP 问题:

目标函数是线性的,有一个等式约束,有一个不等式约束,最后一个是 LMI(Linear Matrix Inequality,线性矩阵不等式)约束。使用 SeDuMi 来解决此类问题,我们就要自行构造调用 SeDuMi 的核心函数sedumi(Att,bt,ct,K)的四个参数。

等式约束的个数: $K.f = size(A_{1},1)$

不等式约束的个数: $K.l = size(A_{2},1)$

LMI 中矩阵的阶数: $K.s = size(F_{0},1)$

这样,我们就可以调用$[x,y,info] = sedumi(Att,bt,ct,K)$来求解了,其中的 y 即为优化后得到的最优解。

一个典型的例子

这里举一个简单的例子,并给出 Matlab 的实际代码,以便能更好地理解运用上节的知识。SDP 的一个最简单的应用就是最大化矩阵的特征值问题。如我们要找$y_{1},y_{2},y_{3}$使矩阵$F = F_{0}+y_{1}F_{1}+y_{2}F_{2}+y_{3}F_{3}$的特征值最大化,其中$F_{0},F_{1},F_{2},F_{3}$分别为:

同时,我们对$y_{1},y_{2},y_{3}$也给出一个不等式限制和一个等式限制:

那么这个问题可以描述成以下形式:

其中$y,A_{1},A_{2},b_{1},b_{2}$的取值分别为:

下面我们就可以使用 sedumi 函数进行优化求解了,给出 Matlab 代码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
A1 = [1 1 1 0];
A2 = [1 0 0 0; -1 0 0 0; 0 1 0 0; 0 -1 0 0; 0 0 1 0];
b1 = 1;
b2 = [0.7 -1 0 -0.3 0]';
F0 = [2 -0.5 -0.6; -0.5 2 0.4; -0.6 0.4 3];
F1 = [0 1 0; 1 0 0; 0 0 0];
F2 = [0 0 1; 0 0 0; 1 0 0];
F3 = [0 0 0; 0 0 1; 0 1 0];
F4 = eye(3);
At = -[vec(F1) vec(F2) vec(F3) vec(F4)];
Att = [A1; -A2; At];
bt = -[0 0 0 1]';
ct = [b1; -b2; vec(F0)];
K.f = size(A1,1);
K.l = size(A2,1);
K.s = size(F0,1);
[x,y,info] = sedumi(Att,bt,ct,K);
y

最后得到的 y 即为最优解,它的前三个分量就是我们想要的答案。如下图所示:

YALMIP 一出,谁与争锋

我们从上面也可以看到,SeDuMi 的求解过程还是比较复杂的,不仅需要将优化问题先化成 SDP 的标准形式,而且参数的配置也相当费功夫,很不直观!在搜索 SeDuMi 的过程中,我又发现了一个叫 YALMIP 的工具箱,它的命名挺有意思,Yet Another LMI Package,又一个 LMI 包,呵呵,不过它可不是徒有虚名啊!简单的说,它可以非常直观的将目标函数和约束条件赋给它的核心函数 solvesdp(Constraint,Objective),下面我们就看看解决同样的问题 YALMIP 是怎么操作的,废话不说了,直接上 Matlab 代码:

1
2
3
4
5
6
7
8
9
10
11
12
13
t = sdpvar(1); % sdpvar声明变量
y = sdpvar(3,1,'full');
F0 = [2 -0.5 -0.6; -0.5 2 0.4; -0.6 0.4 3];
F1 = [0 1 0; 1 0 0; 0 0 0];
F2 = [0 0 1; 0 0 0; 1 0 0];
F3 = [0 0 0; 0 0 1; 0 1 0];
a = [sum(y)==1]; % 等式约束
b = [0.7<=y(1)<=1, 0<=y(2)<=0.3, y(3)>=0]; %不等式约束
c = [t*eye(3)-(F0 + y(1)*F1 + y(2)*F2 + y(3)*F3)>=0]; % LMI约束
obj = t;
constraint = [a,b,c];
solvesdp(constraint,obj);
double(y)

结果如下图所示:

可以看到两者的结果基本是一致的,当然,我怀疑 YALMIP 在操作的过程中有调用 SeDuMi 的可能性,但是不管怎么说,YALMIP 的代码则更直观,更容易理解,甚至连双向不等式都可以直接书写,这都是明显的,可见它的牛逼,所以必然果断抛弃其他一切优化工具箱,你的意见呢?嘿嘿~

P.S. 最近总是学术文章,我也有点受不鸟了~写这玩意累啊,歇着去了。。。