微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

目标函数中双线性项的松弛 - 使用 CVXR 和 McCormick 包络

如何解决目标函数中双线性项的松弛 - 使用 CVXR 和 McCormick 包络

我有一个目标函数

objective function

有一些限制

constraints

我想最小化。

我想使用 R 包 CVXRMcCormick envelopes

让我们检查代码

library(CVXR)  # if necessary
x <- Variable(1)
y <- Variable(1)
w <- Variable(1)
objective <- Minimize(5*x^2 + 14*w + 10*y^2 -76*x -108*y +292)
constraints <- list(x >= 0,x <= 100,y >= 0,y <= 100,x+2*y <= 10,x+y <= 6,w >= 0,w >= 100*x + 100*y - 10000,# constraints according to McCormick envelopes
                    w <= 100*y,w <= 100*x)  # constraints according to McCormick envelopes
prob_OF <- Problem(objective,constraints)
solution_OF <- solve(prob_OF)
solution_OF$value
## -125.0667
solution_OF$getValue(x)                  
## 2.933333
solution_OF$getValue(y)
## 3.066667
solution_OF$getValue(w)
## 1.000135e-30

但遗憾的是,这里有一个缺点

  • x-value

    y-value

    的值只是近似值,因为 McCormick 是约束的放松。
  • 这些是真正的价值:
    • true_xy

为了克服这个缺点,您可以使用这个 approach (参见 josliber 的答案),您可以在其中拆分一个变量的间隔。像 josliber 一样,我在 x 变量上拆分...

在下面的部分中,我的问题出现了 - 但首先看看我的代码

library(CVXR)  # if necessary

# the two variables for the objective function
x <- Variable(1)
y <- Variable(1)

# five variables for w - substitute of the bilinear part 
w1 <- Variable(1)
w2 <- Variable(1)
w3 <- Variable(1)
w4 <- Variable(1)
w5 <- Variable(1)

# five boolean variables to kNow which range of the x-axis is used
z1 <- Variable(1,boolean=TRUE)
z2 <- Variable(1,boolean=TRUE)
z3 <- Variable(1,boolean=TRUE)
z4 <- Variable(1,boolean=TRUE)
z5 <- Variable(1,boolean=TRUE)

# objective function with the five linear substitutes for xy
objective <- Minimize(5*x^2 + 14*w1 + 14*w2 + 14*w3 + 14*w4 + 14*w5 + 10*y^2 -76*x -108*y +292)

# for convenience - to build up the constraints easier
x_Range=matrix(rep(seq(from=0,to=100,by=20),each=2)[-c(1,12)],nrow=2,byrow=FALSE)
##     [,1] [,2] [,3] [,4] [,5]
##[1,]    0   20   40   60   80
##[2,]   20   40   60   80  100
y_Range=matrix(c(0,100),1]
##[1,]    0
##[2,]  100

# FirsT alternative of the constraints
constraints <- list(x >= 0,## w1
                    w1 <= x_Range[2,1]*y + x1*y_Range[1,1] - x_Range[2,1]*y_Range[1,1]*z1,#w1 <= xU1*y + x1*yL - xU1*yL*z1,w1 <= x1*y_Range[2,1] + x_Range[1,1]*y - x_Range[1,1]*y_Range[2,#w1 <= x1*yU + xL1*y - xL1*yU*z1,x1 >= x_Range[1,x1 <= x_Range[2,#xL1*z1 <= x1 <= xU1*z1,## w2
                    w2 <= x_Range[2,2]*y + x2*y_Range[1,2]*y_Range[1,1]*z2,#w2 <= xU2*y + x2*yL - xU2*yL*z2,w2 <= x2*y_Range[2,2]*y - x_Range[1,2]*y_Range[2,#w2 <= x2*yU + xL2*y - xL2*yU*z2,x2 >= x_Range[1,2]*z2,x2 <= x_Range[2,#xL2*z2 <= x2 <= xU2*z2,## w3
                    w3 <= x_Range[2,3]*y + x3*y_Range[1,3]*y_Range[1,1]*z3,#w3 <= xU3*y + x3*yL - xU3*yL*z3,w3 <= x3*y_Range[2,3]*y - x_Range[1,3]*y_Range[2,#w3 <= x3*yU + xL3*y - xL3*yU*z3,x3 >= x_Range[1,3]*z3,x3 <= x_Range[2,#xL3*z3 <= x3 <= xU3*z3,## w4
                    w4 <= x_Range[2,4]*y + x4*y_Range[1,4]*y_Range[1,1]*z4,#w4 <= xU4*y + x4*yL - xU4*yL*z4,w4 <= x4*y_Range[2,4]*y - x_Range[1,4]*y_Range[2,#w4 <= x4*yU + xL4*y - xL4*yU*z4,x4 >= x_Range[1,4]*z4,x4 <= x_Range[2,#xL4*z4 <= x4 <= xU4*z4,## w5
                    w5 <= x_Range[2,5]*y + x5*y_Range[1,5]*y_Range[1,1]*z5,#w5 <= xU5*y + x5*yL - xU5*yL*z5,w5 <= x5*y_Range[2,5]*y - x_Range[1,5]*y_Range[2,#w5 <= x5*yU + xL5*y - xL5*yU*z5,x5 >= x_Range[1,5]*z5,x5 <= x_Range[2,5]*z5                            #xL5*z5 <= x5 <= xU5*z5
                    )

# SECOND alternative of the constraints
constraints <- list(x >= 0,## w1
                    w1 >= x_Range[1,1] - x_Range[1,#w1 >= xL1*y + x1*yL - xL1*yL*z1,w1 >= x_Range[2,1]*y + x1*y_Range[2,#w1 >= xU1*y + x1*yU - xU1*yU*z1,w1 <= x_Range[2,## w2
                    w2 >= x_Range[1,#w2 >= xL2*y + x2*yL - xL2*yL*z2,w2 >= x_Range[2,2]*y + x2*y_Range[2,#w2 >= xU2*y + x2*yU - xU2*yU*z2,w2 <= x_Range[2,## w3
                    w3 >= x_Range[1,#w3 >= xL3*y + x3*yL - xL3*yL*z3,w3 >= x_Range[2,3]*y + x3*y_Range[2,#w3 >= xU3*y + x3*yU - xU3*yU*z3,w3 <= x_Range[2,## w4
                    w4 >= x_Range[1,#w4 >= xL4*y + x4*yL - xL4*yL*z4,w4 >= x_Range[2,4]*y + x4*y_Range[2,#w4 >= xU4*y + x4*yU - xU4*yU*z4,w4 <= x_Range[2,## w5
                    w5 >= x_Range[1,#w5 >= xL5*y + x5*yL - xL5*yL*z5,w5 >= x_Range[2,5]*y + x5*y_Range[2,#w5 >= xU5*y + x5*yU - xU5*yU*z5,w5 <= x_Range[2,5]*z5                            #xL5*z5 <= x5 <= xU5*z5
                    )

# Now the final calculations
prob_OF <- Problem(objective,constraints)
solution_OF <- solve(prob_OF)

# results
### of FirsT constraint alternative
solution_OF$value
## NA
solution_OF$getValue(x1)
## NA
solution_OF$getValue(x2)
## NA
solution_OF$getValue(x3)
## NA
solution_OF$getValue(x4)
## NA
solution_OF$getValue(x5)
## NA

# results
### of SECOND constraint alternative
solution_OF$value
## 15.99776
solution_OF$getValue(x1)
## 4.206985
solution_OF$getValue(x2)
## 28.49989
solution_OF$getValue(x3)
## 49.34965
solution_OF$getValue(x4)
## 69.59733
solution_OF$getValue(x5)
## 89.71508

问题

  1. 为什么 josliber 只使用四个不等式中的两个?
    • 因此,我也尝试了代码中的第二个约束选项

enter image description here

  1. 你能帮我解决我的问题吗?!
    • 我想我必须使用第二个约束替代方案,但这里 solution_OF$getValue(x'ses) 的值太高以至于像 josliber 提到的总结它们不会让我得到预期的结果 { {1}}。
    • 在这两种选择中,都有两个约束 x=2x+2*y <= 10。由于我将 x 范围分成五个子部分,我必须转换它们吗?
  2. 是否也可以拆分多个变量?参考 josliberanswer

解决方法

我们可以使问题凸出:

https://analytics.example.com/track?utm_source=twitter&gclid=XXXXXX

这可以输入 CVXR 并使用任何 QP 求解器求解。 (当然,检查我的数学)。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。