优化基础
优化问题
Minimize f0(x)使fi(x)≤bi,i=1,2,…,m
带不等式约束的优化问题;
大部分机器学习的训练参数的过程都可以用一个优化问题来描述。
x=(x1,x2,…,xn)为优化变量
f0:Rn−>R目标函数
优化问题的应用
投资组合
- 变量:不同资产上的投资额
- 约束:预算,每份资产投资额(最大/最小)限制,最小收益值
- 目标:总风险值或投资回报方差
第一次华尔街革命标志性成果,马科维茨均方投资组合。
数据拟合
- 变量:模型参数
- 约束:先验知识、参数限制
- 目标:拟合或预测误差
全局最优问题
- 求解困难
但最小二乘/线性规划/凸优化问题都可以在理论上有最优解
无法找到最优解的,想办法近似成可以找到最优解的问题类型。
最小二乘:||Ax−b||22
求解最小二乘:解析解(ATA)−1ATb
使用最小二乘:判别/一些技术增加了灵活性
最小二乘的变体:加权与正则化
线性规划
Minimize:cTx,s.t.aTix≤bi
线性规划问题不如最小二乘问题容易判别
凸优化
Minimize f0(x)
目标函数和限制函数都是凸函数
最小二乘问题和线性规划问题实质上都是凸优化问题的特殊形式。
故优化课程的核心为 凸优化
凸优化问题的识别较困难
数据科学常见的凸优化问题
逻辑回归模型,在C类中的概率表示
决策变量x0和斜率向量xn
稀疏数据拟合
Minimize ||x||0=|j:xj¬0|
非0 分量的个数
NP-hard
用LASSO来近似求解(1范数的好的性质)
添加正则化项防止过拟合,其中0<p<1,μ>0是正则化参数
SVM:支持向量机
寻找到一个超平面进行类别的分割。
设施位置
Minimize ∑||y−cj||p
yj−xj=cj,||cj||≤θj,minimizeθj
图形实现与传感器网络定位
SDP:半定规划
产业互联网的发展
产业检测,产业过程的优化需要布置传感器,捕捉到线下传感的过程,故此涉及到了传感器定位的问题。
Mobile phone c.f. transistior