Skip to content
techPark edited this page May 22, 2023 · 42 revisions

1.数智之魂
(一) 定义任务
有监督学习: y,离散值(如分类问题)或连续值(如回归问题)。
无监督学习: y,是聚类好坏的度量,如轮廓系数。

(二) 构建模型
y=model(x)
x,基础特征及衍生特征;model,如线性回归、xgboost,神经网络等

(三) 超参寻优
a. 损失函数loss:loss_function(y-pred, y-true)
b. 优化器:贝叶斯优化器、或元启发算法、或信赖域相关算法等

(四) 因果推理
方案1
基于因果图,借助前门法则、后门法则及do算子,计算因果效应。
方案2
基于潜在因果,借助随机对照试验及联合分布,计算因果效应。

(五)定值筛选
等同于优化,也即:
目标 min {f(x)}    约束 g(x)>=0
其中 f∈Ω, g∈w;Ω={f1, f2, ...}、w={g1, g2, ...}
举例:寻找f(x)=c,等价于f(x)-c=0,近似等价于min |f(x)|

(六)可解释性
方向1
局部线性假设,或特征加权等。
方向2
代理模型:如线性回归、决策树、图模型等。


2.协同元启发算法
MetaAlgoA <==协同机制==> MetaAlgoB
举例:
a. MetaAlgoA=粒子群算法,MetaAlgoB=灰狼算法。
b.协同机制,借鉴遗传算法原理,详情为:
i.变异算子--粒子(狼)一定概率突变为狼(粒子);
ii.重组算子--粒子(狼)为主,狼(粒子)为辅;粒子与狼不分伯仲,二重性。


3.贝叶斯优化器
随机初始化若干采样点,形成样本空间Ω
do
{
  在样本空间Ω 里,依据拟合函数进行最佳拟合
  通过最佳拟合函数,寻找下次若干最佳样点Points
  更新样本空间 Ω=Ω∪Points
} while(满足预设条件)


Clone this wiki locally