Hello娃

Published on 2026-01-11 / 20 Visits

0

AI中概念整理 - 6

#ai

术语/词组	解释
Undirected Graphical Models	无向图模型：一种用图结构表示变量间概率关系模型。图中的边没有方向，表示变量间的双向依赖关系。也称为马尔可夫随机场。
Partition Function	配分函数：在概率模型中，为了使未归一化的概率分布 ˜p(x)成为一个总和为1的有效概率分布 p(x)而使用的归一化常数。其计算（对所有可能状态的求和或积分）通常是计算上难以处理的。
Unnormalized Probability Distribution	未归一化的概率分布：一个与概率成正比的函数 ˜p(x)，但其本身不是一个概率分布，因为它的积分或总和不为1。需要除以配分函数 Z 来归一化。
Gradient	梯度：一个向量，指向函数值增长最快的方向。在机器学习中，我们计算对数似然梯度以使用梯度下降法来更新模型参数。
Positive Phase	正相：对数似然梯度中的一个项 `∇θ log ˜p(x; θ)`。它倾向于增大训练数据（观测到的样本）的概率。
Negative Phase	负相：对数似然梯度中的另一个项 `∇θ log Z(θ)`。它倾向于降低从当前模型本身采样得到的样本的概率。这一项通常难以计算。
Contrastive Divergence	对比散度：一种训练算法，是随机最大似然的高效近似。它不需要将马尔可夫链运行至平稳分布，而是只运行有限的几步（如一步），从而大大加快训练速度。
Stochastic Maximum Likelihood	随机最大似然：使用蒙特卡洛采样（如MCMC）来近似负相梯度，进而进行最大似然估计的算法。
Markov Chains	马尔可夫链：一系列随机状态，每个状态的概率只依赖于前一个状态。在机器学习中，马尔可夫链蒙特卡洛方法用于从复杂概率分布中采样。
Burn in	预烧期：在MCMC采样中，从初始状态开始运行马尔可夫链，直到其状态分布接近目标平稳分布的过程。在预烧期之后采集的样本才被认为是有效的。
Stochastic Gradient Descent	随机梯度下降：一种优化算法，不是在整个数据集上计算梯度，而是在每个训练步骤中基于一小批数据计算梯度，从而加快大规模数据集的训练速度。

Comment