术语/词组 | 解释 |
|---|---|
Model capacity | 模型容量:模型拟合各种函数的能力,容量高的模型可能过拟合,容量低的可能欠拟合。 |
Regularizing features | 正则化特征:为防止过拟合而添加到模型中的约束或惩罚项。 |
Approximate inference | 近似推断:在模型中对无法精确计算的概率分布进行估计。 |
Objective functions | 目标函数:模型训练过程中需要优化(最小化或最大化)的函数,也称为损失函数或成本函数。 |
Error metric | 误差度量:用于量化模型性能的指标,如错误率。 |
End-to-end pipeline | 端到端流程:从原始数据输入到最终结果输出的完整处理系统。 |
Performance metrics | 性能指标:评估模型好坏的衡量标准。 |
Hyperparameters | 超参数:在训练开始前设置的参数,而不是通过训练学到的参数(如学习率、层数)。 |
True probability distribution | 真实概率分布:数据背后真实的、通常未知的分布规律。 |
Intrinsically stochastic | 本质上是随机的:系统本身具有内在的随机性。 |
Cost function | 成本函数:同目标函数,模型试图最小化的函数。 |
Accuracy / Error rate | 准确率 / 错误率:分类任务中正确/错误预测的样本比例。 |
Binary classifier | 二分类器:将数据点分为两类的模型。 |
Precision | 精确率:在所有被预测为正类的样本中,真正为正类的比例。 |
Recall | 召回率:在所有真正为正类的样本中,被正确预测为正类的比例。 |
PR curve (Precision-Recall curve) | PR曲线:以召回率为横轴,精确率为纵轴绘制的曲线,用于评估分类器在不同阈值下的性能。 |