19.4K
7233
泛化能力
在计算机系统中,“经验”通常以数据的形式存在,因此机器学习所研究的主要内容是通过这些数据产生“模型”(model)。从数据产生模型的过程我们称之为“训练”(training),训练过程中使用的数据称为“训练数据”。我们训练得到模型后需要对模型进行评估。我们通常把分类错误的样本数占总数的比例称为“错误率”(error rate)。更一般的,我们把模型实际预测的输出与真实的输出之间的差异称之为“误差”(error)。机器学习的目标是使得训练出的模型很好的适用于未见样本。训练出的模型适用于新样本的能力,称为“泛化能力”(generalization ability)。具有较强泛化能力的模型不仅在训练数据上有好的表现,还能够很好的适用于整个样本空间。通常我们假设所有的样本都服从一个未知的分布,我们的训练数据中每个样本都是从这个分布上独立的采集的,即“独立同分布”(independent and identically distributed)。一般来说,训练数据越多,我们可以得到的关于这个分布的信息越多,也就越有可能通过训练得到具有较强泛化能力的模型。
7233
免责声明:本站词条系由网友创建、编辑和维护,内容仅供参考。
以上内容均为商业内容展示,仅供参考,不具备专业问题解决服务,
如果您需要解决具体问题(尤其在法律、医学等领域),建议您咨询相关领域的专业人士。
如您发现词条内容涉嫌侵权,请通过 948026894@qq.com 与我们联系进行删除处理!
上一篇:狲尚香
下一篇:媒体发布平台 一秒推