了解机器学习第一步,知道算法与模型的区别

了解机器学习第一步,知道算法与模型的区别

机器学习涉及机器学习算法和模型的使用。对于初学者来说,这非常令人困惑,因为“机器学习算法”经常与“机器学习模型”互换使用。他们是同一件事还是不同事?

1、机器学习中的“算法”是什么

机器学习中的“算法”是在数据上运行以创建机器学习“模型”的过程。机器学习算法执行“模式识别”。算法从数据中“学习”,或者“适合”数据集。有许多机器学习算法。例如,我们有分类算法,例如k最近邻。我们有回归算法,例如线性回归,还有聚类算法,例如k均值。

机器学习算法的示例:线性回归、逻辑回归、决策树、人工神经网络、k最近邻居、k均值。

您可以将机器学习算法视为计算机科学中的任何其他算法。例如,您可能熟悉的其他一些类型的算法包括用于对数据进行排序的冒泡排序和用于搜索的最佳优先。因此,机器学习算法具有许多特性:可以使用数学和伪代码描述机器学习算法。可以分析和描述机器学习算法的效率。机器学习算法可以使用多种现代编程语言中的任何一种来实现。

例如,可能会在研究论文和教科书中看到使用伪代码或线性代数描述的机器学习算法。与其他特定算法相比,可能会看到特定机器学习算法的计算效率。

学术界可以设计出全新的机器学习算法,机器学习从业人员可以在他们的项目中使用标准的机器学习算法。就像计算机科学的其他领域一样,学者可以设计出全新的排序算法,程序员可以在其应用程序中使用标准排序算法。您还可能会看到多种机器学习算法一起实现,并在具有标准应用程序编程接口(API)的库中提供。一个流行的示例是scikit-learn库,该库提供了Python中许多分类,回归和集群机器学习算法的实现。

2、机器学习中的“模型”是什么

机器学习中的“模型”是在数据上运行的机器学习算法的输出。模型代表通过机器学习算法学习到的内容。该模型是在训练数据上运行机器学习算法后保存的“事物”,它表示规则,数字以及进行预测所需的任何其他特定于算法的数据结构。

一些示例可能使这一点更清楚:线性回归算法得出的模型由具有特定值的系数向量组成。决策树算法生成一个模型,该模型包含具有特定值的if-then语句树。神经网络/反向传播/梯度下降算法共同形成一个模型,该模型由具有矢量或权重矩阵且具有特定值的图形结构组成。

对于初学者而言,机器学习模型更具挑战性,因为与计算机科学中的其他算法没有明显的类比。例如,排序算法的排序列表输出实际上不是模型。最好的类比是将机器学习模型视为“程序”。机器学习模型“程序”包括数据和使用数据进行预测的过程。例如,考虑线性回归算法和结果模型。该模型由系数(数据)矢量组成,该系数矢量与作为输入的新数据行相乘并求和,以便进行预测(预测过程)。我们为机器学习模型保存数据以备后用。

我们经常将预测程序用于机器学习库提供的机器学习模型。有时,我们可能会在应用程序中自己实施预测程序。鉴于大多数预测程序都非常简单,所以这样做通常很简单。

3、算法与模型框架

因此,现在我们熟悉机器学习“算法”与机器学习“模型”。具体而言,对数据运行算法以创建模型。机器学习=>机器学习模型,我们还了解到,模型既包含数据,又包含如何使用数据对新数据进行预测的过程。如果愿意,您可以将该过程视为一种预测算法。

机器学习模型=模型数据+预测算法

这种划分对于理解各种算法非常有帮助。例如,大多数算法将所有工作都放在“算法”中,而“预测算法”的作用很小。通常,该算法是某种优化过程,可以最大程度地减少训练数据集上模型的误差(数据+预测算法)。线性回归算法就是一个很好的例子。它执行优化过程(或使用线性代数解析地求解),以找到使训练数据集的平方和误差最小化的一组权重。

了解机器学习第一步,知道算法与模型的区别

现在,机器学习的算法和模型之间的区别和关系您知道了吗?您又向前迈进了一步,继续努力吧!

展开阅读全文

页面更新:2024-04-09

标签:算法   模型   机器   神经网络   可能会   线性代数   矢量   示例   线性   系数   计算机科学   应用程序   区别   过程   程序   数据

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top