机器学习（三）机器学习简介

Machine Learning（T. Mitchell 著，1997 年出版）一书中给出了机器学习经典、通用的定义：

假设用 P 来评估计算机程序在某任务类 T 上的性能，若一个程序利用经验 E 在任务 T 上获得了性能改善，则我们就说关于 T 和 P, 该程序对 E 进行了学习。

在不同的问题设定下，T、P、E 可能指完全不同的东西。机器学习中一些流行的任务 T 包括：

分类：基于特征将实例分为某一类。
回归：基于实例的其他特征预测该实例的数值型目标特征。
聚类：基于实例的特征实现实例的分组，从而让组内成员比组间成员更为相似。
异常检测：寻找与其他样本或组内实例有很大区别的实例。
其他更多任务

关于经验 E，《Deep Learning》（Ian Goodfellow、Yoshua Bengio、Aaron Courville 著，2016 年出版）的「Machine Learning basics」一章提供了一份很好的综述：

经验 E 指的是数据（没有数据我们什么也干不了）。根据训练方式，机器学习算法可以分为监督（supervised）和无监督（unsupervised）两类。无监督学习需要训练含有很多特征的数据集，然后学习出这个数据集上有用的结构性质。而监督学习的数据集除了含有很多特征外，它的每个样本都要有一个标签（label）或目标（target）。

示例

分类和回归属于监督学习问题。例如，作为信贷机构，我们可能希望根据客户累积的数据预测贷款违约情况。在这里，经验 E 是已有的训练数据，即实例（客户）的集合，一组特征（例如年龄、薪水、贷款类型、以往违约记录等），一个目标变量（他们是否会违约）。由于需要预测的目标变量是「他们是否会违约」，所以这是一个二元分类问题。如果你转而预测贷款会超期多久，那么需要预测的目标变量变成了一个连续值（时间），这就成为一个回归问题了。

最后，关于算法表现的评估度量 P。不同问题和算法的度量不同，当学习新算法时，我们将讨论这一点。就目前而言，本次实验将使用分类算法中的一个简单度量标准，即准确率（Accuracy）。

决策树

决策树是分类与回归问题中常用的方法之一。其实不仅是机器学习领域，在每天的日常决策中，我们都在使用决策树。流程图实际上就是决策树的可视化表示

机器学习（三）机器学习简介

PHP（3）控制结构，函数，对象

java异常处理

python3 numpy学习之Pandas工具（六）

python自制简易浏览器

机器学习（四）构建决策树

java与数据库的连接

使用python与人工智能破解图片验证码

python图片转字符画

必须收藏的一张图

python实现简单服务器（一）

机器学习（二）数据可视化分析

python实现简单服务器（二）

python基于共现网络文本提取人物关系

python3 numpy学习之Pandas工具（五）

正则表达式简单介绍

机器学习（四）构建决策树

java与数据库的连接

机器学习（二）数据可视化分析

PHP基础语法（二）变量与运算符

PHP语法基础（一）标记及其数据类型

机器学习（一）使用pandas进行数据探索

算法实战——字符串问题（四）

算法实战——字符串（二）

算法实战——字符串问题（三）

算法实战——字符串问题（一）