lesson

1

Scikit-learn应用指南:监督学习第2部分 -- 回归分析

课程简介

回归学习算法和分类学习算法都属于监督学习,两者的区别在于输出变量的类型,回归是定量输出(或者说是连续变量预测),分类是定性输出(或者说是离散变量预测)。回归学习算法应用十分广泛,比如预测房价、未来的天气情况等。本节将介绍如何用回归学习算法来预测一个连续值,以及如何进行评估等。

学习目标

lesson

2

Scikit-learn应用指南:监督学习第1部分 -- 分类

课程简介

分类就是确定所研究的对象属于哪一个类别,分类问题是一个普遍存在的问题。应用广泛,如根据电子邮件的内容判断是否属于垃圾邮件,根据星系的形状对它们进行分类等。本节将主要介绍分类学习算法如何进行分类,以及如何评估分类的效果等。

学习目标

lesson

3

Scikit-learn应用指南:训练数据与测试数据

课程简介

模型的泛化能力怎样,直接影响到模型在实际生产中的工作效果。我们对于算法学习中所用到的数据集的处理方法更是起着决定因素。为了提升模型的泛化能力,我们需要对数据集进行划分处理,即分成训练集和测试集。本节将介绍划分数据集的重要意义,以及怎样划分数据集,如何划分更好等等问题。

学习目标

lesson

4

Scikit-learn应用指南:数据的表示与可视化

课程简介

机器学习算法是一种在数据上进行分析,进而得出规律,并利用规律来对未知数据进行预测的算法。但是现实生活中的大多数数据并不能直接用于训练机器学习算法,我们需要将数据重新表示成机器学习系统能够理解的形式。本节将主要介绍如何将数据表示成可用于算法学习的形式,同时,也将介绍如何可视化数据集,以便我们了解数据集的情况。