机器学习 - 1.索引

前阵子李世石对战AlphaGo着实让深度学习火了一把,AlphaGo 4:1 赢了比赛,确实牛逼,再不学习学习就落伍了,开这篇博客写写学习笔记。

机器学习 or 深度学习

这两个是包含的关系,深度学习属于机器学习的更深入的研究。

学习的概念:针对经验E (experience) 和一系列的任务 T (tasks) 和一定表现的衡量 P,如果随之经验E的积累,针对定义好的任务T可以提高表现P,就说计算机具有学习能力。

基本概念

训练集,测试集,特征值,监督学习,非监督学习,半监督学习,分类,回归

  • 训练集(training set/data)/训练样例(training examples): 用来进行训练,也就是产生模型或者算法的数据集
  • 测试集(testing set/data)/测试样例(testing examples):用来专门进行测试已经学习好的模型或者算法的数据集
  • 特征向量(features/feature vector):属性的集合,通常用一个向量来表示,附属于一个实例
  • 标记(label): 实例类别的标记
  • 正例(positive example)
  • 反例(negative example)
  • 有监督学习(supervised learning):训练集有类别标记(class label)
  • 无监督学习(unsupervised learning):无类别标记(class label)
  • 半监督学习(semi-supervised learning):有类别标记的训练集 + 无标记的训练集
  • 分类(classification): 目标标记为类别型数据(category)
  • 回归(regression): 目标标记为连续性数值(continuous numeric value)

机器学习步骤框架

  1. 把数据拆分为训练集和测试集
  2. 用训练集和训练集的特征向量来训练算法
  3. 用学习来的算法运用在测试集上来评估算法 (可能要设计到调整参数(parameter tuning), 用验证集(validation set)

学习资料

Gavin Liu wechat
欢迎您扫一扫上面的二维码,订阅我的微信公众号!