Sklearn机器学习(二) 完整的机器学习项目
本文主要记录《Sklearn与TensorFlow 机器学习实用指南》中的理论知识拓展和实践问题中解决方案的总结 大纲1.项目概述 核心问题:利用街区组数据(人口、收入中位数、房价中位数等)预测任何街区的房价中位数 划分问题:划定问题类型,监督/非监督/强化学习,分类/回归,批量学习/线上学习,明显这是个监督(有标签)回归(预测值)批量学习(没有连续数据流入)问题 性能指标:回归问题典型的性能指标
本文主要记录《Sklearn与TensorFlow 机器学习实用指南》中的理论知识拓展和实践问题中解决方案的总结 大纲1.项目概述 核心问题:利用街区组数据(人口、收入中位数、房价中位数等)预测任何街区的房价中位数 划分问题:划定问题类型,监督/非监督/强化学习,分类/回归,批量学习/线上学习,明显这是个监督(有标签)回归(预测值)批量学习(没有连续数据流入)问题 性能指标:回归问题典型的性能指标
本文主要记录《Sklearn与TensorFlow 机器学习实用指南》中的理论知识拓展和实践问题中解决方案的总结 大纲机器学习概念机器学习是让计算机具有学习的能力,无需进行明确编程。 —— 亚瑟·萨缪尔,1959计算机程序利用经验 E 学习任务 T,性能是 P,如果针对任务 T 的性能 P 随着经验 E 不断增长,则称为机器学习。 —— 汤姆·米切尔,1997 机器学习特点 需要手工调整或者长串规
本文主要记录《机器学习实战》中的理论知识拓展和实践问题中解决方案的总结 大纲概念贝叶斯决策:若p1表示数据点属于类别1,p2表示数据点属于类别2,则比较p1p2,我们选择高概率对应的类别来决定数据点的类别,这就是贝叶斯决策理论条件概率:事先知道B,然后计算B中A的概率,则P(A|B)=P(AB)/P(B)贝叶斯准则(定理),是一种可以计算条件概率的方法,可以交换条件概率的条件与结果,即已知P(B|
本文主要记录《机器学习实战》中的理论知识拓展和实践问题中解决方案的总结 大纲 决策树基础概念 建立简单决策树 使用隐形眼镜(真实数据)建立决策树 概念分类树(决策树):是一种十分常用的监督学习分类方法。监督学习就是给定一堆样本,每个样本都有一组属性和一个类别,这些类别是事先确定的,那么通过学习得到一个决策树分类器,这个分类器能够对新出现的对象给出正确的分类。决策树选择哪一个特征作为分类标准是依据
本文主要记录《机器学习实战》中的理论知识拓展和实践问题中解决方案的总结 大纲 算法概念 简单数据集的KNN 约会数据集(实际数据)的KNN 手写识别数据集(测试集与预测集不同)的KNN 概念K最近邻(k-Nearest Neighbor,KNN)分类算法:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。通俗来讲就是基于已经分好类的
本文主要记录《机器学习实战》中的理论知识拓展和实践问题中解决方案的总结 大纲 Python基础入门 容器类型 控制结构 NumPy快速入门 Python基础入门1.容器类型12345678910111213141516171819//1.List列表:存放有序对象、可以容纳任何数据类型的容器list=[]list.append(1)list.append('nice hat')//2.Dic