coding...
西瓜书笔记——第八章 集成学习 西瓜书笔记——第八章 集成学习
8.1 个体与集成集成学习(ensemble learning)通过构建并结合多个学习器来完成学习任务集成学习一般结构:先产生一组个体学习器(individual learner),再用某种策略将它们结合起来同质集成:只包含同种类型的个
2018-03-12
西瓜书笔记——第七章 贝叶斯分类器 西瓜书笔记——第七章 贝叶斯分类器
7.1 贝叶斯决策论贝叶斯决策论(Bayesian decision theory)是概率框架下实施决策的基本方法机器学习所要实现的是基于有限的训练样本尽可能准确地估计出后验概率\(P(c \ | \ \vec{x}) \) 判别式
2018-03-11
西瓜书笔记——第六章 支持向量机 西瓜书笔记——第六章 支持向量机
6.1 间隔与支持向量考虑下列问题,如果能将训练样本分开的超平面有很多,如何选择最优超平面? 直观上看,应该寻找位于两类训练样本正中间的划分超平面,在样本空间中,划分超平面可用如下线性方程表示:$$\vec{w}^T\vec{x}+
2018-03-09
西瓜书笔记——第五章 神经网络 西瓜书笔记——第五章 神经网络
5.1 神经元模型神经网络是由具有适应性得简单单元组成的广泛并行互连的网络,它的组织能够模拟生物神经系统对真实世界物体所作出的交互反应神经网络最基本的成分是神经元(neuron)模型 常见的激活函数有:阶跃函数,sigmoid函数
2018-03-07
西瓜书笔记——第四章 决策树 西瓜书笔记——第四章 决策树
4.1 基本流程决策树是基于树结构来进行决策的,这恰是人类在面临决策问题时一种很自然的处理机制 一棵树包含一个根节点,若干个内部节点和若干个叶节点,叶节点对应决策结果,其他节点对应一个属性测试 决策树是一个递归过程,有三种情况导致递归
2018-03-06
西瓜书笔记——第三章 线性模型 西瓜书笔记——第三章 线性模型
3.1 基本形式给定由 d 个属性描述的示例 \(\vec{x} \)=\( (x_1;x_2;…;x_d) \), 其中 \(x_i \)是 \(\vec{x} \)在第 i 个属性上的取值线性模型(linear model)试图学得
2018-03-06
西瓜书笔记——第二章 模型评估与选择 西瓜书笔记——第二章 模型评估与选择
2.1 经验误差与过拟合错误率,精度训练误差,泛化误差过拟合,欠拟合过拟合是无法避免的,我们只能尽量缓解模型选择 2.2 评估方法通过测试集上的测试误差作为泛化误差的近似,测试集应尽可能与训练集相斥 2.2.1 留出法留出法(
2018-03-05
西瓜书笔记——第一章 绪论 西瓜书笔记——第一章 绪论
1.1 引言 1.2 基本术语数据集,属性,特征标记空间分类,回归聚类,簇:了解数据内在规律监督学习(分类,回归),无监督学习(聚类)泛化能力通常假设样本空间全体样本服从一个未知分布 \(\mathcal{D} \),获得的每一个样本
2018-03-05
我关于SVM的一点理解 我关于SVM的一点理解
我关于SVM的一点理解前言最近两天因为要用到SVM所以比较深入的了解了一下这个算法,查阅了很多资料,发现很多大牛的作品,比如pluskid的支持向量机系列(听说他后来去了MIT),还有邵正将的SVM系列,台大林轩田老师的机器学习基石(
2017-11-27
logistic回归建立病例预测模型 logistic回归建立病例预测模型
logistic回归预建立病例预测模型 用logistic 回归拟合病例data之前用的深度学习的方法建立预测模型,现在用机器学习的方法来建立模型,首先想到的就是线性模型,可以用logistic回归来训练模型 关于logistic回归的
2017-11-23
Statistical learning--the settings and estimators object Statistical learning--the settings and estimators object
一些设置和预测器对象 from sklearn import datasets iris = datasets.load_iris() data = iris.data data.shape #150 个 observations
2017-08-11
Supervised learning Supervised learning
监督学习 All supervised estimators in scikit-learn implement a fit(X,y) method and a predict(X) method to predict unlabele
2017-08-11
2 / 3