coding...
03
05
统计学part4 统计学part4
线性回归公式的推导如下图,平面上有一些点,然后我们想用一个直线来拟合它,就是找出最小化下面的那个平方误差的 m 和 b 我们将 SE 化简,然后对 m和b 求偏导 我们会得出在最优的拟合曲线上有两点 \((\overli
2019-03-05
03
GBDT算法 GBDT算法
前向分布算法AdaBoost 就是一种前向分布算法,可以认为Adaboost算法是“模型为加法模型、损失函数为指数函数、学习算法为前向分布算法”时的二类分类学习方法。 加法模型: 对于加法模型,在给定训练数据及损失函数L(y
2019-03-03
03
统计学part3 统计学part3
假设检验神经学家测试一种药物对反应时间的效果,分别对100只老鼠注射一单位剂量的药,已知没有注射药物的老鼠的平均反应时间为1.2s。100只被注射药物的老鼠的平均反应时间为1.05s,标准差是0.5s,我们想知道的是这个药对反应时间到
2019-03-03
01
随机森林算法 随机森林算法
集成学习集成学习通过构建并结合多个学习器来完成学习任务,通常获得比单一学习器更好的泛化性能,这针对弱学习器尤为明显 个体学习器个体学习器通常由一个现有的算法从训练数据产生,集成中若只包含同种类型的个体学习器,那么称之为同质集成,若包含
2019-03-01
01
统计学part2 统计学part2
中心极限定理我们可以从任何分布中取很多次样本均值(也不一定是均值,样本和也可以),将其画在图上会发现它趋近于一个正态分布 正偏态分布和负偏态分布: 正峰态分布和负峰态分布: 你会从图中发现,当样本容量从5增加到25时,得到的分
2019-03-01