指数加权移动平均(Exponential Weighted Moving Average),简写为EMA。最近不知道干点啥,没有目标,所以想着先打好机器学习的基础吧,所以就简单的总结了一下基于梯度的一些优化算法,但是在看到Adadelta算法的时候,碰到了指数加权移动平均,感觉要理解这个算法,必须要理解EMA,所以在网上就抄袭了以下的内容。
为了理解下面的内容,我们先介绍一下什么是指数(妈呀这也能忘,今天高考完了,我这水平去参加高考,估计连二本都够呛了吧,23333~)。
指数是幂运算
EMA 简介
演化
算术平均(权重相等)—>加权平均(权重不等)—>移动平均(大约是只取最近的 N 次数据进行计算)—> 批量归一化(BN)及各种优化算法的基础。
EMA:是以指数式递减加权的移动平均,各数值的加权影响力随时间呈指数式递减,时间越靠近当前时刻的数据加权影响力越大。
公式及理解
当
在优化算法中,我们一般取
在优化算法中,我们一般取
EMA 偏差修正
在
解决方案:将所有时刻的 EMA 除以
EMA 的优点及其应用理解
EMA 的优点
它占用极少内存:计算指数加权平均数只占用单行数字的存储和内存,然后把最新数据代入公式,不断覆盖就可以了。
移动平均线能较好的反应时间序列的变化趋势,权重的大小不同起到的作用也是不同,时间比较久远的变量值的影响力相对较低,时间比较近的变量值的影响力相对较高。
EMA 在 Momentum 优化算法中应用的理解
假设每次梯度的值都是
假如,在某个时间段内一些参数的梯度方向与之前的不一致时,那么真实的参数更新幅度会变小;相反,若在某个时间段内的参数的梯度方向都一致,那么其真实的参数更新幅度会变大,起到加速收敛的作用。在迭代后期,由于随机噪声问题,经常会在收敛值附近震荡,动量法会起到减速作用,增加稳定性。
参考
Coursera:Exponentially-Weighted-Moving-Averages
指数
指数加权移动平均(Exponential Weighted Moving Average)
Related Issues not found
Please contact @zdaiot to initialize the comment