出售本站【域名】【外链】

织梦CMS - 轻松建站从此开始!

微六博

当前位置: 微六博 > 物品清单 > 文章页

时序的平滑化和季节性分解

时间:2023-11-18 11:54来源: 作者:admin 点击: 149 次
1 时序的平滑化和季节性分解 对时序数据建立复杂模型之前也需要对其进行描述和可视化。在本节中,我们将对时序进行平滑化以探究其总体趋势,并对其进行分解以观察时序中是否存在季节性因素。 1.1 通过简单移动平均进行平滑处理 时序数据集中通常有很显著的随机或误差成分。为了辨明数据中的规律,我们总是希望能够

1 时序的滑腻化和节令性折成

对时序数据建设复纯模型之前也须要对其停行形容和可视化。正在原节中,咱们将对时序停行滑腻化以探索其总体趋势,并对其停行折成以不雅察看时序中能否存正在节令性因素。

1.1 通过简略挪动均匀停行滑腻办理

时序数据会合但凡有很显著的随机或误差成分。为了辨明数据中的轨则,咱们总是欲望能够撇开那些波动,画出一条滑腻直线。画出滑腻直线的最简略法子是简略挪动均匀。比如每个数据点都可用那一点和其前后两个点的均匀值来默示,那便是居中挪动均匀办理。

时序数据的第一步是画图。那里引见Nile数据集。那一数据集是埃及阿斯旺市正在1871年至1970年间所记录的尼罗河的年度流质R中有几多个函数都可以作简略挪动均匀,蕴含TTR包中的SMA()函数,zoo包中的rollmean()函数,forecast包中的ma()函数。那里咱们用R中自带的ma()函数来对Nile时序数据停行滑腻办理。

如下代码给出了时序数据的本始数据图,以及滑腻后的图(对应k=3715),生成的图像如下图所示

opar <- par(no.readonly=TRUE) par(mfrow=c(2,2)) #把画布分红2*2四个区域 ylim <- c(min(Nile), max(Nile)) #ylim()划分指定刻度的下限和上限 plot(Nile, main="Raw time series") plot(ma(Nile, 3), main="Simple Moving Averages (k=3)", ylim=ylim) plot(ma(Nile, 7), main="Simple Moving Averages (k=7)", ylim=ylim) plot(ma(Nile, 15), main="Simple Moving Averages (k=15)", ylim=ylim) par(opar)

结果阐明:图右上角画出了那一数据集的本始数据信息。从上图来看,数据总体呈下降趋势,但差异年份的改观很是大。

从图像来看,跟着k的删大,图像变得越来越滑腻。因而咱们须要找到最能画出数据中轨则的k,防行过滑腻大概欠滑腻。那里并无什么特其它科学真践来辅导k的选与,咱们只是须要先检验测验多个差异的k,再决议一个最好的k。从原例的图像来看,尼罗河的流质从1892年到1900年有鲜亮下降;其余的改观则其真不是太好解读,比如1941年到1961年水质仿佛略有回升,但那也可能只是一个随机波动。

1.2 节令性折成

应付间隔大于1的时序数据(即存正在节令性因子),咱们须要理解的就不只仅是总体趋势了。此时,咱们须要通过节令性折成协助咱们探索节令性波动以及总体趋势。

存正在节令性因素的光阳序列数据(如月度数据、季度数据等)可以被折成为趋势因子、节令性因子和随机因子。趋势因子(trend component)能捕捉到历久厘革;节令性因子(seasonal component)能捕捉到一年内的周期性厘革;而随机(误差)因子(irregular/error component)则能捕捉到这些不能被趋势或节令效应评释的厘革。

此时,可以通过相加模型,也可以通过相乘模型来折成数据。正在相加模型中,各类因子之和应就是对应的时序值,即:

此中时刻t的不雅视察值即那一时刻的趋势值、节令效应以及随机影响之和。

而相乘模型则将光阳序列默示为:(即趋势项、节令项和随机影响相乘)

那里通过一个小例子进一步注明相加模型取相乘模型的区别。如果咱们有一个时序,记录了10年来摩托车的月销质。正在可加模型中,11月和12月(圣诞节)的销质正常会删多500,而1月(正常是销售旺季)的销质则会减少200。此时节令性的波动质和其时的销质无关。正在相乘模型中,11月和12月的销质则会删多20%1月的销质减少10%,即节令性的波动质和其时的销质是成比例的。那也使得正在不少时候,相乘模型比相加模型更现真一些。

将时序折成为趋势项、节令项和随机项的罕用办法是用LOESS润滑作节令性折成。那可以通R中的stl()函数真现:

stl(ts, s.window=, t.window=)

#此中ts是将要折成的时序,参数s.window控制节令效应厘革的速度,t.window控制趋势项厘革的速度。较小的值意味着更快的厘革速度。令s.windows="periodic"可使得节令效应正在各年间都一样。那一函数中,参数tss.windows是必须供给的。

尽管stl()函数只能办理相加模型,但那也不算一个多重大的限制,因为相乘模型总可以通

过对数调动转换成相加模型:

log(Yt) = log(Trendt * Seasonalt * Irregulart) = log(Trendt) + log(Seasonalt) + log(Irregulart)

用颠终对数调动的序列拟折出的相加模型也总可以再转化回本始尺度。下面给出一个例子。

R中自带的AirPassengers序列形容了19491960年每个月国际航班的乘客(单位:千)。

序列图中的第一幅图。从图像来看,序列的波动跟着整体水平的删加而删加,即相乘模型更符折那个序列。

序列图中的第二幅图是颠终对数调动后的序列。那样序列的波动就不乱了下来,对数调动后的序列就可以用相加模型来拟折了。

stl()函数作节令性折成,代码如下:
查察数据集:

plot(AirPassengers) #查察数据集本始图像

lAirPassengers <- log(AirPassengers) plot(lAirPassengers, ylab="log(AirPassengers)") #画出与对数log之后的图像

fit <- stl(lAirPassengers, s.window="period") #折成光阳序列,用stl()函数作节令性折成,s.window="period"用于节令性折成提与 plot(fit) #画出节令性折成图

结果阐明:上图给出了19491960年的时序图、节令效应图、趋势图以及随机波动项。留心此时将节令效应限定为每年都一样(即设定s.window="period")。序列的趋势为枯燥删加,节令效应讲明夏季乘客数质更多(可能因为假期)。每个图的y轴尺度差异,因而咱们通过图中左侧的灰色长条来批示质级,即每个长条代表的质级一样。

fit$time.series #每个不雅视察值各折成项的值

# stl()函数返回的对象中有一项是time.series,它蕴含每个不雅视察值中的趋势、节令以及随机效应的详细构成。此时,间接用fit$time.series则返回对数调动后的时序,

exp(fit$time.series) #对每个不雅视察值各折成项的值与指数,将结果转化为本始尺度

结果阐明:不雅察看节令效应可发现,7月的乘客数删加了24%(即乘子为1.24),而11月的乘客数减少了20%(即乘子为0.8

咱们还可以通过两幅图来对节令折成停行可视化,即用R中自带的monthplot()函数和forecast包中的seasonplot()函数来画图:

opar <- par(no.readonly=TRUE) par(mfrow=c(2,1)) #把画布分红两个区域 library(forecast) monthplot(AirPassengers, xlab="", ylab="") #monthplot()函数绘制一个光阳序列的节令性(或其余)子序列,应付每个节令(或其余类别),都会绘制出一个光阳序列 seasonplot(AirPassengers, year.labels="TRUE", main="") #seasonplot()绘制节令图,那就像一个光阳图,只是数据是依据差异年份的节令来绘制的。 par(opar)

结果阐明:那是AirPassengers序列的月度图(上)和季度图(下),从两幅图中都可以看出总体的删加趋势以及相似的节令形式。第一幅图是月度图,默示的是每个月份构成的子序列(连贯所有1月的点、连贯所有2月的点,以此类推),以及每个子序列的均匀值。从那幅图来看,每个月的删加趋势的确是一致的。此外,咱们还可以看到7月和8月的乘客数质最多。第二幅图是节令图(season plot),那幅图以年份为子序列。从那幅图中咱们也可以不雅视察到同样的趋势性和节令效应。

(责任编辑:)
------分隔线----------------------------
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名:
发布者资料
查看详细资料 发送留言 加为好友 用户等级: 注册时间:2024-05-19 19:05 最后登录:2024-05-19 19:05
栏目列表
推荐内容
  • 假期第三天,预计各地近郊游、探亲流密集!交管局提示

    “五一 ”假期第二天,全国高速公路和国省道干线公路流量仍保持高位运行,广东、海南等地有较强降水,对道路交通安全畅通影响较大。各地公安交管部门针对假期出行特点和天...

  • 自驾准备什么东西?

    自驾准备:带好必备物品,让旅途更加顺畅 在自驾游之前,我们需要做好充分的准备工作,以确保旅途的顺利和安全。以下是自驾准备的必备物品: 三证一卡:除了带足钞票外,...

  • 广东自驾游三天哪里适合?

    自驾游是一种自助旅游的形式,与传统的集体参团旅游相比具有更多的自由和个性化。自驾游可以选择不同的目的地,途径不同的路线,给旅游者提供了更大的空间和选择性。 自驾...

  • “上海停车”App 问答

    1、问:请问晋级后的上海停车App取旧版相比有哪些厘革?新版的上海停车App有哪些亮点罪能? 答:全新打造的“上海停车”APP从界面、罪能、笼罩领域等多方面都...

  • 万豪国际集团精细化在华发展策略 以品牌+目的地布局呈现丰富宾客体验

    万豪国际集团精细化在华发展策略 以品牌+目的地布局呈现丰富宾客体验3月3日,万豪国际集团对外表示,目前万豪国际在近100个城市中已运营超过400家酒店,涵盖24...

  • 时序的平滑化和季节性分解

    1 时序的平滑化和季节性分解 对时序数据建立复杂模型之前也需要对其进行描述和可视化。在本节中,我们将对时序进行平滑化以探究其总体趋势,并对其进行分解以观察时序中...

  • 前进科技:招股说明书

    中国证监会和北京证券交易所对本次发行所作的任何决定或意见,均不表明其对注册申请文件及所披露信息的真实性、准确性、完整性作出保证,也不表明其...

  • 盘点:旅途中十大最实用的旅游商品

           《杭州印象》乌木扇精心选择以西湖为焦点,代表杭州回首转头回想转头的古建筑,正在扇骨上给取传统手工镂刻技法,精致典雅,含意隽永,下...

  • 基于多源地理大数据与机器学习的地铁乘客出行目的识别方法

    探索地铁乘客出行目的识别方法,有助于突破智能卡数据(Smart Card Data,SCD)在具体应用场景中的局限性,提升SCD在交通出行研究、交通发展规划等领...

  • 珈伟新能:募集说明书(申报稿)(2023年一季度财务数据更新版)(修订稿)

    声明本公司及全体董事、监事、高级管理人员承诺募集说明书及其他信息披露资料不存在任何虚假记载、误导性陈述或重大遗漏,并对其真实性、准确性及完整性承担相应的法律责任...