混沌時間序列是由非線性確定性系統(tǒng)產(chǎn)生的一種介于確定性與隨機性之間的非線性動力學(xué)現(xiàn)象. 它是有序與無序、確定性與隨機性的中間態(tài),宏觀上表現(xiàn)為無序無律的混亂運動以及對初值十分敏感的 “蝴蝶效應(yīng)”, 微觀上呈現(xiàn)無窮嵌套的幾何自相似性. 不同于隨機時間序列, 混沌時間序列具有短期的可預(yù)測性和長期的不可預(yù)測性 [1,2]. 混沌系統(tǒng)在現(xiàn)實生活中普遍存在, 近年來隨著人們對混沌理論研究的不斷深入, 它在許多實際系統(tǒng)中得以廣泛應(yīng)用, 如生物醫(yī)學(xué)、聲學(xué)、化學(xué)、通訊、交通、氣候天氣、電力負荷、財經(jīng)金融等. 因此, 混沌時間序列的建模和預(yù)測已成為混沌信號處理領(lǐng)域中一個非常重要的研究方向. 按照建模原理的不同,已有混沌時間序列的預(yù)測方法有多項式法 [3]、模糊理論法[4,5]、信息熵法[6]、回聲狀態(tài)網(wǎng)絡(luò)法[7,8]、支持向量機[9,10] 等. 其中基于結(jié)構(gòu)風(fēng)險最小化原則的支持向量機 (support vector machine, SVM)[11,12]因其在小樣本的情況下具有較好的泛化能力而備受關(guān)注. 用支持向量機來進行混沌時間序列的建模和預(yù)測是一種有效的手段, 其中的一個典型代表就是滑動窗 (sliding window, SW) 支持向量機 [13?15],其原理如圖1 所示.滑動窗支持向量機首先定義一個窗口長度 L,每次都是基于窗口內(nèi)的數(shù)據(jù) {(xi,yi)}i=n?L+1 來進行支持向量機的建模, 而窗口外面的數(shù)據(jù)則完全被拋棄. 這其實是一種遺忘機制, 也就是說窗口外面的數(shù)據(jù)被完全遺忘掉. 而當(dāng)有新的數(shù)據(jù) (xn+1,yn+1)要進來時, 將離當(dāng)前時刻最遠的數(shù)據(jù) (xn?L,yn?L)擠出窗口, 然后基于新窗口內(nèi)的數(shù)據(jù) {(xi,yi)}in=+n1?L對模型進行調(diào)整. 這種窗口更新機制的思想是離當(dāng)前時刻最遠的數(shù)據(jù)對下一個數(shù)據(jù)預(yù)測的影響比較小. 這種以時間作為衡量標(biāo)準(zhǔn)的窗口更新機制是有局限性, 如用離線學(xué)習(xí)方法進行混沌時間序列建模時, 在對當(dāng)前時刻數(shù)據(jù)進行預(yù)測時, 前一刻的數(shù)據(jù)并沒有用來建模, 而同樣可以取得比較好的預(yù)測效果. 這就說明離當(dāng)前時刻比較遠的數(shù)據(jù)對混沌時間序列模型的建立是有貢獻的, 并且這種貢獻并不一定比離當(dāng)前時刻比較近的數(shù)據(jù)差.拋棄. 這其實是一種遺忘機制, 也就是說窗口外面的數(shù)據(jù)被完全遺忘掉. 而當(dāng)有新的數(shù)據(jù) (xn+1,yn+1)要進來時, 將離當(dāng)前時刻最遠的數(shù)據(jù) (xn?L,yn?L)擠出窗口, 然后基于新窗口內(nèi)的數(shù)據(jù) {(xi,yi)}in=+n1?L對模型進行調(diào)整. 這種窗口更新機制的思想是離當(dāng)前時刻最遠的數(shù)據(jù)對下一個數(shù)據(jù)預(yù)測的影響比較小. 這種以時間作為衡量標(biāo)準(zhǔn)的窗口更新機制是有局限性, 如用離線學(xué)習(xí)方法進行混沌時間序列建模時, 在對當(dāng)前時刻數(shù)據(jù)進行預(yù)測時, 前一刻的數(shù)據(jù)并沒有用來建模, 而同樣可以取得比較好的預(yù)測效果. 這就說明離當(dāng)前時刻比較遠的數(shù)據(jù)對混沌時間序列模型的建立是有貢獻的, 并且這種貢獻并不一定比離當(dāng)前時刻比較近的數(shù)據(jù)差.因此, 本文結(jié)合最小二乘支持向量回歸機(least squares support vector regression, LSSVR)[16,17] 提出一種新的窗口更新機制, 即過濾窗(?ltering window, FW), 這種窗口更新機制 “過濾” 數(shù)據(jù)時并不是以時間作為衡量準(zhǔn)則, 而是以對混沌時間序列模型的貢獻大小來作為衡量準(zhǔn)則. 在這種機制里, 可以把窗口看成是一張 “網(wǎng)”, 一個個數(shù)據(jù)可以看成是一個個 “粒子”, “粒度” 的大小取決于數(shù)據(jù)對混沌時間序列模型的貢獻程度, 貢獻越大, “粒度” 也就越大,反之則越小. 不過這張 “網(wǎng)” 的網(wǎng)空是自適應(yīng)變化的, 目的是保持“網(wǎng)” 中“粒子” 的數(shù)目不變化. 剛落入 “網(wǎng)” 中的 “粒子” 是否能留在 “網(wǎng)” 中, 以及 “網(wǎng)” 中哪一個 “粒子” 將被漏掉, 完全取決于這些 “粒子” “粒度” 的大小. 這樣以來, 在具有相同窗口尺度 L 的情況下, 與滑動窗最小二乘支持向量回歸機(SW-LSSVR) 比較, 過濾窗最小二乘支持向量回歸機 (FW-LSSVR) 所建立的混沌時間序列模型具有更好的預(yù)測精度, 這也同時意味著在相同混沌時間序列模型預(yù)測精度的情況下, FW-LSSVR 需要的窗口長度 L 比較小, 其實時性自然較好. 另外, 即使在相同的窗口尺度下, FW-LSSVR 的模型更新速度也比SW-LSSVR 快, 即實時性也比較好. 最后, 用一些典型的混沌時間序列例子來驗證本文所提算法在混沌時間序列建模和預(yù)測中的有效性和可行性.無論對算法 SW-LSSVR, 還是對 FW-LSSVR, RMSE 都隨著窗口長度 L 的增加而逐漸減小, 最后趨于穩(wěn)定而幾乎接近相等, 也就是說混沌時間序列預(yù)測的精度隨著窗口長度 L 的增加而逐漸提高, 最后這兩種算法的預(yù)測精度幾乎相等. 可是, 相比較而言, FW-LSSVR 預(yù)測產(chǎn)生的 RMSE 隨窗口長度 L的增加要減少得更快. 換句話說, FW-LSSVR 以更快的速度接近穩(wěn)定. 這就會產(chǎn)生要達到相同的預(yù)測精度, FW-LSSVR 需要較短的窗口長度 L, 也就意味著需要較少的 “粒子”, 而較少的 “粒子” 往往寓意著較短的時間, 較好的實時性. 同時, 這也說明了過濾窗口 “過濾粒子” 的有效性. 圖 3 給出了在預(yù)測完 1000 個樣本后, 過濾窗中 “粒子” 的狀態(tài).從圖3 可以看出, 對于混沌時間序列Kawakami來說, 過濾窗中的 “粒子” 大部分集中在前半部分;對于 Heron 來說, 過濾窗中的 “粒子” 分布比較均勻 (其他混沌時間序列不是像 Kawakami 就是像Heron, 沒有過濾窗中大部分 “粒子” 都集中在后面的情況, 在此予以省略). 無論是哪一種, 過濾窗中的 “粒子” 隨著時間的推移更新頻率都比較低, 這就是 FW-LSSVR 的計算代價比 SW-LSSVR 低的一個重要原因. 由圖 3 可知, 過濾窗中大部分 “粒子” 都分布在極值點, 也就是靠近圖形的兩邊, 這與支持向量機中支持向量的分布類似 [7], 也就是說 FS-LSSVR 把比較重要的 “粒子” 留在了窗口當(dāng)中, 證明了過濾窗口過濾 “粒子” 的有效性. 另外, 從圖 3中還可以看出, 位于圖形中部過濾窗口中的 “粒子” 大部分集中在前面, 這主要是因為后面位于中間部分的粒子由于和前面中間部分的 “粒子” 相似而不能進入到過濾窗中, 這就減輕了過濾窗的更新頻率,從表 1 可以看出, 對同一個混沌時間序列, 當(dāng)預(yù)測精度即RMSE 趨于穩(wěn)定時, FW-LSSVR 需要較短的窗口長度, 也就預(yù)示著 FW-LSSVR 需要較短的預(yù)測時間, 這一點可以從表 1 中每一個混沌時間序列實驗的第一行和第三行看出來. 在預(yù)測精度幾乎相同的情況下, 其預(yù)測誤差情況如圖 4 所示.從圖 4 可以看出, 在預(yù)測精度幾乎相等的情況下, FW-LSSVR 需要較少的 “粒子”. 另外, 還可以從圖4 中看出, 在開始階段預(yù)測誤差較大, 而隨著時間序列的推移, 精度趨于穩(wěn)定. 這主要是因為, 在開始階段, 算法剛剛啟動, 窗口的長度不夠, 算法沒有足夠滑動窗在滑動的過程中, 只是簡單地將最遠的數(shù)據(jù)給拋棄掉, 將最近的數(shù)據(jù)移入窗口. 而在建模的過程中, 最遠的數(shù)據(jù)對模型的貢獻程度并不一定比最近的差. 滑動窗這種將最遠的數(shù)據(jù)給拋棄掉的做法存在不妥之處. 然而, 過濾窗口則不同, 它就像是張 “網(wǎng)”, 每一個數(shù)據(jù)就是一個 “粒子”, 同時給每一個 “粒子” 定義一個 “粒度”, 根據(jù) “粒度” 的大小決定哪些 “粒子” 將留在 “網(wǎng)” 中, 哪個 “粒子” 將被的學(xué)習(xí)能力而導(dǎo)致預(yù)測誤差較大, 而隨著窗口長度的增長, 預(yù)測誤差逐漸減小. 當(dāng)窗口長度增長到某一個值時, 預(yù)測精度趨于穩(wěn)定, 就不需要增長窗口長度了, 若繼續(xù)增長, 只會增添算法的計算量, 影響其實時性. 在和 FW-LSSVR 窗口長度相等的情況下, SW-LSSVR 的預(yù)測誤差如圖 5 所示. 從圖 5 可以看出, 在窗口長度相同的情況, SW-LSSVR 的預(yù)測誤差較大, 這一點也可以從表 1 中得到印證. 同時, 這也說明了滑動窗口策略存在的缺陷, 而過濾窗口是有效的.遺漏. 新來的 “粒子” 能否留在 “網(wǎng)” 中就看其 “粒度” 的大小, 而不是看時間的遠近. 而 “粒度” 就是根據(jù) “粒子” 對模型的貢獻程度來定義的, 這樣選擇出來的“粒子” 自然對模型的貢獻程度比較大, 過濾窗口這種淘汰機制自然也要比滑動窗口簡單的遺忘機制要好. 因而, 與滑動窗最小二乘支持向量回歸機相比較, 過濾窗最小二乘支持向量機具有較好的實時性和較高的精度.