隨著科技的發展,我國的交通科技也在不斷發展中,目前國內外在交通檢測系統或交通信息采集系統中,大量應用了電磁傳感技術、超聲傳感技術、雷達探測技術、視頻檢測技術、計算機技術、通信技術等高新科學技術。本文是一篇研究生論文范文,主要論述了基于模糊時間序列的車輛檢測器數據修補方法研究。
摘 要:車輛檢測器是交通管理中重要的數據采集工具,但在實際運用過程中,數據丟失問題往往影響其作用的發揮。本研究旨在建立一個可實用于交通控制中心的車檢器缺失數據修補模型,嘗試以不同模型來預測并修補車輛檢測器缺失的數據,并對比各種模型的修補效果。文中提出了以ARIMA結合模糊時間序列的交通流量預測方法以及使用ARIMA進行短時間實時修補的方法,并獲得了不錯的效果。
關鍵詞:交通流量預測,ARIMA,模糊時間序列,車輛檢測器
0 引 言
車輛檢測器是交通管理者掌握道路交通運行狀況的重要工具。但是,在實際運用過程中,車輛檢測器常因環境、維護、性能等原因發生數據丟失的現象。車輛檢測器數據的丟失使得基于其所產生的控制和決策方案產生偏差甚至失效,無法彰顯投資車輛檢測器的應用價值。車檢器數據修補算法是輔助提高車檢器檢測穩定性與準確性的途徑之一。
本研究利用時間序列以及模糊時間序列的相關理論,根據交通流運行特征在工作日和假日的差異將車檢器數據分成工作日和假日兩種模式進行預測分析,使其能夠對短時間內缺失的數據進行及時修補。并對比時間序列以及模糊時間序列兩種方式進行數據修復的效果差異。
1 模型建立
數據為西安繞城高速單臺車檢器2014年全年數據,數據接收頻率為每5分鐘一次,理論上一天共288條數據記錄。
1.1 數據預處理
數據預處理分為如下幾項:
(1)首先將數據分為工作日和假日兩種模式,再分別以ARIMA、混合模式以及傳統平均法進行修補效率的比較。
(2)因車檢器數據常發生缺漏和異常值,本研究采用6sigma理論對數據進行離群值判定,即先計算同一模式(工作日、假日模式)下同一時刻流量均值,將平均值正負6倍標準差范圍外的流量數據判為異常值。
(3)本研究將進行ARIMA即時動態修補,以t-1時數據來預測t時的流量,持續驗證峰值1小時內12條記錄并計算絕對平均誤差(MAPE)。
(4)本研究所使用的ARIMA模型由SPSS18.0建立,模糊時間序列由Matlab編寫而成。
(5)模型以2/3的真實數據來建立(采用車檢器2014年1~9月數據,剩下10~12月數據用來驗證模式的準確性)。
1.2 ARIMA的建立
本研究使用SPSS18.0的ARIMA預測模型,將西安繞城高速車檢器2014年1月1日至8月31日的流量數據切分為工作日與假日兩種模式,具體研究步驟如下:
(1)利用自相關圖(ACF)來判斷是否為平穩數列。
(2)圖 1所示為工作日模式下交通流量的自相關圖,由圖可見,滯后階數為5時,才進入置信界內,表示流量數據并非為一個平穩的時間序列,需要對數據進行差分處理。
圖 2所示為假日模式下交通流量的自相關圖,在其滯后階數為7時才進入了置信界限內,數據亦需要差分處理。具體操作如下:
(1)使用SPSS18.0中的Expert Modeler選出最佳ARIMA(p,d,q)模型,工作日模式下的最佳ARIMA(p,d,q)模型為ARIMA(0,1,1),假日模式下的最佳模型是ARIMA(1,1,1)。
(2)檢查模型的R2與MAPE值是否能夠充分解釋變異數,BIC值是否最低并且殘差是否符合白噪聲的假設。
依照統計學的衡量標準,MAPE值小于20%時為優良的修補模型,而模型的BIC值則越小越好;R2表示模型的解釋程度,R2值越高則解釋變數的能力越高,表1所列為工作日模式的挑選準則,可以看出由Expert Modeler所得的模型四項準則皆為最優,比較的模型為符合殘差接收白噪聲假設的模型,其MAPE值為16.91%(越低越好),是三個模型里最好的,R2=0.938是最高的,代表可解釋變數的程度最高,BIC值越小表示模型為最佳估計模型,其BIC值=4.92為三個模型中最低。而表2所示為假日模式的挑選準則,同樣是由Expert Modeler挑選出最適模型為最優模型,ARIMA(1,1,1)各個適合度指標皆為最適,也都有符合殘差接收白噪聲,由此可知,可直接由Expert Modeler選取ARIMA的最適模型,不需要采用傳統的方式將所有模型進行測試。
將建立好的工作日與假日流量ARIMA模型,選擇輸出一個完整日的流量數據來進行實際驗證。工作日模式下ARIMA預測結果如圖3所示。假日模式下ARIMA預測結果如圖4所示。
1.3 結合模糊時間序列的ARIMA模型
首先建立一個將max-min簡化的模糊時間序列模型,以車檢器數據中9月1日17:00至19:00每5 min流量為例,預測一個小時的流量數據。示例流量數據表如表3所列。
(3)將時間分為24個子集合(A1、A2、…、A24)并計算各個集合的時間隸屬度。
(4)使用加權平均法進行去模糊化計算。
(5)將工作日模式與假日模式下的ARIMA預測值與模糊時間序列的計算結果進行對比。工作日模式下ARIMA的MAPE值為16.907%,而工作日模式下混合模型的MAPE值為13.248%,對比可知混合模型效果較好。基于差分平穩化方法,本研究先以ARIMA模型使其收斂,這樣能夠比單使用ARIMA模型的效果好,而假日混合模型的MAPE值為10.698%,同樣優于假日ARIMA模型的17.145%。可以發現假日模式的改善比工作日模式的改善幅度大,這種現象可以解釋為工作日的流量變化較大,為一個雙峰M型分布,而假日的流量圖形基本為一個單峰分配,變化不劇烈,較符合模糊時間序列的梯度函數形態。工作日混合模式的函數形態如圖5所示。假日混合模式的函數形態如圖6所示。 傳統平均法計算即當發生數據缺漏時,使用當前時刻前兩條數據的平均值進行修復。此方法計算簡單,但當數據缺失較多時且流量即將到達波峰或波谷時則無法反映出流量變化,僅能輸出一個接近平穩的序列。
隨機選擇數據,集中一天工作日與一天假日作平均法的計算,得到了工作日與假日的平均法MAPE值,結果如表4所示。
2 模型預測效果對比
未加入數據修正的ARIMA模型預測值如表5所列。由表 5可以發現,混合模型不管是在工作日流量或者是假日流量都表現的比ARIMA模型效果好,依據衡量標準,MAPE值小于20% 即為優良的修補模型,ARIMA模型與結合了ARIMA與模糊時間序列的混合模型皆為效果可接受的修補模型,與平均法比較,資料修補的效果都優于現在所使用的方法。
由圖可以發現,假日模式的改善比工作日模式的改善幅度大,是因為工作日的流量變化較大,為一個雙峰M型分布,而假日的流量圖基本為一個單峰分布,變化相對舒緩,較符合模糊時間序列的梯度函數形態。工作日模式綜合比較如圖7所示。假日模式綜合比較如圖8所示。
3 數據修補方法
3.1 以ARIMA模型進行實時修復
為使模擬情境能夠接近現實的缺失情況,本研究以西安繞城高速車檢器工作日的早高峰前一個小時與早高峰一小時內的流量數據作為修補范圍。表5利用前5條數據記錄模擬真實數據缺失情況,可以得知修補效果在10條記錄內為可接受范圍,在資料缺失比較數大于10條記錄時,其修補效果會大幅度下降。
3.2 以ARIMA模型混合歷史數據進行實時修補
實際驗證發現,如果以待修補時刻前5條歷史數據進行基于ARIMA的實時修補,會在第11條左右(即55 min前后)開始大幅衰退,以工作日的尖峰模擬找出可能的數據修復失效轉折點,所得結果如表6所列。
發現數據修復效能轉折點集中在10至12條數據左右,本研究利用此特點,嘗試使用不同權重加入歷史ARIMA的方式來修正ARIMA實時修補的誤差。具體做法為:第一條數據使用0.9×ARIMA實時預測值+0.1×歷史數據的ARIMA預測值;第二條數據使用0.8×ARIMA實時預測值+0.2×歷史資料的ARIMA預測值。以此類推,直到第十條數據記錄以后直接使用歷史數據的ARIMA來進行預測修補,如下式所示:
Pnew=w1×PARIMA+w2×PHitorical (1)
其中,w1為動態預測資料的權重;w2為歷史數據的權重。加入數據修正的ARIMA預測結果如表7所列。
4 分析與總結
研究以ARIMA(0,1,1)作為一個可接受的工作日流量修補模型,因其MAPE值小于20%,ARIMA(1,1,1)可以作為一個假日流量修補模型。研究結合了ARIMA以及模糊時間序列,提出一個新的混合模型,其數據預測效果在工作日流量修補或是假日流量修補中都比ARIMA和傳統平均法要好。
本研究試著使用建構好的ARIMA(0,1,1)工作日模型與使用歷史前5條數據提出一個即時數據修補模型,用一個相對簡單的方式進行實驗測試后,初步發現可以提升只使用了前5條數據的即時修補模型,利用逐步增加權重的方式加入以年歷史數據構建完成的ARIMA(0,1,1)工作日模型數據,為一個簡單可行的修補方法。
同時,本研究尚有些不盡完善之處:本研究僅以單一車輛檢測器來建立模型。后續研究可考慮以網絡或路段來討論修補問題,也可以考慮建立流量、速度與密度的三大交通流理論要素的修補模型。
5 結 語
本研究旨在建立一個可用于交通控制中心的數據修補模型,研究嘗試以不同模型來預測并修補車輛檢測器缺失數據,并對比各種模型的修補效果,提出了以ARIMA結合模糊時間序列的應用方法以及使用ARIMA進行短時間的實時修補,獲得了不錯的效果。
參考文獻
[1]韓超,宋蘇,王成紅.基于ARIMA模型的短時交通流實時自適應預測[J].系統仿真學報,2004,16(7):1530-1532,1535.
[2]張利,李星毅,施化吉.基于ARIMA模型的短時交通流量預測算法研究[J].鄭州輕工業學院學報(自然科學版),2008,23(4):89-92.
[3]竇慧麗,劉好德,吳志周,等.基于小波分析和ARIMA模型的交通流預測方法[J].同濟大學學報(自然科學版),2009,37(4):486-489,494.
[4]張慧.自適應模糊時間序列預測模型的研究[D].大連:大連海事大學,2012.
[5]周帥印.基于模糊時間序列的預測模型和方法研究[D].天津:天津大學,2012.
[6]董淑麗.模糊時間序列模型的改進算法研究[D].大連:大連理工大學,2013.
交通運輸論文投稿期刊推薦:《交通信息與安全》(雙月刊)創刊于1983年,由武漢理工大學、交通計算機應用信息網主辦。雜志緊密結合交通行業實際,刊載了交通行業在交通信息化建設、管理信息系統(MIS)、地理信息系統(GIS)、全球定位系統(GPS)、智能運輸系統(ITS)、計算機輔助設計(CAD)、電子數據交換(EDI)、企業網(Intranet)等領域計算機應用的學術論文、研究成果、經驗總結、專題講座等方面的大量文章,介紹了國內外計算機硬件、軟件技術的新成果、新產品、應用動態和發展趨勢。為指導、促進交通行業計算機應用的普及與提高作出了顯著成績。
論文指導 >
SCI期刊推薦 >
論文常見問題 >
SCI常見問題 >