摘要:為解決現(xiàn)有公共建筑能耗預(yù)測中因數(shù)據(jù)量少、樣本維度高導(dǎo)致的精度低、誤差大問題,本文提出一種基于多元線性回歸(Multiple linear regression,MLR)與遺傳算法(Genetic algorithm,G A)優(yōu)化小波神經(jīng)網(wǎng)絡(luò)(Wavelet neural network,WNN)的建筑能耗預(yù)測模型。利用Pearson相關(guān)系數(shù)分析方法與多元線性回歸對歷史數(shù)據(jù)進行預(yù)處理,選取相關(guān)性強的因素用于GA-WNN模型的訓(xùn)練與測試,構(gòu)成MLR-GA-WNN建筑能耗預(yù)測模型,該模型精度達到了 96.4%。仿真結(jié)果表明,文中提出的方法不但預(yù)測精度優(yōu)于WNN、GA-WNN、GA-BP與GA-SVM模型,而且仿真運行時長、誤差也均小于上述四種模型,驗證了提出模型對于公共建筑能耗預(yù)測的可行性。
葉永雪; 馬鴻雁; 李晟延, 計算機仿真 發(fā)表時間:2021-09-15
關(guān)鍵詞:數(shù)據(jù)處理;多元線性回歸;遺傳算法;小波神經(jīng)網(wǎng)絡(luò);能耗預(yù)測
1 引言
隨著生活質(zhì)量的不斷提高,人們對公共建筑內(nèi)部環(huán)境的舒適度要求也不斷升高,導(dǎo)致城市中公共建筑的能耗占比呈一種逐年上升的趨勢。公共建筑單位面積能耗遠超農(nóng)村建筑單位面積能耗與城鎮(zhèn)建筑單位面積能耗,其能耗約為建筑總能耗的 39% [1]。因此,怎樣合理降低公共建筑能耗問題成為了研究里的重中之重。通過采集公共建筑能耗數(shù)據(jù)及其他因素后,建立相應(yīng)的能耗預(yù)測模型對其進行預(yù)測,可以為公共建筑實施能源管理與分配提供有效的依據(jù)。
目前,建筑能耗預(yù)測模型主要分為兩類,一類是基于熱力學(xué)計算的物理模型,另一類為基于機器學(xué)習(xí)的數(shù)據(jù)模型[2]。現(xiàn)有數(shù)據(jù)較為充足的情況下,多采用基于機器學(xué)習(xí)數(shù)據(jù)模型對建筑能耗進行預(yù)測。
申思等[3]利用改進熵權(quán)法與單一神經(jīng)網(wǎng)絡(luò)模型進行對比,證明了提出方法的有效性與可行性,但沒有與優(yōu)化模型如 GA-BP、GA-WNN 等進行對比,進一步驗證提出方法的優(yōu)勢。肖冉等[4]將能耗數(shù)據(jù)按季節(jié)性區(qū)分,利用網(wǎng)格搜索優(yōu)化支持向量機模型對辦公建筑進行逐時能耗預(yù)測;田亞清[5]利用遺傳算法的全局優(yōu)化搜索能力對小波神經(jīng)網(wǎng)絡(luò)進行優(yōu)化用于建筑能耗的預(yù)測,但對于應(yīng)用的數(shù)據(jù)樣本沒有進行預(yù)處理。
現(xiàn)有研究中主要存在以下幾個問題:以小波神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),將其擬合程度高、收斂能力強等優(yōu)勢應(yīng)用于其他領(lǐng)域[6-9]較多,而應(yīng)用到公共建筑能耗預(yù)測研究領(lǐng)域較少;現(xiàn)有的建筑物能耗預(yù)測研究中[10],需要應(yīng)用大量數(shù)據(jù)對模型進行訓(xùn)練,才能獲得較好的預(yù)測效果,若數(shù)據(jù)量較少[11],則難以保證預(yù)測精度;現(xiàn)有研究對于應(yīng)用的數(shù)據(jù)樣本沒有進行處理,造成了網(wǎng)絡(luò)模型輸入樣本維度高、仿真運行時間較長等問題。
對此,本文先利用 Pearson 相關(guān)系數(shù)分析方法與多元線性回歸對現(xiàn)有的逐日能耗數(shù)據(jù)樣本進行處理后;再利用遺傳算法優(yōu)化小波神經(jīng)網(wǎng)絡(luò),構(gòu)成 MLR-GA-WNN 模型對公共建筑能耗問題進行研究。
2 數(shù)據(jù)收集與處理
2.1 數(shù)據(jù)收集
實際能夠影響建筑物能耗的因素如圖 1 所示。
本文以北京市某高校圖書館為研究對象的原因有以下幾點:
(1)學(xué)校為了滿足學(xué)生們的學(xué)習(xí)需求,延長了圖書館的開放時間,造成高校圖書館能耗的不斷增加。
(2)圖書館內(nèi),溫度過高或過低都會導(dǎo)致部分同學(xué)頻繁開啟門窗,引起圖書館的電能消耗。
(3)高校圖書館在建立時過多的考慮了天氣狀況的影響,造成電氣設(shè)備預(yù)留量,空調(diào)設(shè)備會出現(xiàn)“大材小用”現(xiàn)象。
由于,高校圖書館的節(jié)能潛力較大,對該建筑能耗進行預(yù)測具有研究意義。
通過實際調(diào)研,獲得的數(shù)據(jù)樣本示例如表 1 所示。
2.2 數(shù)據(jù)預(yù)處理
2.2.1 Pearson 相關(guān)系數(shù)分析方法
常用的相關(guān)分析方法如圖 2 所示,其中 Spearman 相關(guān)系數(shù)與 Kendall 相關(guān)系數(shù)分析方法對于數(shù)據(jù)中存在著的數(shù)據(jù)錯誤值與極端值的反應(yīng)不敏感,常用于反應(yīng)變量間的單調(diào)關(guān)系,無法像 Pearson 相關(guān)系數(shù)分析方法去評估變量之間的線性關(guān)系。最終,選擇 Pearson 相關(guān)系數(shù)分析方法對現(xiàn)有數(shù)據(jù)進行分析。相關(guān)系數(shù)表示兩個變量之間關(guān)系[12],定義為:
式中,E 表示均值,D 表示方差,其中 D X D Y ( ) ( ) 表示標(biāo)準(zhǔn)差。Cov(X,Y)表示變量 X 與 Y 之間的協(xié)方差,相關(guān)系數(shù) PXY 為兩變量之間的協(xié)方差與兩變量的標(biāo)準(zhǔn)差的商,取值范圍為 [-1,1],其絕對值越大,表示相關(guān)性越強。
利用 SPSS22.0 軟件可以得到各變量間 Pearson 相關(guān)系數(shù)計算結(jié)果,結(jié)果如表 2 所示。
從表 2 中可以看出,因為逐日能耗與相對濕度的相關(guān)系數(shù)值為-0.014,且該 Sig 值為 0.325,表明相對濕度與建筑物能耗情況呈弱相關(guān),所以該氣象特征值對于能耗預(yù)測的結(jié)果影響不大。其他氣象因素的 Sig 值均小于 0.05,說明剩余因素參與建模均具有統(tǒng)計學(xué)意義,且與總耗電量具有顯著相關(guān)性關(guān)系。
綜上,去除相對濕度這一因素,不作為訓(xùn)練集參與能耗的預(yù)測。在原有的五維數(shù)據(jù)基礎(chǔ)上,利用 Pearson 相關(guān)系數(shù)分析方法,不僅可以降低數(shù)據(jù)樣本的維度,還可以減小各個因素間的相互影響。
2.2.2 多元線性回歸
在減少各因素間的相互影響后,對剩余因素利進行多元線性回歸擬合[13],軟件分析結(jié)果如表 3 所示。
通過分析表 3,可以得到的多元線性回歸預(yù)測模型為: 1 2 3 9089.30 33.53 31.84 503.47 Y Z Z X X X ? ?? ? ? (3) 式中:Y 為逐日總耗電量,單位 kWh;X1 為最高溫度,單位℃;X2為最低溫度,單位℃; X3 為日照時間,單位 h
通過 Pearson 相關(guān)系數(shù)分析方法與多元線性回歸的篩選,平均濕度與平均溫度為被排除變量,未被加入到預(yù)測模型中。將數(shù)據(jù)代入后發(fā)現(xiàn),多元線性回歸預(yù)測模型的預(yù)測效果不佳。但得到的公式(3)表明:三維數(shù)據(jù)的天氣因素足以代替原有數(shù)據(jù)作為后續(xù)機器學(xué)習(xí)方法的訓(xùn)練集與預(yù)測集,對公共建筑物進行能耗預(yù)測。
3. 遺傳算法優(yōu)化小波神經(jīng)網(wǎng)絡(luò)模型
3.1 遺傳算法
遺傳算法是基于自然界生物遺傳和進化特征而提出的方法,可以在復(fù)雜的計算中找到最優(yōu)的參數(shù)賦值。從本質(zhì)上來說,遺傳算法屬隨機算法中的一種,首先從具有代表性問題中存在解的集合中的一個種群開始,按照語言設(shè)定的進化方式和配比的適應(yīng)度函數(shù),進行不斷的遺傳進化和變異交叉,從參數(shù)的全局范圍內(nèi)找到最佳的參數(shù)。本文適應(yīng)度函數(shù)為: 1 1 ?? F E (4) 式中,E 為 WNN 的誤差函數(shù)。遺傳算法優(yōu)化小波神經(jīng)網(wǎng)絡(luò),可以幫助神經(jīng)網(wǎng)絡(luò)在初值上進行選取,并提高尋找最優(yōu)初值的速度和精度[14]。
3.2 小波神經(jīng)網(wǎng)絡(luò)
小波神經(jīng)網(wǎng)絡(luò)本質(zhì)上是利用小波基函數(shù)代替原有人工神經(jīng)網(wǎng)絡(luò)中的傳遞函數(shù)。隱含層小波神經(jīng)元采用 Morlet 小波函數(shù),其表達式為: 2 ?( ) cos(1.75 )exp( 0.5 ) x x x ? ? (5) 小波神經(jīng)網(wǎng)絡(luò)不僅結(jié)合了 BP 神經(jīng)網(wǎng)絡(luò)自適應(yīng)學(xué)習(xí)特點,還擁有著小波變換良好的時頻域特點。因此,小波神經(jīng)網(wǎng)絡(luò)具有學(xué)習(xí)能力強,較快的收斂性能力,以及較高精度的預(yù)測能力。
小波神經(jīng)網(wǎng)絡(luò)與 BP 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)類似,具備著輸入層,隱藏層,輸出層共計三部分。各層之間,通過權(quán)值參數(shù)來影響各神經(jīng)元的輸出,小波神經(jīng)網(wǎng)絡(luò)的物理層結(jié)構(gòu)如圖 3 所示。
4. 公共建筑能耗預(yù)測
4.1 模型介紹
圖4 為基于 MLR-GA-WNN的公共建筑能耗預(yù)測模型的流程圖,該流程圖主要由以下幾部分組成。
(1)數(shù)據(jù)處理:將獲取的數(shù)據(jù)先進行相關(guān)性分析判斷,排除與能耗數(shù)據(jù)相關(guān)性不強的因素后,對剩余影響因素進行多元線性回歸擬合后,將數(shù)據(jù)分為訓(xùn)練集與測試集。
(2)遺傳算法優(yōu)化:將訓(xùn)練集與測試集加入到遺傳算法進行訓(xùn)練,對初始值進行編碼,設(shè)定適應(yīng)度函數(shù)后,進行選擇、交叉變異等操作,在選取適合的網(wǎng)絡(luò)權(quán)值和伸縮平移尺度值后,替換小波神經(jīng)網(wǎng)絡(luò)中的原有值。
(3)小波神經(jīng)網(wǎng)絡(luò)的預(yù)測輸出:在構(gòu)建小波神經(jīng)網(wǎng)絡(luò)模型時,需要注意小波函數(shù)的選取以及偏導(dǎo)數(shù)。在獲取最佳的權(quán)值與伸縮平移尺度值后,通過對網(wǎng)絡(luò)模型的訓(xùn)練過程中的最大迭代次數(shù)和訓(xùn)練網(wǎng)絡(luò)的收斂誤差,來判斷訓(xùn)練過程是否需要結(jié)束,結(jié)束后會得到相應(yīng)的仿真結(jié)果。
4.2 能耗模型評價指標(biāo)
(1) 均 方 根 誤 差 (Root Mean Squared Error ,RMSE)
均方根誤差可以很好的反映出預(yù)測的精密度,其值越小越能反應(yīng)預(yù)測數(shù)據(jù)的精確性。其公式為: n 2 i 1 1 ( ) ? RMSE f Y Y ? ? ? i i n (9)
(2)平均預(yù)測精確度(AC)
用AC來表示平均預(yù)測精確度,預(yù)測精度是評價預(yù)測模型擬合的好壞程度的標(biāo)準(zhǔn)之一,在本文中由神經(jīng)網(wǎng)絡(luò)建筑能耗預(yù)測模型所產(chǎn)生的能耗預(yù)測值與實際能耗值擬合程度的優(yōu)劣。平均預(yù)測精確度是衡量該方法是否適用于預(yù)測對象的重要指標(biāo)。
式中:Yi為建筑能耗的實際值; Y 為網(wǎng)絡(luò)模型的預(yù)測值。
(3) 仿真運行時間
用T來表示仿真運行時長,輸入數(shù)據(jù)量的大小會直接影響仿真時間,不同算法在預(yù)測建筑物能耗時,結(jié)果有所不同,統(tǒng)計各模型的仿真運行時長。
綜上,在預(yù)測能耗建筑物能耗時應(yīng)選取平均預(yù)測精確度高,誤差小,運行時間較短的模型。
5. 模型參數(shù)設(shè)置及其結(jié)果分析
5.1 模型參數(shù)設(shè)置
對 WNN、GA-WNN、GA-BP、GA-SVM 與 MLR-GA-WNN 等模型參數(shù)進行配置。
WNN、GA-WNN、GA-BP 等參數(shù)設(shè)置如下:輸入節(jié)點個數(shù)為 5、輸出節(jié)點個數(shù)為 1、隱含層節(jié)點個數(shù)為 6;其中,WNN 與 GA-WNN 采用的小波函數(shù)為公式(3);迭代次數(shù)為 1000,學(xué)習(xí)概率為 0.01。
遺傳算法參數(shù)如下:個體數(shù)目為 80,代溝為 0.9,最大遺傳代數(shù)為 100。GA-SVM 神經(jīng)網(wǎng)絡(luò)參數(shù)設(shè)置如下:核函數(shù)參數(shù) g 選取范圍為 [0,1000]、懲罰系數(shù) c 選取范圍為[0,100]。
MLR-GA-WNN 的 輸 入 節(jié) 點 個 數(shù) 因 Pearson 相關(guān)系數(shù)分析法與多元線性回歸處理后為 3,輸出節(jié)點、隱含層節(jié)點、遺傳算法優(yōu)化等參數(shù)設(shè)置同其他模型設(shè)置參數(shù)。
5.2 公共建筑能耗預(yù)測結(jié)果
MLR-GA-WNN 公共建筑能耗預(yù)測結(jié)果如圖 5 所示。
圖 5 中,圓圈字符代表公共建筑物當(dāng)日實際能耗,星號字符為基于 MLR-GA-WNN 能耗預(yù)測模型的預(yù)測曲線。二者之間的預(yù)測誤差,呈百分比形式表示。如圖 6 所示。
在圖 6 中,星號字符代表著四月中下旬的預(yù) 測 誤 差 百 分 比 , 可 以 看 出 ,利用 MLR-GA-WNN 模型預(yù)測的公共建筑物能耗預(yù)測誤差均在 10%左右,說明預(yù)測的精度在 90% 以上。
5.3 仿真結(jié)果分析
通過1-4月所獲取的數(shù)據(jù),按照8:2的比例分為訓(xùn)練集以及測試集。從WNN、GA-WNN、 GA-BP、GA-SVM、MLR-GA-WNN預(yù)測模型隨機抽取四月中下旬的部分預(yù)測結(jié)果如表4所示。
通過分析表4發(fā)現(xiàn),不同的預(yù)測方法在預(yù)測同一天的建筑能耗時,預(yù)測結(jié)果不同。如較早出現(xiàn)的WNN神經(jīng)網(wǎng)絡(luò)模型,對于特定的時間或場合,其預(yù)測效果較好,但總體預(yù)測效果不佳。因此,利用提出的能耗模型評價標(biāo)準(zhǔn)對各模型進行計算,可以得到不同預(yù)測模型評價指標(biāo),如表5所示。
分析表 5 可知:
(1)單一模型 WNN 神經(jīng)網(wǎng)絡(luò)與優(yōu)化模型 GA-WNN 相比,預(yù)測精度相差 2%,用時縮短 0.6s。證明,利用遺傳算法對單一預(yù)測模型 WNN 進行優(yōu)化,可以提高預(yù)測精度,減小均方根誤差,但遺傳算法尋找最優(yōu)解的過程會增加運行時長。
(2) 優(yōu) 化 模 型 GA-WNN 、 GA-BP 與 GA-SVM 三種模型中遺傳算法的參數(shù)設(shè)置相同;其中,GA-WNN 的預(yù)測精度最低為 94.1%,與另外兩種模型預(yù)測精度相差不多,仿真運行時長最短為 3.5s。說明,GA-WNN 在調(diào)用小波函數(shù)時可以從數(shù)據(jù)之間尋找規(guī)律,獲得較好的預(yù)測精度并減少相應(yīng)的仿真運行時長。
(3)組合優(yōu)化模型 MLR-GA-WNN 整體預(yù)測平均精確度約為 96.4%,仿真運行時長為 2.5s,與 GA-WNN、GA-BP、GA-SVM 相比預(yù)測精度提高約 2%左右,仿真運行時長也得到了縮短;而與普通的WNN相比MLR-GA-WNN 整體預(yù)測的精度提高了約 4.3%,仿真運行時長縮短 0.5s。
結(jié)果表明,組合優(yōu)化模型與優(yōu)化模型相比,不僅可以提高預(yù)測精確度,還可以有效的減少仿真時常以及均方根誤差值,避免了神經(jīng)網(wǎng)絡(luò)易陷入局部最優(yōu)的問題。
6 結(jié)論
本文提出了基于多元線性回歸與遺傳算法優(yōu)化小波神經(jīng)網(wǎng)絡(luò)的公共建筑能耗預(yù)測模型,通過仿真研究,可以得出以下幾點結(jié)論:
(1)遺傳算法優(yōu)化后的模型與普通單一模型相比,可以提高模型的預(yù)測精度,但在尋找最優(yōu)解的過程中可能會增加仿真運行時長。
(2)通過運用 Pearson 相關(guān)系數(shù)分析方法與多元線性回歸對天氣因素數(shù)據(jù)進行降維處理,不但減小了變量間影響因素的相互影響,而且可以提高數(shù)據(jù)質(zhì)量,減少仿真運行時長。
(3) 將 經(jīng) 過 降 維 處 理 后 的 數(shù) 據(jù) 作 為 GA-WNN 神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練集與測試集,構(gòu)成 MLR-GA-WNN 模型,將其公共建筑能耗預(yù)測結(jié)果 與 優(yōu) 化 模 型 GA-WNN 、 GA-BP 、 GA-SVM 預(yù)測結(jié)果進行對比。
仿真結(jié)果表明,MLR-GA-WNN 模型與其他模型相比,不但預(yù)測效果更加準(zhǔn)確,可靠程度高,而且仿真運行時長較短,均方差更小。因此,本文提出的網(wǎng)絡(luò)模型可以有效的對公共建筑能耗進行預(yù)測。
論文指導(dǎo) >
SCI期刊推薦 >
論文常見問題 >
SCI常見問題 >