在大型網絡數據中心包含了許多多媒體信息資源,對于挖掘資源,提升資源利用率非常有幫助,本文提出一種模糊語義的大型web網絡數據中心資源高效挖掘技術,對資源信息流進行重建,利用泛華學習方法進行資源信息流模糊聚類分析,提取有益信息,完成數據迭代,實現資源優化挖掘。數據表明采用該方法進行大型Web網絡數據中心資源挖掘的準確性較好,資源調度的效率得到提高。
關鍵詞: Web網絡, 數據中心, 資源挖掘,多媒體信息,模糊語義
隨著網絡多媒體信息技術的發展,大量的多媒體資源信息以視頻、聲音和文本等形式存儲在大型Web網絡數據中心,用戶通過數據庫訪問和檢索方法,進行多媒體資源調度使用。對大型Web網絡數據庫的訪問建立在對數據中心資源的高效挖掘基礎上,通過挖掘網絡數據中心資源的關聯特征信息,結合數據信息融合和聚類方法,實現資源調度和優化分類,提高資源的使用效率。研究大型Web網絡數據中心資源高效挖掘技術,同樣在Web網絡數據庫的優化設計中具有重要意義,相關的數據挖掘方法研究受到人們的極大重視[1]。在大型Web網絡數據中心構架體系中,由于存儲構架體系的差異性以及數據之間的擾動,導致對資源的挖掘和調度的準確性不好,容易出現數據冗余。對此,本文提出基于模糊語義本體映射的大型Web網絡數據中心資源高效挖掘技術,并進行了仿真測試,得出有效性結論。
1 大型Web網絡數據中心資源分布結構模型
1.1 大型Web網絡數據中心資源的分布式結構構架
為了實現對大型Web網絡數據中心資源高效挖掘,首先分析數據中心資源的分布式結構模型,并進行資源信息流的時間序列擬合和多維信息特征重組。通過資源優化挖掘,提高大型Web網絡數據中心的訪問和調度能力[2]。在大型Web網絡數據中心中,數據庫的存儲節點通過分布式結構構建方式將資源存儲在大型Web數據庫中,數據庫采用云存儲構架模型進行數據讀取,將大型Web網絡數據中心資源數據進行二值圖模型構建,表示為。在數據挖掘中,對采集的資源數據進行信息分類,分類集合A,B,融合聚類中心滿足,。假設大型Web網絡數據中心的數據存儲模型為一個分布節點為,網絡數據中心訪問接口的信息融合中心函數滿足,令:
為資源信息分布的模糊概念集,在數據分塊中選擇k個實例集,建立資源數據挖掘的聚類目標函數為:
對聚類目標函數進行極值優化求解,得大型Web網絡數據中心資源挖掘模糊概念集為:
給定資源分布的4層量化信息結構模型[3],通過分布式結構構架,得大型Web網絡數據中心資源分布式的信息結構模型用二元擬合為:
在Web網絡數據中心資源的分布式結構構架模型中,進行信息融合和數據聚類處理,實現資源高效挖掘。
1.2 大型Web網絡數據中心資源信息流模型
在大型Web網絡數據中心的查詢向量集中通過查詢接口進行信息特征提取,構建大型Web網絡數據中心資源信息流模型,采用資源信息的文本塊學習器和實例學習器構建資源信息分布的本體模型為:
采用本體映射方法構建一個包含n個特征分類屬性的進行大型Web網絡數據中心數據庫語義映射關系,計算本體內元素之間語義相似度[4]。在資源存儲空間中采用決策信息融合方法,資源信息流分布貝葉斯粗糙集可寫為:
式中:是大型Web網絡數據中心資源的有限論域;為資源挖掘的客觀推理準則。構建資源信息流分布的信息函數,采用傅里葉變換進行時頻特征分解[5],過程為:
式中:為大型Web網絡數據中心的非平穩態特征值;為邊界域的時頻聯合分布;為分類特征參數;為置信增益函系數,在語義本體負域和邊界域內,得到大型Web網絡數據中心資源信息流的二值決策模型為:
在語義本體論域框架中,進行資源信息流模型擬合,為進行信息融合和資源挖掘提供識別框架內的冪集特征信息。
2 資源高效挖掘實現
在對大型Web網絡數據中心資源信息流進行信息流重建后,進行資源高效挖掘算法優化設計,提出基于模糊語義本體映射大型Web網絡數據中心資源高效挖掘技術,構建大型Web網絡數據中心大數據信息流時間序列分析模型[6],得網絡數據中心邊緣性狀態函數表示為:
式中:代表大型Web網絡數據中心錐形核分布狀態矢量;為一個核函數。采用特征量化分解方法進行資源信息重組,表達式為:
求得大型Web網絡數據中心多媒體資源流挖掘的最大梯度差[7]為:
式中:是資源信息語義指向性函數;m,n分別是大型Web網絡數據中心多媒體資源的維數和頻數。采用泛化學習方法進行資源信息流的模糊聚類處理[8],得到聚類中心矢量分布集合描述為:
式中:,表示大型Web網絡數據中心關聯規則分布概率密度函數;X,Y為原始資源信息的負載量;是關聯規則互信息函數。采用表示大型Web網絡數據中心資源特征分布互信息量,結合語義本體映射方法實現互信息特征提取,得到資源分布的區域密度函數為:
式中:和分別是兩組資源信息列分布的模糊聚類中心;表示資源信息流采樣的長度;表示歸一化區域分布密度。待挖掘的資源信息的關聯屬性為,結合語義本體映射方法實現互信息特征提取,得到特征提取結果為:
以提取的特征為訓練集,進行數據迭代,實現資源挖掘,迭代式為:
式中:為初始聚類參量;為大型Web網絡數據中心數據流樣本的特征維數。
3 仿真實驗與結果分析
為了測試本文算法在實現大型Web網絡數據中心資源挖掘中的性能,進行仿真實驗。實驗中,軟件工具采用Matlab 2010b,網絡數據中心數據庫采用Deep Web 200 GB,首先進行資源信息的原始數據采樣,資源信息流采集的長度為1 024,數據采樣的周期長T為0.04 s,實驗信噪比為-10 dB,信息聚類自適應初始步長選為μ0=0.001。根據仿真環境和參數設定,進行資源仿真分析,進行大型Web網絡數據中心資源信息流重建,重建時域波形所示。
對采集的資源信息進行泛化學習和模糊聚類,結合語義本體映射方法實現互信息特征提取,實現資源挖掘,得到挖掘的精度對比結果所示。分析得知,采用本文方法進行大型Web網絡數據中心的資源挖掘的精度較高,性能更優。
4 結 語
本文研究了大型Web網絡數據中心資源高效挖掘問題,提出基于模糊語義本體映射的大型Web網絡數據中心資源高效挖掘技術。通過實驗分析可知,采用本文方法進行資源挖掘準確定位性能較好,資源調度能力較強。
參考文獻:
[1] 何力,丁兆云,賈焰,等.大規模層次分類中的候選類別搜索[J].計算機學報,2014,37(1):41?49.
[2] 李永剛,張治中,李龍江.一種WLAN與eHRPD系統間負載均衡算法[J].微電子學與計算機,2017,34(1):44?47.
[3] 王亞強,湯銘,曾沁,等.級聯式低消耗大規模網頁分類在線獲取方法[J].計算機應用,2017,37(4):924?927.
[4] 潘穎,元昌安,李文敬,等.一種支持更新操作的數據空間訪問控制方法[J].電子與信息學報,2016,38(8):1935?1941.
[5] 郭明強,黃穎,謝忠.一種多核環境下的WebGIS模型優化策略[J].計算機工程,2013,39(8):15?19.
[6] 韓國輝,陳黎,梁時木,等.Na?ve Bayes分類器制導的專業網頁爬取算法[J].中文信息學報,2010,24(4):32?38.
相關閱讀:計算機安全發表論文版面費多少
論文指導 >
SCI期刊推薦 >
論文常見問題 >
SCI常見問題 >