2021-4-9 | 證券市場論文
信息是個很抽象很寬泛的概念,很難用一個簡單的定義將其完全準確把握[1].平日我們所指的信息量的大小,一般很難得到一個確定的量化數值;而在證券市場中,股民大多數是利用自己所掌握的信息來判斷何種證券值得持有、持有的時間要多久、何時進場何時出場?然而,股民所掌握的信息到底是個什么樣子?信息量越大越好嗎?怎么才能判斷這種信息的價值呢?然而,一個概率分布可以被定義成一個“熵”的量,它具有許多特性符合度量信息的直觀要求,因此,筆者就以上問題做出量化解答,并就此構建信息熵的技術指標.
筆者以上證指數000001的交易時間、開盤、最高、最低、收盤、成交量、成交額、漲數、跌數、持倉量、分筆、開盤量、開盤額數據為信息構建信息熵指標,選取數據為1991年5月13日至2012年3月22日這20年的日線數據;之所以沒有選取1991年5月13日之前的數據,是因為在此時間之前的數據有些是不完整且不穩定的,不能體現出信息熵計算的穩定性和可信度.
1信息熵
1948年,Shannon借鑒了熱力學的概念,將信息中排除了冗余后的平均信息量稱為“信息熵”[2],并給出了計算信息熵的數學表達式.對于1個隨機的離散變量,可能有n個取值,每個取值所對應的概率分別為12,,,,,inpppp,則其信息熵可表述為下式:對于變量的概率值而言,其值越大,其不確定性越大,信息熵也越大,意味著想要更好地確定其具體情況,所需要的信息量就越大,計算所得的信息熵也就越大.而當121,0inp=p=p==p=時,這個隨機變量就被確定,其信息熵最小為0.然而,證券市場的價格走勢是不斷變化的,體現的信息熵值也隨之不斷變化,因此,我們只憑大盤K線的走勢是很難判斷下一個周期價格是漲還是跌[3].所以,提取出所需要的信息,并計算得到1個適合價格分析的指標就尤為重要,而此時的信息熵指標就能很好地表現出股市價格走勢和市場特點.
2指標模型建立過程[4]
(1)選取數據源.將數據源中的每Circel個交易日作為1個時間周期單位(文中Circel為15),共分為m組數據(文中m為326),將每列數據(開盤價、最高價等)作為1個小組數據計算信息熵值,表1為數據的分組列表示意形式,因原數據眾多,因此只列示選取的第1個數據格式,其余格式均相同.
(2)選取每個小組數據第2天數值減去前1天數值,得到相應差值,計算公式如下:ChaZhi=data(i+1)data(i),(2)其中,data(i),data(i+1)分別表示前1天和第2天數值數據.
(3)根據計算之后的ChaZhi,統計出大于、小于和等于零的ChaZhi個數n(ChaZhi>,<,=0)各為多少,計算其值所占的比重(即為概率),計算公式如下:(,,0)(,,0)nChaZhipChaZhiCircel><=><==.(3)
(4)在信息熵值計算中,由于log(0)是無意義的,所以,p(ChaZhi>,<,=0)=0時,將其值改為-10p(ChaZhi>,<,=0)=10,可計算-10-10(10)log(10)∝0,所以不會影響熵值計算.p(ChaZhi>,<,=0)可簡寫為p(C>,<,=0),信息熵計算公式如下:[((0))log((0))mH=pC>pC>+(p(C<0))log(p(C<0))+(p(C=0))log(p(C=0))].
(5)計算每個周期Circel交易日的總信息熵值的公式為:1CircelmimmHH==∑.(6)計算m組數據總信息熵值的公式為:1mmiiHH==∑.(4)
(7)由于計算得到的信息熵值序列是一個噪音相當大的數值序列,因此,筆者采用小波分析降噪的方法將其主要趨勢序列進行提取[5-6],其信息熵原始信號與分層閾值降噪信號對比如圖1所示.
(8)將上證1991年5月13日開始至2012年3月22日的20年交易日日線數據每隔Circel個收盤價格取1個值,得到m個價格時間序列.
(9)將價格時間序列和信息熵值均作歸一化處理[7],為更加清晰地說明圖例,將每個歸一化的信息熵值增加1,得到調整后的信息熵值序列,而價格歸一化處理后的價格序列對應如圖2所示.
(10)選取調整后的熵值序列中適當的信息熵閾值[8-9],1.19,1.58abH=H=(圖2),然后選取其值對應的時間和收盤價格(表2).
3實證分析
對圖2進行分析,可得到如下信息:
(1)熵值總是在振蕩中,其變化的相對幅度明顯高于價格的相對變化幅度.
(2)超出[1.19,1.58]abH=H=范圍之外的收盤價走勢可以分為兩種情況,(1)1.19aH<H=價格均為上漲;(2)1.58bH>H=價格均為下跌.
(3)熊市的明顯的特點是熵值整體比較高[2],因此,利用此點可以判斷股市是否處于熊市.熵值在閥值1.58bH=(圖2中水平線)上方振蕩,則表明股市整體格局較亂,處于明顯的熊市中;只有當熵值充分下穿1.58bH=線,才可以視為熊市結束的信號(圖2中2010年03月18日對應的直線).而目前(數據截止日為2012年3月22日)的熵值仍在閥值上方振蕩,表明熊市沒有結束.
(4)當信息熵值曲線上穿1.58bH=時,價格將要下跌,下穿bH時,價格將要上漲.
(5)當信息熵值曲線下穿和上穿1.19aH=時,要注意其信息熵值變化量的大小.如果熵值變化大,那么,熵值曲線下穿1.19aH=時,價格將要上漲,上穿1.19aH=時,價格將要下跌;熵值變化小,則不一定有價格趨勢的形成.
(6)信息熵值在增大過程中,是價格變化由趨勢變為無序的過程,一般不是入場的時機[10].信息熵值在1.19aH=以下時的變化過程除外.由以上的幾點分析,就對文中起初所提及的幾個問題得到了很好的詮釋,而入場時間、持倉時間、出場時間方面也得到了較好的回答,在熵值減小過程中,1.19aH=H=是比較好的買入入場點,反之,1.19aH=則是較好的賣出離場點,同樣對于H下穿1.58bH=時,為較好的買入入場點,H上穿1.58bH=時,賣出離場.同樣,信息熵值能夠多次有效給出價格變化局部行情的轉折點,牛市和熊市對應不同特點的熵值,熵值增大時往往伴隨著價格的震蕩或者下跌,信息熵值的這些規律足以反映復雜市場的一個層面.參照圖2(A-W)中對應入場、離場點以及買入、賣出量化收益進行總結,表3即為做空統計表。從以上數據可知,根據指標上穿1.58bH=做空入場,下穿平倉離場,每一筆交易均盈利,最后一次是在2010年03月18日做空入場,截至到2012年03月22日指數為2375.77,盈利為670.32元.表4為做多統計表.同理,指標下穿1.19aH=做多入場,上穿平倉離場,每一筆交易也均盈利.