国产视频www-国产视频xxx-国产视频xxxx-国产视频一二-一本大道香蕉中文日本不卡高清二区-一本久久精品一区二区

SCI期刊 | 網(wǎng)站地圖 周一至周日 8:00-22:30
你的位置:首頁 >  移動通信論文 ? 正文

重入網(wǎng)識別原理探索

2021-4-9 | 移動通信論文

作者:艾達 羅愛平 單位:西安郵電學院通信與信息工程學院 中國聯(lián)通上海分公司

重入網(wǎng)用戶的識別原理是對比新增用戶特征和離網(wǎng)用戶在系統(tǒng)中記錄的特征,如果特征符合判斷條件,則認為該用戶是重入網(wǎng)用戶,如果沒有符合特征的記錄,則認為該用戶為新增用戶[6]。用戶特征包括:用戶資料,如姓名,身份證號;用戶設備,如用戶使用的手機的國際移動設備標識號碼(InternationalMobileEquipmentIdentity,IMEI);用戶呼叫指紋,如用戶交往圈,頻繁發(fā)生呼叫的地理位置等。較為簡單的重入網(wǎng)用戶識別方法是通過對比用戶資料或設備特征實現(xiàn)的。用戶資料,例如身份證信息,只能用于識別資料完整的用戶,對資料缺失、偽造以及大多數(shù)無需登記資料即可入網(wǎng)的預付費用戶無效。每部手機都有唯一的IMEI號,當用戶撥打電話時,手機的IMEI會自動記錄在用戶的通話話單中,因此可以利用用戶手機判別是否重入網(wǎng)。采用對比IMEI號碼識別重入網(wǎng)用戶,具有方法簡單,速度快的優(yōu)點。但通過調(diào)查發(fā)現(xiàn),重入網(wǎng)用戶手機更換率達32%以上[7],IMEI識別方法準確率較低,約為42%[8]。

用戶的呼叫特征具有相對穩(wěn)定性和個體差異性兩個特性,可用于識別重入網(wǎng)用戶。相對穩(wěn)定性是指用戶通話習慣,通話群體等因素在一段時期內(nèi)相對穩(wěn)定,發(fā)生改變的概率較小。個體差異性是指每個移動用戶都有自己獨特的通話習慣和聯(lián)系群體,不同用戶存在一定的差別。這種呼叫特征的相對穩(wěn)定性和個體差異性就像指紋一樣可以用于個體的識別。用戶在使用移動產(chǎn)品及服務時,產(chǎn)生的各種行為和屬性的綜合表征稱為呼叫指紋。呼叫指紋可分為用戶交往圈、位置特征、消費特征、終端特征等多個維度。用戶交往圈是與用戶有通話行為的所有號碼的集合。位置特征是用戶在工作時間和休息時間活動較為頻繁的小區(qū)標識等信息。消費特征是指用戶的消費行為、消費水平等信息。終端特征是指用戶使用過的手機終端信息。通過對用戶原始話單的數(shù)據(jù)采集和加工,生成不同維度的呼叫指紋[5]。采用呼叫指紋識別技術,通過一系列的比較運算就可找到重入網(wǎng)用戶,其重入網(wǎng)技術框圖如圖1所示。

基于呼叫指紋的識別算法

目前廣泛采用的有效交往圈算法[2],綜合運用了用戶消費層次、交往圈、頻繁活動小區(qū)、用戶手機終端等4個維度的呼叫指紋,其識別步驟如下。

步驟1首先判斷離網(wǎng)用戶和新入網(wǎng)用戶消費層次是否一致,將不一致的用戶排除。

步驟2消費層次一致的用戶判斷交往圈匹配程度是否達到一定條件,滿足條件則認為是重入網(wǎng)用戶,不滿足條件則認為不是重入網(wǎng)用戶。

步驟3無法用交往圈匹配方法判斷的用戶,再對比其手機終端是否一致,如果一致則認為是重入網(wǎng)用戶。

步驟4如果手機終端不一致,則判斷頻繁活動的小區(qū)匹配程度,如果位置信息匹配程度達到一定條件,則認為是重入網(wǎng)用戶。

步驟5如果位置信息不匹配,則變更用戶消費層次,重新執(zhí)行步驟1。其中步驟1根據(jù)目標用戶的消費層次大小,分別確定每個目標用戶的有效交往圈成員數(shù)N,即那些與所述用戶聯(lián)系比較頻繁且能保持長期交往的重要交往對象個數(shù)。步驟2使用用戶的通話頻率Freq,通話次數(shù)Num,通話時長Dura等參數(shù),計算出用戶交往指數(shù)Exp=f(Freq,Num,Dura)。

用交往指數(shù)排名前N個的號碼作為用戶的有效交往圈。計算離網(wǎng)用戶與新入網(wǎng)用戶有效交往圈交集的成員個數(shù),并計算符合率,即交集成員個數(shù)占離網(wǎng)用戶有效交往圈成員數(shù)的比例。如果符合率大于門限值,則認為是重入網(wǎng)用戶;如果符合率小于門限值,但大于0,則屬于不確定情況。此時,需要步驟3做進一步判斷。交往圈余弦相似度算法在有效交往圈算法基礎上[2-3],將當月離網(wǎng)用戶和新增用戶(分本網(wǎng)和競爭對手)分別作為待匹配集和目標匹配集,并按照位置信息和交往圈進行k-means聚類,形成待匹配識別的基礎表。然后按照待識別號碼的類別信息計算位置信息的重合度,找出目標集合中與待匹配號碼相近的號碼群,再通過計算待識別號碼交往圈的重合度對號碼群進行篩選,最后通過呼叫指紋找出匹配的號碼,并用對比IMEI方式確認。與文[2]計算有效交往圈符合率的判別方法不同,交往圈余弦相似度算法分別加權計算共有交往圈號碼的語音呼叫次數(shù),語音呼叫時長,短信次數(shù)的余弦相似度最大值αj=βj=(t1,t2,…,tm)T(j=1,2,…,n),而n表示交往圈號碼的總個數(shù)。另外,當k=1時,ti(i=1,2,…,m)為特定時間段內(nèi)與某一號碼通話(或短信)的次數(shù);當k=2時,ti(i=1,2,…,m)為特定時間段內(nèi)與某一號碼的通話時長。當i=1時,m=7,表示通話行為的周特征;當i=2時,m=24表示通話行為的日特征(工作日和休息日)。當l=1時,交往圈取通話信息;當l=2時,交往圈取短信信息(此時k為特定時間內(nèi)與某一號碼的短信通話次數(shù))。其中ωl為權值,根據(jù)用戶的通話行為和短信行為動態(tài)選取,通常根據(jù)交往圈內(nèi)的通話次數(shù)和短信次數(shù)的比例確定。根據(jù)式(1)分別計算待檢測號碼與目標號碼集中每個號碼的θ,如果最大的θ≥0.85時,即認為待識別號碼與所對應的目標號碼完全匹配,否則認為待檢測號碼離網(wǎng)或轉網(wǎng)。

改進Hausdorff距離算法[4],用修改后的Hausdorff距離取代余弦相似度作為判別依據(jù),進一步提高呼叫指紋比對的準確性。在改進的Haus-dorff距離中,認為兩個集合匹配程度和他們的共有元素個數(shù)相關,并且不使用單個dH(A,B)衡量集合之間的距離,而取其中所有的dH和作為統(tǒng)一的判別。首先定義任意兩個號碼的相似度,其中Ω是所有可以連接元素a和b鏈的集合,kl為當前鏈的節(jié)點個數(shù),M為給定的常數(shù),tl為鏈l中所有節(jié)點元素通話時間的總和。改進后的Hausdorff距離定義為在計算復雜度方面,盡管該算法較以往的算法更復雜,但由于對待匹配樣本集和目標樣本集進行了聚類細分,且采用并行運算,因此整體的計算量略大于以往算法,在識別精度上有進一步提高。TF-IDF加權余弦相似度算法[5]與上述三種算法所采用的識別方法不同,采用結合TF-IDF加權與Cosine相似算法相結合的呼叫指紋識別方法。TF-IDF是一種統(tǒng)計方法,用以評估一個字詞對于一個文件集或一個語料庫中的其中一份文件的重要程度。字詞的重要性隨著它在文件中出現(xiàn)的次數(shù)成正比增加,但同時會隨著它在語料庫中出現(xiàn)的頻率成反比下降。用于識別呼叫指紋時的實現(xiàn)步驟如下。步驟1使用TF-IDF算法獲取某一個用戶的話單中呼叫號碼的TF-IDF值其中ni是號碼i在用戶D話單中出現(xiàn)的次數(shù),分母是該用戶話單中所有號碼數(shù)之和,|D|是用戶總數(shù),|{d:ti∈d}|是出現(xiàn)有號碼i話單的用戶總數(shù)。步驟2將該用戶話單用矩陣的形式表示,計算得到TF-IDF=TF•IDF。步驟3使用Cosine相似算法計算兩個用戶之間的相似度。通過對多個相似用戶常撥打的(10~30個)號碼的權重和相似度進行分析,從而達到判斷是否為重入網(wǎng)用戶。

Top
主站蜘蛛池模板: 欧美视频第一页 | www.黄色片| 国产人成久久久精品 | 97久久精品午夜一区二区 | 性生活免费视频网站 | 91色视| a级成人毛片免费视频高清 a级高清观看视频在线看 | www成人在线观看 | 国产91精品一区二区视色 | 中国美女隐私无遮挡免费视频 | 欧美亚洲一区二区三区在线 | 精品久久久久久久久免费影院 | 日韩美女爱爱 | 美女张开腿让男人桶的动态图 | 久草亚洲视频 | 亚洲国产精品久久久久久网站 | 国产l精品国产亚洲区久久 国产tv在线 | 最近最新中文字幕免费的一页 | 国产日韩欧美精品一区二区三区 | 国产tv在线 | 韩国日本一级毛片免费视频 | 91青草久久久久久清纯 | 亚洲成a人片在线看 | 国产精品久久久久久影院 | 精品日韩欧美一区二区三区在线播放 | 高清性色生活片久久久 | 碰碰碰人人澡人人爱摸 | 欧美日韩一区二区三区免费不卡 | 久久精品网站免费观看 | 久久成人免费播放网站 | 久久精品视频1 | 97超级碰碰碰免费公开在线观看 | 国产成人高清精品免费观看 | 国产 一二三四五六 | 性刺激久久久久久久久 | 一级做α爱过程免费视频 | 欧美三级一区二区 | 最新在线精品国自拍视频 | 国产在线日韩 | 一区二区三区视频免费观看 | 日韩久久精品 |