国产视频www-国产视频xxx-国产视频xxxx-国产视频一二-一本大道香蕉中文日本不卡高清二区-一本久久精品一区二区

樹人論文網一個專業的學術咨詢網站!!!
樹人論文網

基于兩級分段式算法的卷積神經網絡的浮游有孔蟲自動鑒定

來源: 樹人論文網發表時間:2021-11-24
簡要:提要 有孔蟲個體微小、數量眾多、地理分布廣、演化迅速, 是記錄海洋沉積環境的重要載體, 在海相生物地層劃分和對比中具有十分重要的作用。因有孔蟲屬種眾多, 傳統的屬種鑒定需要經驗豐

  提要 有孔蟲個體微小、數量眾多、地理分布廣、演化迅速, 是記錄海洋沉積環境的重要載體, 在海相生物地層劃分和對比中具有十分重要的作用。因有孔蟲屬種眾多, 傳統的屬種鑒定需要經驗豐富的專業人員進行人工鑒定且耗時較長, 此外人工鑒定古生物面臨人才匱乏和工作量大等問題。卷積神經網絡在計算機視覺領域的應用可較好的解決上述問題。利用古生物專家對中新世浮游有孔蟲化石標注為指導, 根據有孔蟲化石不同方向的視角分類, 結合卷積神經網絡算法, 開發了有孔蟲化石圖像識別系統。研究發現, 通過有孔蟲化石腹視、緣視和背視角度分類, 采取兩級分段式鑒定算法對中新世浮游有孔蟲屬一級進行識別, 屬一級鑒定準確率達到 82%左右。

  關鍵詞 自動鑒定 卷積神經網絡 浮游有孔蟲 古環境 中新世

基于兩級分段式算法的卷積神經網絡的浮游有孔蟲自動鑒定

  熊連橋; 李建平; 謝曉軍; 岳翔; 呼和; 方培岳; 白海強; 張東, 古生物學報 發表時間:2021-11-24

  1 前 言

  古生物記錄著地層形成的年齡、氣候、地理和地貌等關鍵信息,在判斷生油母質、油氣生成和保存時代以及沉積環境分析中扮演重要角色。準確識別古生物有利于確定地層年齡, 識別古環境。目前化石鑒定的主要方法是專業人員通過觀察標本的外部形態和內部結構, 查找文獻、工具書、化石圖冊等相關研究資料, 比照圖版并結合自身經驗, 鑒定化石的屬種。但隨著古生物學研究和油氣勘探需求的快速發展, 人工鑒定化石效率低下等問題日漸凸顯: 1)古生物樣品繁多, 鑒定效率低下; 2)專業的古生物人才儲備不足; 3)存在人為的鑒定錯誤等問題(殷鴻福, 1994; 沙金庚, 2006; 夏菁等, 2013)。論文選取在中國近海油氣勘探中應用廣泛的浮游有孔蟲化石為研究對象, 以中新統為目標層位, 在古生物專家鑒定的基礎上, 利用基于兩級分段式算法的神經網絡助力古生物研究數字化、智能化, 減輕古生物鑒定人員的工作量。

  2 化石自動鑒定研究現狀

  關于生物自動鑒定系統, 較為成功并獲得了廣 泛 商 業 應 用 的 是 細 菌 的 自 動 鑒 定 系 統 ——Biolog Microstation (馮瑞華等, 2000)。它利用細菌的代謝指紋圖譜來對細菌進行自動鑒定。在古生物研究方面, 有學者報道了珊瑚和顆石藻自動鑒定系統。張松林和嚴幼因(1995)通過收集大量的珊瑚化石資料, 建立珊瑚特征檢索表, 將鑒定特征數值化, 并通過聚類分析實現自動鑒定, 研制了床板珊瑚的自動鑒定系統。顆石藻自動鑒定 系 統 SYRACO (Systeme de Reconnaissance Automatique de Coccolithes)是由法國學者開發的 (Dollfus and Beaufort, 1999), 并 不 斷 完 善 (Beaufort and Dollfus, 2004; Beaufort et al., 2014)。該系統通過人工智能神經網絡自動識別顆石藻屬種, 并統計顆石藻數量。蘇翔和劉傳聯(2008) 利用該系統, 對南海西部 2901 柱狀樣中的顆石藻進行自動鑒定, 并與專家鑒定結果相對比, 獲得了較好的一致性。經過訓練的 SYRACO 系統可以鑒定第四紀以來 14 個主要顆石藻種類, 并進行定量統計。

  20 世紀 80–90 年代, 郝詒純等(1989)和徐涵秋、郭雯(1990)等學者在國內率先開展了計算機對古生物的鑒定研究工作; Liu 等(1994)利用專家知識系統開展了浮游有孔蟲自動分類研究。 Ranaweera 等(2009)利用圖像映射進行標準化, 使用極大團算法分類提出了對有孔蟲的半自動鑒定方法。21 世紀, 隨著深度學習理論的提出和計算機設備的發展, 卷積神經網絡算法得到快速發展, 尤其在計算機視覺識別領域取得了顯著成果(Gu et al., 2018); VGG16 算法在有孔蟲圖像識別的多種算法中, 表現最好(Zhong et al., 2017)。基于機器學習的人工神經網絡技術鑒定古生物成為未來的發展趨勢(夏菁等, 2013)。

  開展機器學習需要大量的數據輸入。目前, 國內尚無相關科研機構具備齊全的中新世浮游有孔蟲化石圖像數據庫。同時, 大數據、深度學習需要專業的古生物專家、專業研究設備進行大量標注。有學者利用卷積神經網絡算法對現代有孔蟲圖像進行了識別(Hsiang et al., 2019), 但針對化石的鑒定研究工作開展較少。有孔蟲種類繁多, 關于有孔蟲化石圖像自動鑒定研究工作正在逐步開展(岳翔等, 2019)。實現有孔蟲化石自動鑒定的前提和基礎則是構建一個符合科學規范的有孔蟲化石圖像數據庫。只有優先完成這個數據庫的構建, 才可以為人工智能深度學習提供符合科學規范的大數據, 進而實現有孔蟲化石的自動鑒定。為提高有孔蟲化石鑒定效率, 避免人工鑒定造成的誤差, 迫切需要開展人工智能有孔蟲圖像識別研究工作。

  3 基于兩級分段式的 CNN 算法

  深度學習是一組復雜的機器學習算法的統稱, 其網絡結構是以神經網絡為基礎, 增加多層卷積層和池化層; 所謂“深度”是指其隱藏層的個數非常多(Dong and Li, 2011)。深度學習在計算機視覺方 面 取 得 了 巨 大 的 成 功 。 卷 積 神 經 網 絡 (Convolutional Neural Network, 簡稱 CNN)是深度學習的一種重要算法。卷積神經網絡是在 BP 神經網絡的改進, 與 BP 類似, 采用了前向傳播計算輸出值, 反向傳播調整權重和偏置(周飛燕等, 2017)。深度學習應用的一般步驟包括: 準備訓練樣本、數據處理、模型訓練與評估、模型預測, 詳細步驟見下文。

  3. 1 圖像數據庫建立

  首先從文獻資料中收集有孔蟲圖像作為訓練樣本。部分類別的有孔蟲化石, 文獻呈現的圖像較少, 則需要重新拍攝圖像。研究人員可根據從地層中分析獲得的有孔蟲化石標本, 拍攝掃描電鏡圖像。對收集的有孔蟲圖像進行增強及預處理, 其中, 數據預處理包括原始圖像(圖 1-A) 背景色統一、規格統一、剔除無效區域、調節圖像亮度(圖 1-B); 數據增強是利用圖像(圖 1-C)的旋轉(圖 1-D)、翻轉(圖 1-E)等操作擴大樣本數量; 通過以上操作保證有孔蟲識別特征清晰。每一張圖像由專業人員進行鑒定, 指明有孔蟲屬種鑒定依據, 總結屬種分類方法, 編制分類規則。

  本研究選取了中新世浮游有孔蟲掃描電鏡圖像 3600張(附表1), 涵蓋典型有孔蟲種類36屬95種, 占比 54%, 可對地質分析需求提供較大參考。對 3600 張圖像隨機選取 30%作為驗證集。經鑒定, 36 屬浮游有孔蟲生長于正常鹽度水體, 有孔蟲生長于開放大洋至混合層水體環境, 多見于低緯度熱帶至溫帶地區。

  3. 2 兩級分段式 CNN 算法效果對比

  卷積神經網絡(CNN)算法是主要用于圖像分類的深度學習模型, 在 BP 神經網絡的基礎上添加卷積層和池化層, 卷積神經網絡模型應用流程如圖 2 所示。卷積層, 即用卷積核對矩陣進行濾波, 目的是聚焦矩陣的局部特征, 隨著層數加深得到抽象度更高的特征; 池化層可以有效縮小矩陣的尺寸, 顯著減少網絡中參數的個數, 也有防止過擬合的作用(周飛燕等, 2017)。

  在不同級別的古生物鑒定中, 其所要求的特征多寡和主次是不同的。例如有孔蟲屬一級和種一級的分類標準所用到的特征不同。以新近紀中新世的浮游有孔蟲為例, 這一時期出現的浮游有孔蟲屬一級鑒定特征可以分為以下內容: 殼壁類型、旋卷類型、緣脊、主口孔位置、主口孔裝飾、主口孔形狀、次生殼、小泡、補充口孔、房室形狀和最后一圈房室個數。此外, 有孔蟲化石的鑒定特征常常是描述性的, 需要將這一類非數值化的信息轉變為計算機可識別的參數信息。因此需要專業人員整理屬種分類的規則, 提取鑒定需要的特征, 為人工智能的學習打下基礎。

  對所有圖像剔除無效區域, 調節圖像亮度; 對樣品數量較少的圖像, 采取圖像翻轉、旋轉等操作擴大樣本數量。其次, 根據給出的有孔蟲鑒定特征, 發現主要差異在主孔口、殼壁類型等。根據專家經驗, 不同視角, 有孔蟲圖像包含的信息不同。以異樣泡口蟲(Catapsydrax dissimilis)為例, 腹視角度(圖 3-A)具有更多且更為關鍵的鑒定特征, 如殼壁類型、主口孔位置、臍部具有小泡以及 4 個板下輔助口孔、等, 而背視(圖 3-B)和 緣視(圖 3-C)角度能識別的鑒定信息較少, 除去和腹視角度共有的鑒定特征外, 異樣泡口蟲從背視僅能獲取其房室發育的早期階段, 緣視僅可以提供螺旋程度的高低, 但這些特征并不是關鍵的鑒定特征, 特別是對于屬一級來說。因此, 根據有孔蟲圖像反映的鑒定信息多寡, 可對比傳統 CNN 算法(不分視角)和兩級分段式算法鑒定效果。

  1) 不分視角進行圖像鑒定

  VGG16 是獲得 2014年的ImageNet 圖像分類挑戰賽亞軍的模型(陳英義等, 2019), 利用 VGG16 模型對有孔蟲化石圖像不分視角直接進行鑒定。

  模型設置為: (1)保留 VGG16模型的卷積模塊, 去掉全連接層; (2)設置 VGG16 保留模塊節點在模型訓練時保持不變; (3)模型再加入兩層卷積+一層全連接+Softmax, 其中卷積核大小是 3×3, padding 設置為“same”, 激活函數為 Leaky ReLU, 全連接層神經元個數為 256。經過訓練, 驗證集屬一級鑒定準確率為 80%。

  2) 分視角進行圖像鑒定

  選取腹視、背視兩個角度進行樣本創建。樣本創建的依據主要是人工判斷, 主要特征也是集中在這兩個角度。根據腹視模型的鑒定結果, 對容易混淆的屬進行合并, 使用腹視角度進行粗分; 再使用背視角度對合并的屬進行細分。根據中新世浮游有孔蟲屬一級識別特征, 首先將特征容易識別的合并為 A組, 其他特征容易混淆的再分別劃分組別, 共劃分為 7 個組。其中, A 組為容易識別的其他有孔蟲屬, B–G 等 6 組包含多個屬(表 1)。最后通過兩級分段式鑒定算法對各組進行圖像鑒定(圖 4), 得到有孔蟲圖像的屬一級分類結果。

  模型設置: (1)以兩個卷積+一個池化作為一個模塊, 卷積層的卷積核數分別為 256 和 128, 卷積核大小為 3×3, padding 設置為“same”, 激活函數為 Leaky ReLU, 池化層的 Poolsize 為(2, 2), strides 為(2, 2); (2)以 5 個模塊+兩層全連接 +Softmax 作為通用卷積網絡, 其中全連接層的神經元個數為 256 和 128, 激活函數為 Leaky ReLU。模塊之間以輸入輸出的方式連接, 即上一個模塊的輸出即為下一個模塊的輸入, 模型的優化函數設置為 Adamax, 學習率為 0.001, batch size 設置為 32, 迭代 100 次; 經過試驗探索, 在當前數據樣本規模下, 以 5 個模塊組成網絡的效果最優(圖 5)。經過訓練, 模型屬一級鑒定準確率能達 82% 左右, 具體每一屬的預測準確率見表 2 所示。

  通過實驗可以看出分段鑒定算法在合理分組的情況下, 鑒定準確率優于 VGG16 算法的準確率。VGG16 算法適用于大樣本的應用場景, 而兩級分段式鑒定算法更適用于有孔蟲鑒定這類小樣本應用場景。兩級分段式鑒定算法的思路是分角度鑒定, 根據屬的特點選擇合適的角度, 用專家經驗解決樣本數量不足的問題。通過兩級分段式自動鑒定技術, 在保證化石鑒定準確率的前提下, 極大提高了鑒定效率, 可為油氣勘探及時提供浮游有孔蟲含量與古水深的關系(Smith, 1955; van der Zwaan et al., 1990; 李學杰等, 1994), 保障油氣勘探的時效性。

  4 結 論

  1) 卷積神經網絡能有效識別中新世浮游有孔蟲類別。

  2) 采用分視角, 兩級分段式鑒定算法能將中新世浮游有孔蟲屬一級鑒定準確率提高到 82.1%。

  3) 計算機批量自動鑒定的有孔蟲屬種類別可用于化石組合特征分析, 滿足油氣勘探階段對沉積古環境的研究需求。

主站蜘蛛池模板: 高清欧美一级在线观看 | 男女午夜视频在线观看 | 日韩不卡毛片 | 一级特黄特黄毛片欧美的 | 国产成人久久久精品一区二区三区 | 久久国产精品视频一区 | 精品一区二区三区波多野结衣 | 黄色毛片免费看 | 国产香蕉在线视频一级毛片 | 欧美99视频| 成人黄激情免费视频 | 美女黄色在线看 | 欧美在线区| 国产成人精品天堂 | 俄罗斯aaaa一级毛片 | www.一区二区三区.com | 久艹在线视频 | 黄色网网址 | 成年女人免费视频播放成年m | 一区高清| 日本欧美久久久久免费播放网 | 在线视频一区二区三区四区 | 高跟丝袜美女一级毛片 | 免费观看毛片的网站 | 高清视频 一区二区三区四区 | 黄色三级视频在线播放 | 最新国产美女一区二区三区 | 国产精品亚洲专区在线播放 | 国产系列 视频二区 | 欧美巨乳在线观看 | 久久精品视频亚洲 | 特黄特级a级黄毛片免费观看多人 | 日本三级韩国三级在线观看a级 | 国产精品久久久久毛片真精品 | 国产一区二区日韩欧美在线 | 99久久九九 | 欧美精品成人久久网站 | 扒开双腿猛进入爽爽在线观看 | 中国一级做a爰片久久毛片 中日韩欧美一级毛片 | 国产亚洲欧美日韩综合综合二区 | 久久手机视频 |