摘要: 針對現有機械手移動偏差控制技術存在的軌跡控制不連續、復雜度高、綜合效率低等問題,以機器學習和深度學習為基礎提出一種混合神經網絡控制算法。分析機械手各關節、連桿的空間坐標轉換關系,以 RBF 為基礎構建混合神經網絡模型,選用逆多二次函數作為模型的激活函數,分別確定中間隱層和輸出層的權值; 引入 LSTM 長短記憶算法,利用 LSTM 算法的輸入門、遺忘門和輸出門結構設計,抑制坐標數據訓練時出現的梯度膨脹問題,并給出精確的軌跡修正指令。仿真結果表明: 提出的混合神經網絡算法采樣點軌跡偏差均值為 0. 02 mm,VARP 值趨近于 0,具有更好的自動控制穩定性和更高的控制效率。
關鍵詞: 混合神經網絡; 機械手; 自動控制; RBF 神經網絡; LSTM 算法
唐翠微 機床與液壓 2021-11-28
工業機械手自動化控制是一項集機械制造、控制工程、計算機科學、傳感器技術、仿生學、人工智能等技術于一身的前沿技術[1-2]。隨著現有工業機械手控制技術的不斷發展,在許多高溫、高壓、高輻射性及污染性較強的惡劣環境下,機械手能夠替代人工完成作業任務[3]。對比早期的工業機械手,現有工業機械手不僅在小型化、輕量化及控制精度上有了本質改善,且制造成本也大為降低[4],使得工業機械手能夠應用到工業生產線,提高產品生產和加工的效率[5]。伴隨著新一輪技術革命的到來,工業機械手控制技術正朝著集成化、模塊化、智能化的方向發展,并且機械手控制技術與人工智能、機器學習、遠程控制等技術結合緊密程度不斷提高[6-7],工業機械手的應用領域也朝著高精度的方向發展。
機械手移動軌跡自動控制是機械手的核心研究問題。現有的軌跡控制方法主要包括曲線擬合控制、模糊推理控制、PID 控制等。其中曲線擬合方案通過對多項式序列權值的優化調整[8],實現對機械手行進軌跡的修正和自動控制,但曲線擬合很難滿足機械手行進軌跡的連續性,且修正局部曲線時容易導致相鄰段的軌跡出現偏差; 模糊推理控制算法在軌跡控制中先將輸入指令轉換為模糊量,再基于模糊規則得到清晰的輸出控制量,該種方式適合于指令集較為復雜的機械手系統[5],但模糊控制算法的模糊規則及隸屬度函數的確定極為復雜,制約了該控制方法的進一步推廣使用; PID 控制是一種使用范圍十分廣泛的控制算法[9],PID 控制器具有結構簡單、控制效率高等優點,但由于誤差積分的引入容易引起積分飽和[10]和控制量飽和[11],進而降低對機械手整體的控制精度。隨著人工智能、機器學習和深度學習技術的不斷發展,它們與機械領域的結合緊密程度不斷提高,本文作者將多種神經網絡算法進行深度融合,提出一種混合神經網絡算法,用于機械手移動軌跡的控制,以彌補現有控制算法的不足,改善控制精度。
1 機械手空間運動學分析
機械手的結構相對復雜,連桿和關節之間具有強耦合性和高度非線性特征,在機械手負重移動過程中還有很多不確定因素對移動軌跡造成影響。機械手末端執行器在設定好的程序控制下,沿指定軌跡移動,機械手關節和連桿的移動及空間坐標轉換以末端執行器為基礎做出適時調整[12-13]。機械手由多個連桿和關節組成,關節及連桿復雜的坐標變換可以通過齊次坐標來表示[14-15]。機械手運動過程中各連桿參數和關節的空間坐標關系見圖 1。
機械手運動齊次坐標系中包含的 4 個核心參數分別為 θi、di、Li 和 βi,當 4 個核心參數確定以后,相鄰連桿和關節之間的空間位姿關系和相對坐標即確定。4 個參數的內涵見表 1。
當表 1 中的各項參數被確定后,即可確定關節 i - 1 和關節 i 之間的空間坐標關系,而關節 i 的空間坐標變換矩陣 Gi 參數變量表示為 Gi = cosθi - sinθ1 cosθi sinθisinβi βicosθi sinθi cosθicosβi - cosθisinθi βisinθi 0 sinθ1 cosθi di 0 0 0 1 ???????????? ( 1) 坐標變換矩陣是機械手正向運動、逆向運動求解的基礎,機械手關節空間坐標與笛卡爾空間坐標的轉換過程見圖 2。
以六自由度機械臂為例,機械手的正向運動學方程表示為0 6F: 0 6F= G1·G2·G3·G4·G5·G6 = 0 1F( θ1 ) 1 2F( θ2 ) 2 3F( θ3 ) 3 4F( θ4 ) 4 5F( θ5 ) 5 6F( θ6 ) ( 2) 通過設定每個關節的初始位置,并將各參數輸入變換矩陣,即可計算出機械臂末端執行器的軌跡坐標。逆向運動是已知笛卡爾空間坐標系,求解各關節、連桿坐標的過程。逆向求解的過程更為復雜,但機械手末端執行器的軌跡點坐標值與各關節變換矩陣的乘積相等,聯立方程組可以求出機械手運動過程中的空間坐標。在實際計算中由于解方程組的方法過于復雜,常用求變換矩陣的逆矩陣方法獲得最終的結果,先依次求出關節 1 和關節 2 的逆矩陣,再向右與 G-1 6 相乘: G-1 2 ·G-1 1 ·0 6F·G-1 6 = G3·G4·G5 ( 3) 由于笛卡爾空間矩陣和機械手移動矩陣恒等式關系的存在,可依次求出機械手各關節的旋轉角度與連桿空間移動距離。
2 混合神經網絡模型的建立
工業機械手移動過程的控制屬于一種典型非線性控制,盡管經典 BP 神經網絡系統具有較強的自學習能力,但其在參數選擇及數據訓練中存在收斂慢、映射能力弱等不足。近年來,隨著人工智能和機器學習技術的不斷發展和進步,各種新的深度學習算法在數據計算能力、學習能力和訓練能力等方面已經有了較大的突破。本文作者將 RBF( Radial Basis Function,徑向基函數) 神經網絡和 LSTM( Long Short - Term Memory,長短時記憶網絡) 進行深度融合,其中 RBF 能夠將采集到的當前機械手各關節、連桿的空間坐標數據輸入徑向基函數,實現移動坐標數據從低維到高維的轉換,輸出標準化的、與理論軌跡偏差更小的控制指令; 而 LSTM 能夠從原始機械手移動坐標數據中提取到時序特征,以更準確地傳達指令,并更好地修正機械手末端執行器軌跡。混合神經網絡模式在結構設計上以 RBF 為基礎,其中輸入量 P、輸出量 Q 和輸入偏移 B 分別如下: P = p1,p2,···,pn [ ] T ∈ Rn Q = q1,q2,···,qm [ ] T B = b1,b2,···,bm [ ] { T ( 4) 設 ω ∈ Rn×m 為中間隱含層到輸出層的權值,函數 φi ( p) 為混合神經網絡隱含層內第 i 個節點所對應的激活函數,第 i 個節點對應的中心值為 ci。混合神經網絡中間隱含層設計以 RBF 神經網絡為主體,就能夠保持中心點徑向對稱,通過控制輸入量與中心點距離,調整激勵函數的激活值。混合神經網絡的結構設計見圖 3。
在徑向基函數的選擇方面,混合神經網絡以逆多二次函數作為激活函數: φi ( pi ) = 1 ( p 2 i + η2 ) 1 /2 ( 5) 輸入混合神經網絡模型的機械手空間位移樣本,首先經過聚類處理確定數據的中心點,再通過激活函數和模型擴展系數確定輸入數據與中心點的距離。輸入數據的訓練過程步驟: 步驟 1,利用激活函數確定輸入數據隱含層節點的中心值。步驟 2,確定聚類中心后,計算已輸入的機械手空間位姿坐標值與聚類中心的距離 ‖pi - ci‖。步驟 3,基于最小距離原則對數據進行分類,當滿足如下條件時,得到的訓練數據為滿足控制條件的輸入數據: φi‖pi - ci‖ = min‖pi - ci‖ ( 6) 當滿足條件 ci ( i + 1) ≠ ci ( i) 時輸入數據點的聚類過程結束。步驟 4,當混合神經網絡中間隱含層節點擴展系數確定以后,再分別計算輸出層的權值 ω。
3 算法融合與機械手移動軌跡的控制修正
RBF 神經網絡模型與經典 BP 算法、CNN 算法等一樣,在反向傳播計算中易出現梯度爆炸的情況,為此本文作者利用 LSTM 算法對 RBF 模型進行優化,構建一種混合神經網絡模型。LSTM 具有很強的記憶性,能夠有效解決輸入數據訓練和學習中的時序排列問題,并提取機械移動軌跡的波動特征,實現軌跡的修正和糾偏。LSTM 引入了門的機制來解決梯度下降問題,LSTM 神經網絡算法模型包含了輸入門、遺忘門和輸出門,LSTM 門的結構設計如圖 4 所示。
圖 4 中 ξt 作為混合神經網絡的遺忘門,決定了在 t 時刻輸入數據特征狀態的保留情況,其取值區間在 0 ~ 1 之間,當 ξt 值為0 時表示完全遺忘,ξt 值為1 時代表完全保留: ξt = φt ( wξ·pit + bξ ) ( 7) 式: φt 為混合神經網絡模型在 t 時刻對應的激活函數; wξ 為遺忘門 ξt 對應的權重矩陣; bξ 為與遺忘門對應的偏置。輸入門 it 決定了在 t 時刻,混合神經網絡中間隱層能有多少狀態單元 Jt 被保留: it = φt ( wi·pit + bi ) Jt = ξt·Jt -1 + pt ( 8) 式中: Jt -1 為上一期狀態單元。LSTM 算法中的當前記憶與上一期的長期記憶 Jt -1 組合,形成了新的單元狀態。經過神經網絡訓練和數據迭代后,輸出值 qt 表示為 qt = ot·tanhJt ot = φt ( wo·pit + bo ) ( 9) 輸入的空間位姿數據、移動數據經混合神經網絡模型精確計算后,當前的移動軌跡與理論軌跡偏差及線速度、角速度偏差指標被反饋到控制中心,并重新給出新的移動指令。考慮到機械手軌跡的跟蹤控制至少需要調整線速度和角速度兩個變量,機械手末端執行器整體被看做一個質點,機械手在 t 時刻移動的線速度 vt 為機械手移動方向的切線速度; 而機械手移動的角速度 ωt 為單位時間內的關節旋轉角度: ωt =Δθ /Δt ( 10) 軌跡移動自動化控制的目的是在下一個 t+1 時刻尋找與理論運動控制向量 ( vt+1,ωt+1 ) T 偏差最小的空間坐標集合,即: lim ( Δvt,Δωt ) T →0 ( 11) 在混合神經網絡模型控制下,能夠隨時監控和反饋笛卡爾坐標系下機械手的實時位姿,通過混合模型中間隱層對輸入坐標數據空間位姿的計算和判斷,確定軌跡局部偏差值范圍,再通過參數運算、逆向求解計算出在機械手關節空間的當前坐標值。模型給出糾偏后的參考運動軌跡,能夠保證局部坐標系下軌跡偏差最低,機械手移動過程動態糾偏始終存在,LSTM 計算上一個時間周期狀態單元與當前周期狀態單元的狀態偏差,自動控制輸出結果的偏差,以達到控制機械手動態全局軌跡的目的。
4 仿真分析
4. 1 實驗準備與參數設定
為進一步驗證混合神經網絡算法在機械手軌跡修正方面的效果,以本地某汽車制造企業的焊接機械手為研究對象,實地測量和記錄了機械手的各項工作參數及焊接過程中焊道接縫的軌跡出現的偏離情況。以工業機械手的真實工作參數為基礎,并借助 MATLAB 仿真系統模擬焊接機械手的工作過程。焊接機械手的實物圖及 MATLAB 軌跡模擬仿真分別如圖 5 和圖 6 所示。機械手與末端執行器臨近的兩個關節 ( 關節 5 和關節 6) 、連桿運動過程對末端執行器的影響最大,以規劃和控制該段軌跡為例驗證提出的基于混合神經圖 6 基于 MATLAB 的機械手運動模擬網絡 算 法 的 自 動 控 制效果。機 械 手 末 端 執行器 的 初 始 點 坐 標 為 ( -20,- 10,16) cm,機械 臂 軌 跡 自 控 控 制前,關 節 5 和 關 節 6 的齊 次 坐 標 系 的 參 數設定見表 2。
4. 2 實驗結果與分析
從機械手關節 5 到末端執行器的規劃路徑上,隨機選取 15 個樣本數據點,觀測經過混合神經網絡算法修正控制后實際軌跡與理論軌跡之間的偏差。為了使評判結果更為客觀,同時引入了傳統的曲線擬合控制、模糊推理控制和 PID 控制參與對比。軌跡糾偏結果見表 3。
采樣點數據統計結果顯示: 多個采樣點軌跡與理論值比較,混合神經網絡算法自動控制后實際軌跡與理論值偏差均值較小,遠低于 3 種現有控制算法,能夠更好地滿足企業焊道要求; 而從 VARP 值的統計結果來看,混合神經網絡算法 VARP 值精確到 0. 01 后趨近于 0,而曲線擬合方法和 PID 控制方法的 VARP 值分別為 0. 02,表明機械手軌跡經過自動化控制后,局部仍有較大的偏差。機械手被廣泛應用到工業領域,除了考慮移動軌跡的控制精度以外,工作效率也是衡量機械手性能的重要指標之一。將仿真迭代次數設定為 60 次,觀測優化前和優化后關節 5 和關節 6 運動時間的變化,見圖 8 和圖 9。
焊接機械手移動過程中基于混合神經網絡算法優化后,關節 5 和關節 6 的移動時長分別減少了 0. 530 s 和 0. 495 s,對于企業而言,能夠顯著提高批量作業的效率。
5 結束語
隨著人工智能技術、機器學習技術的不斷發展和進步,以神經網絡和深度學習為代表的智能算法越來越多地被應用到工業制造領域。在機械手軌跡自動控制和偏差修正中,本文作者將 RBF 神經網絡與 LSTM 算法進行了深度融合,利用 LSTM 長短記憶結構門的設計,抑制神經網絡隱含層數據訓練中出現的梯度膨脹問題,提高軌跡定位的精度。仿真實驗結果也證明: 混合神經網絡自動控制算法,對于軌跡偏差糾正和機械手工作效率提高具有良好的改善作用。
論文指導 >
SCI期刊推薦 >
論文常見問題 >
SCI常見問題 >