基于多頭注意力機制與長短期記憶網(wǎng)絡的自然場景文本識別
摘要: 隨著計算機視覺和自然語言處理技術的不斷發(fā)展,自然場景文本檢測與識別技術已成為計算機視覺領域的研究熱點之一。提出了一種基于多頭注意力機制與長短期記憶網(wǎng)絡(LSTM)的自然場景文本檢測與識別方法。該方法通過結合目標檢測算法和序列識別算法,利用多頭注意力機制對圖像中的文本區(qū)域進行精確的定位和特征提取,進而通過LSTM網(wǎng)絡對提取的特征進行編碼和解碼,實現(xiàn)對自然場景中文本的準確識別。在文... (共6頁)
開通會員,享受整站包年服務