Skoltech的研究人員已經訓練了一個神經網絡來有效地識別巖芯盒圖像中的巖石樣本。它將分析過程加快了20倍,并使巖石樣本的描述自動化成為可能。開發的算法用于DeepCore系統鈥攁 數字地質勘探服務由Skoltech的子公司digital Petroleum創建。發表在《計算機與地球科學》上的文章描述了該方法的細節。
地質研究的常規任務之一是描述巖石樣品。在許多情況下,提取的巖芯堆放在箱子中。科學家在核心研究期間拍攝盒子或柱子的照片。該說明是通過填寫電子表格或地質日志手動編制的。標準分析程序涉及在圖形編輯器中從盒子的照片中手動提取色譜柱。這是一個相當耗時的過程。
為了使這一過程自動化,科學家們使用了機器學習方法。然而,傳統的計算機視覺算法由于數據量有限和圖像之間的巨大差異,在這方面表現不佳。例如,如果核心柱的顏色或紋理與相鄰柱或在不同條件下拍攝的柱不同。這種差異會顯著影響機器學習算法的性能,因為機器學習算法需要一個描述所有可能變體的大型數據集。因此,人們不得不花時間重新訓練模型。
為了解決這個問題,Skoltech的科學家們使用了深度卷積神經網絡鈥?與動物視覺皮層結構相似的人工神經網絡。為了訓練神經網絡,科學家們使用了增強技術,添加了核心盒照片的修改副本,以增加數據量。基于改進的CutMix算法創建“合成”圖像。CutMix算法通過隨機剪切一幅圖像并將其插入另一幅圖像,從一對現有圖像中創建新圖像。由于科學家們對識別巖柱特別感興趣,他們基于巖芯圖像模板優化了該方法,僅從巖芯所在的區域切割和交換碎片。
“在同一區域拍攝的巖芯盒在視覺上可能非常相似,但巖石可能不同。如果另一個盒子中的巖石實際上放置在同一個盒子中,由于顏色的相似性,網絡可能會將巖芯區域與盒子邊界混淆。增強有助于網絡關注顏色和形狀以外的其他特征,如結構和紋理,”第一個解釋道該作品的作者,斯科爾特科技公司的科學家埃夫根尼·巴拉博什金。
在他們的研究中,科學家們描述并測試了新方法,并比較了在“原始”數據上訓練的算法和與增強數據混合的算法的效率。事實證明,由于增強,該算法經過訓練,可以在大多數新圖像中高效準確地檢測巖石柱。這種自動化方法將一個核心盒的處理速度提高了20倍。此外,該方法還可以自動確定每個柱對應的深度。以前這需要用直尺測量。
“有趣的是,當我們向常規數據集中添加增強數據時,神經網絡學會了識別列上有銘文的紙片,盡管在原始數據集中它們也被標記為核心。該算法檢測到初始標記中的錯誤,并在將來避免了它,”埃夫根尼補充道。
科學家們將開發的方法作為分析階段之一引入DeepCore系統,這是他們為從圖像中自動描述核心而創建的軟件產品。從圖像中提取列后,程序確定層邊界和巖石類型。同時,用戶仍有維護的可能性。如有必要,專家可以添加其他類型的巖石或更改層邊界。自2021以來,DeepCore已用于采掘行業,幫助專家減少日常工作時間并實現分析自動化。