然而,使用機器學習來進行血細胞計數以診斷疾病,而不是使用昂貴且通常精度較低的細胞分析儀,這是一項非常勞動密集型的工作,因為在機器學習模型的培訓中,需要大量的人工注釋工作。然而,Benihang大學的研究人員開發了一種新的訓練方法,可以自動完成大部分的訓練活動。
4月9日,他們的新訓練計劃發表在《電子人與仿生系統》雜志上。
血液中細胞的數量和類型通常在疾病診斷中起著至關重要的作用,但通常用于進行此類血細胞計數的細胞分析技術鈥攊解決懸浮在液體中的細胞的物理和化學特性的檢測和測量鈥攁價格昂貴,需要復雜的準備工作。更糟糕的是,由于溫度、pH值、電壓和磁場等各種影響,細胞分析儀的準確度僅為90%左右,這些影響可能會使設備混淆。
為了提高準確性、降低復雜性和降低成本,許多替代方法的研究最近集中在使用計算機程序對高密度血液采集的照片進行“分割”上鏗乶連接到顯微鏡的ition攝像頭。分割涉及到對照片中出現的內容逐像素進行標記的算法,在這種情況下,圖像的哪些部分是細胞,哪些部分不是細胞鈥攊n本質,計算圖像中的細胞數。
對于只顯示單一類型細胞的圖像,此類方法可以達到相當高的精度,但在面對具有多種類型細胞的圖像時,其性能較差。因此,近年來,為了解決這個問題,研究人員轉向了卷積神經網絡(CNN)鈥攁 反映人類視覺皮層連接結構的機器學習類型。
為了讓美國有線電視新聞網執行這項任務,它必須首先接受“訓練”,了解人類手動標記的數千張細胞圖像上的細胞是什么和不是什么。然后,當喂食一張新的未標記圖像時,它可以識別并計數其中的細胞。
“但是,即使在專家的幫助下,這種手動標記也很費勁和昂貴,”該論文的合著者、北京航空航天大學機械工程與自動化系教授Guangdong Zhan說,“這違背了一種比細胞分析儀更簡單、更便宜的替代品的目的。”
因此,北京航空航天大學的研究人員開發了一種新的CNN訓練方案,即U-Net,這是一種完全卷積的網絡分割模型,自2015年首次開發以來,已廣泛應用于醫學圖像分割。
在新的訓練方案中,CNN首先在數千張圖像上進行訓練,其中只有一種類型的細胞(取自小鼠的血液)。
這些單細胞類型的圖像由傳統算法自動“預處理”,這些算法可以減少圖像中的噪聲,提高圖像質量,并檢測圖像中物體的輪廓。然后執行自適應圖像分割。后一種算法計算黑白圖像中不同級別的灰度,如果圖像的一部分超過某個灰度閾值,則該算法將其分割為不同的對象。使該過程具有自適應性的是,它不是根據固定的灰度閾值分割出部分圖像片段,而是根據圖像的局部特征進行分割。
將單細胞類型的訓練集呈現給U-Net模型后,使用一小組多細胞類型的手動注釋圖像對模型進行微調。相比之下,仍保留了一定數量的手動注釋,需要人類標記的圖像數量從以前的數千張下降到了600張。
為了測試他們的訓練方案,研究人員首先在相同的小鼠血液樣本上使用傳統的細胞分析儀進行獨立的細胞計數,以比較他們的新方法。他們發現,他們的訓練方案對多細胞類型圖像的分割準確率為94.85%,這與人工標注的多細胞類型圖像的訓練水平相同。
該技術還可以應用于更高級的模型,以考慮更復雜的分割問題。
由于新的訓練技術仍然需要一定程度的手動注釋,研究人員希望繼續開發一種用于注釋和訓練模型的全自動算法。