慧安小課堂 | 靈境-圖像管理與數(shù)據(jù)質(zhì)檢
靈境慧安蜂巢算法中臺(tái)是慧安蜂巢智能支撐產(chǎn)品之一,全面支持?jǐn)?shù)據(jù)集管理、算法開發(fā)、模型訓(xùn)練、在線部署等算法全生命周期工作。本期為大家介紹靈境的圖像管理功能和數(shù)據(jù)質(zhì)檢這兩個(gè)重要能力。
圖像管理
除了醫(yī)療圖像領(lǐng)域,數(shù)字成像通信(Digital Imaging and Communications in Medicine,DCM)標(biāo)準(zhǔn)在工業(yè)上也有應(yīng)用。非破壞性檢測(cè)(Non-Destructive Testing,NDT):DCM標(biāo)準(zhǔn)可以應(yīng)用于非破壞性檢測(cè)領(lǐng)域,如金屬檢測(cè)、焊接缺陷檢測(cè)、材料缺陷檢測(cè)等。工業(yè)上的數(shù)字成像設(shè)備可以生成圖像數(shù)據(jù),并使用DCM格式進(jìn)行存儲(chǔ)和傳輸,以便進(jìn)行后續(xù)的分析和處理。
為了滿足工業(yè)需求慧安蜂巢靈境人工智能算法中臺(tái)提供圖像管理能力,包括數(shù)據(jù)集上傳和標(biāo)注。
DCM焊縫圖像
數(shù)據(jù)質(zhì)檢
數(shù)據(jù)質(zhì)檢(Data Quality Assurance)是指對(duì)數(shù)據(jù)集質(zhì)量進(jìn)行評(píng)估和驗(yàn)證的過程,旨在確保數(shù)據(jù)的準(zhǔn)確性、完整性、一致性和可靠性。數(shù)據(jù)質(zhì)檢是數(shù)據(jù)管理和數(shù)據(jù)分析中非常重要的一環(huán),因?yàn)榈唾|(zhì)量的數(shù)據(jù)會(huì)導(dǎo)致錯(cuò)誤的決策和不可靠的分析結(jié)果。
在慧安靈境算法中臺(tái)的數(shù)據(jù)集管理中加入了數(shù)據(jù)質(zhì)檢的功能,利用統(tǒng)計(jì)分析和圖像處理算法對(duì)用戶上傳的數(shù)據(jù)集進(jìn)行分析,生成數(shù)據(jù)質(zhì)檢報(bào)告,直觀地展示數(shù)據(jù)質(zhì)量情況。數(shù)據(jù)質(zhì)檢報(bào)告主要包括兩方面內(nèi)容。一方面是原始數(shù)據(jù)集本身的信息:數(shù)據(jù)集大小、圖片數(shù)量、圖片存儲(chǔ)大小分布、高寬比分布、分辨率分布、清晰度分布、色偏分布、色彩空間分布、相似度分布。另一方面是數(shù)據(jù)標(biāo)注相關(guān)信息(目標(biāo)檢測(cè)標(biāo)注為例):標(biāo)注框高寬比分布、標(biāo)準(zhǔn)框面積分布、堆疊度分布、標(biāo)簽分布、標(biāo)簽總數(shù)、總平均標(biāo)注數(shù)(標(biāo)注框總數(shù)/已標(biāo)注圖片數(shù))、已標(biāo)圖像占比(已標(biāo)圖片數(shù))。如下圖所示,以圖表的形式直觀展示數(shù)據(jù)集的質(zhì)量情況。
操作過程
數(shù)據(jù)質(zhì)檢報(bào)告
總結(jié)
數(shù)據(jù)質(zhì)檢和圖像管理功能旨在為用戶提供更完善的數(shù)據(jù)集管理工具和服務(wù)。我們將對(duì)用戶需求進(jìn)行持續(xù)關(guān)注和的不斷追求技術(shù)創(chuàng)新。我們相信,通過提供數(shù)據(jù)質(zhì)檢和圖像管理功能,慧安蜂巢人工智能算法中臺(tái)將助力用戶和企業(yè)智能升級(jí)。
來源 | 研發(fā)中心
審核 | 市場(chǎng)部