快看:Amazon SageMaker Ground Truth新增合成數(shù)據(jù)(圖像)生成功能

2022-09-18 06:48:28來源:中關(guān)村在線  

日前,亞馬遜云科技為其機器學(xué)習(xí)數(shù)據(jù)標(biāo)注服務(wù)Amazon SageMakerGround Truth新增合成數(shù)據(jù)(圖像)生成功能??蛻羰褂眠@一新功能,可以生成數(shù)十萬計已標(biāo)注的合成圖像,無需手動標(biāo)注數(shù)據(jù),提高標(biāo)注的準(zhǔn)確性,并快速獲取高質(zhì)量的訓(xùn)練數(shù)據(jù)集。該功能的推出讓Amazon SageMaker變得更強大,作為亞馬遜云科技機器學(xué)習(xí)服務(wù)層面的核心產(chǎn)品,亞馬遜云科技不斷豐富Amazon SageMaker的功能,僅2021年就推出60多項新的特性和功能。

亞馬遜云科技為Amazon SageMaker Ground Truth新增合成數(shù)據(jù)(圖像)生成功能

機器學(xué)習(xí)(ML)模型構(gòu)建是一個不斷重復(fù)、迭代的過程,從數(shù)據(jù)收集和準(zhǔn)備開始,然后是模型訓(xùn)練和部署。其中,為模型訓(xùn)練收集大量、多樣化且準(zhǔn)確標(biāo)注的數(shù)據(jù)集,是非常具有挑戰(zhàn)性并耗時的第一步。


(相關(guān)資料圖)

以計算機視覺(CV)應(yīng)用為例,在工業(yè)領(lǐng)域,該技術(shù)能夠改善生產(chǎn)質(zhì)量、提高倉庫管理的自動化水平等,目前已在工業(yè)數(shù)字化和智能化發(fā)揮了關(guān)鍵作用。然而,為訓(xùn)練計算機視覺模型而收集數(shù)據(jù)的過程既耗時又費力,有時甚至幾乎無法完成。為確保模型的準(zhǔn)確性,數(shù)據(jù)科學(xué)家可能會花費數(shù)月時間,從生產(chǎn)環(huán)境中收集數(shù)十萬張圖像,盡可能涵蓋數(shù)據(jù)的所有變化。但在某些情況下,例如,要獲取罕見或價格昂貴的產(chǎn)品的缺陷的圖像,只有通過故意損壞產(chǎn)品這種極端方式才能實現(xiàn),這讓數(shù)據(jù)科學(xué)家無法從真實數(shù)據(jù)中找到所有的數(shù)據(jù)變化。

收集完所有數(shù)據(jù)后,數(shù)據(jù)科學(xué)家團(tuán)隊還需要準(zhǔn)確地標(biāo)注圖像,這又是一項艱巨的任務(wù)。手動標(biāo)注圖像進(jìn)程緩慢且容易出現(xiàn)人為錯誤;同時,構(gòu)建自定義標(biāo)注工具和設(shè)置縮放標(biāo)注操作可能既耗時又昂貴。將真實數(shù)據(jù)與合成數(shù)據(jù)相結(jié)合是緩解這一挑戰(zhàn)的方法之一,讓數(shù)據(jù)科學(xué)團(tuán)隊可以創(chuàng)建更完整和平衡的數(shù)據(jù)集并增加數(shù)據(jù)的多樣性。

亞馬遜云科技機器學(xué)習(xí)數(shù)據(jù)標(biāo)注服務(wù)Amazon SageMaker GroundTruth,可以讓客戶創(chuàng)建任何圖像數(shù)據(jù),包括在現(xiàn)實世界中難以發(fā)現(xiàn)和復(fù)制的特殊場景數(shù)據(jù)??蛻羯踔量梢宰远x對象和環(huán)境的變量,例如反映不同的照明、顏色、紋理、姿勢或背景。Amazon SageMakerGround Truth讓數(shù)據(jù)科學(xué)家可以為其正在訓(xùn)練的機器學(xué)習(xí)模型“量身定制”特定用例。此外,客戶還可以選擇Amazon SageMakerGround Truth Plus,借助亞馬遜云科技的專家團(tuán)隊創(chuàng)建高質(zhì)量的訓(xùn)練數(shù)據(jù)集,無需構(gòu)建用于標(biāo)注的應(yīng)用程序或自行管理標(biāo)注的人員。

Plus One Robotics是一家物流機器人視覺軟件開發(fā)商。Plus One Robotics創(chuàng)始人、首席技術(shù)官Shaun Edwards 表示,“隨著人力資源的減少以及倉庫商品量的激增,客戶希望我們能幫助他們處理倉庫中千變?nèi)f化的物品。新入庫的商品可能是首次出現(xiàn),或者只在特定情形下出現(xiàn)。使用合成數(shù)據(jù)能讓我們預(yù)先對系統(tǒng)進(jìn)行訓(xùn)練,以應(yīng)對現(xiàn)實可能遇到的各種情況。我們使用Amazon SageMakerGround Truth生成數(shù)以萬計帶標(biāo)簽的、來自不同承運商的逼真物品圖像,對物品姿勢、位置、甚至貼紙或標(biāo)簽之類的表面變化進(jìn)行建模。合成圖像使我們能夠更快地訓(xùn)練性能更好的系統(tǒng),其完整性和精確性使我們免去繁瑣的數(shù)據(jù)標(biāo)注和清洗步驟,每天為客戶超過100萬的運單提供支持。

聯(lián)想(Lenovo)SR588服務(wù)器主機2U機架式 桌面云數(shù)據(jù)庫國產(chǎn)虛擬化 深度學(xué)習(xí)備份存儲 定制 【基礎(chǔ)應(yīng)用】1顆銀牌4210R 10核 2.4G 16G內(nèi)存丨2x2T SATA硬盤 Raid1

[經(jīng)銷商]京東商城

[產(chǎn)品售價]¥16999元

進(jìn)入購買

浪潮(INSPUR)NF5280M5機架式服務(wù)器(2*4210 10核 2.2GHz/64G/4T*3 SATA/雙千兆*1/RAID卡/雙電550W/3年服務(wù))

[經(jīng)銷商]京東商城

[產(chǎn)品售價]¥32300元

進(jìn)入購買

標(biāo)簽:

相關(guān)閱讀

精彩推薦

相關(guān)詞

推薦閱讀