2月25日,上海人工智能實(shí)驗(yàn)室聯(lián)合商湯科技發(fā)布通用視覺(jué)開(kāi)源平臺(tái)OpenGVLab,面向?qū)W術(shù)界和產(chǎn)業(yè)界開(kāi)放其超高效預(yù)訓(xùn)練模型、超大規(guī)模公開(kāi)數(shù)據(jù)集,以及業(yè)內(nèi)首個(gè)針對(duì)通用視覺(jué)模型的評(píng)測(cè)基準(zhǔn)。此舉將為全球開(kāi)發(fā)者提升各類(lèi)下游視覺(jué)任務(wù)模型訓(xùn)練提供重要支持,推動(dòng)AI技術(shù)的規(guī)模化應(yīng)用落地,并促進(jìn)人工智能基礎(chǔ)研究及生態(tài)建設(shè)的快速發(fā)展。

繼去年11月聯(lián)合商湯科技、香港中文大學(xué)和上海交通大學(xué)發(fā)布通用視覺(jué)技術(shù)體系“書(shū)生”(INTERN),上海人工智能實(shí)驗(yàn)室在推動(dòng)通用視覺(jué)智能技術(shù)的發(fā)展上持續(xù)發(fā)力。此次發(fā)布的通用視覺(jué)開(kāi)源平臺(tái)OpenGVLab不僅包含超高效預(yù)訓(xùn)練模型,同時(shí)包括千萬(wàn)級(jí)精標(biāo)注、十萬(wàn)級(jí)標(biāo)簽量的公開(kāi)數(shù)據(jù)集;同步公布的評(píng)測(cè)基準(zhǔn)則將便于開(kāi)發(fā)者對(duì)不同通用視覺(jué)模型的性能進(jìn)行橫向評(píng)估和持續(xù)調(diào)優(yōu)。
當(dāng)前,人工智能技術(shù)正快速發(fā)展,然而很多AI模型還局限于完成單一任務(wù),如識(shí)別單一物體,或識(shí)別風(fēng)格較為統(tǒng)一的照片。如果要對(duì)多種類(lèi)型、風(fēng)格進(jìn)行識(shí)別,則需要具備足夠的通用性和泛化能力。通用視覺(jué)技術(shù)體系“書(shū)生”(INTERN),很好地解決了這一問(wèn)題。通用視覺(jué)開(kāi)源平臺(tái)OpenGVLab即是基于“書(shū)生”打造而成。依托“書(shū)生”在通用視覺(jué)技術(shù)上的支撐,OpenGVLab將大幅降低通用視覺(jué)模型的開(kāi)發(fā)門(mén)檻,幫助開(kāi)發(fā)者用更低的成本快速開(kāi)發(fā)用于成百上千種視覺(jué)任務(wù)、視覺(jué)場(chǎng)景的算法模型,高效實(shí)現(xiàn)對(duì)長(zhǎng)尾場(chǎng)景的覆蓋,推動(dòng)AI技術(shù)的規(guī)?;瘧?yīng)用落地。
據(jù)悉,OpenGVLab充分繼承了通用視覺(jué)技術(shù)體系“書(shū)生”的技術(shù)優(yōu)勢(shì),其開(kāi)源的預(yù)訓(xùn)練模型具備極高性能。相較于此前公認(rèn)的最強(qiáng)開(kāi)源模型(OpenAI于2021年發(fā)布的CLIP),OpenGVLab的模型可全面覆蓋分類(lèi)、目標(biāo)檢測(cè)、語(yǔ)義分割、深度估計(jì)四大視覺(jué)核心任務(wù),在準(zhǔn)確率和數(shù)據(jù)使用效率上均取得大幅提升?;谕瑯拥南掠螆?chǎng)景數(shù)據(jù),開(kāi)源模型在分類(lèi)、目標(biāo)檢測(cè)、語(yǔ)義分割及深度估計(jì)四大任務(wù)26個(gè)數(shù)據(jù)集上,平均錯(cuò)誤率分別降低了40.2%、47.3%、34.8%和9.4%;同時(shí),在分類(lèi)、檢測(cè)、分割和深度估計(jì)中,僅用10%的下游訓(xùn)練數(shù)據(jù)就超過(guò)了現(xiàn)有其他開(kāi)源模型。使用此模型,研究人員可以大幅降低下游數(shù)據(jù)采集成本,用極低的數(shù)據(jù)量即可快速滿(mǎn)足多場(chǎng)景、多任務(wù)的AI模型訓(xùn)練。
隨著人工智能與產(chǎn)業(yè)融合的不斷深入,行業(yè)對(duì)人工智能的需求逐漸從單一任務(wù)向復(fù)雜的多任務(wù)協(xié)同發(fā)展,亟需構(gòu)建開(kāi)源、開(kāi)放的體系,以滿(mǎn)足趨于碎片化和長(zhǎng)尾化的海量應(yīng)用需求。
伴隨OpenGVLab的發(fā)布,上海人工智能實(shí)驗(yàn)室還開(kāi)放了業(yè)內(nèi)首個(gè)針對(duì)通用視覺(jué)模型的評(píng)測(cè)基準(zhǔn)。當(dāng)前,行業(yè)中已有的評(píng)測(cè)基準(zhǔn)主要針對(duì)單一任務(wù)、單一視覺(jué)維度而設(shè),無(wú)法反映通用視覺(jué)模型的整體性能,難以用于橫向比較。全新的通用視覺(jué)評(píng)測(cè)基準(zhǔn)憑借在任務(wù)、數(shù)據(jù)等層面的創(chuàng)新設(shè)計(jì),可提供權(quán)威的評(píng)測(cè)結(jié)果,推動(dòng)統(tǒng)一標(biāo)準(zhǔn)上的公平和準(zhǔn)確評(píng)測(cè),加快通用視覺(jué)模型的產(chǎn)業(yè)化應(yīng)用步伐。
標(biāo)簽: 人工智能 通用視覺(jué) 開(kāi)源平臺(tái) AI技術(shù)規(guī)?;?/span>
最新資訊
關(guān)于我們| 聯(lián)系方式| 版權(quán)聲明| 供稿服務(wù)| 友情鏈接
咕嚕網(wǎng) www.55uc.com.cn 版權(quán)所有,未經(jīng)書(shū)面授權(quán)禁止使用
Copyright©2008-2020 By All Rights Reserved 豫ICP備20023378號(hào)-15
營(yíng)業(yè)執(zhí)照公示信息
聯(lián)系我們: 98 28 36 7@qq.com