《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 模擬設(shè)計(jì) > 解決方案 > 曠視聯(lián)合智源發(fā)布全球最大物體檢測數(shù)據(jù)集Objects365,舉辦CVPR DIW2019挑戰(zhàn)賽

曠視聯(lián)合智源發(fā)布全球最大物體檢測數(shù)據(jù)集Objects365,舉辦CVPR DIW2019挑戰(zhàn)賽

2019-04-21

4 月 16 日,,北京智源人工智能研究院(Beijing Academy of Artificial Intelligence,,BAAI,2018 年 11 月 14 日成立)在北京會議中心召開了「智源學(xué)者計(jì)劃暨聯(lián)合實(shí)驗(yàn)室發(fā)布會」,。

北京智源人工智能研究院(簡稱「智源研究院」)是在科技部和北京市委市政府的指導(dǎo)和支持下,,由北京市科委和海淀區(qū)政府推動成立,依托北京大學(xué),、清華大學(xué),、中國科學(xué)院、百度,、小米,、字節(jié)跳動、美團(tuán)點(diǎn)評,、曠視 MEGVII 等北京人工智能領(lǐng)域優(yōu)勢單位共建的新型研發(fā)機(jī)構(gòu),。


引進(jìn)培育高端人才、共建聯(lián)合實(shí)驗(yàn)室,、建設(shè)人工智能社區(qū),、加強(qiáng)產(chǎn)學(xué)研合作,是智源研究院的主要四項(xiàng)任務(wù),。


智源研究院聯(lián)合曠視,,

成立智能模型設(shè)計(jì)圖像感知聯(lián)合實(shí)驗(yàn)室


智源聯(lián)合實(shí)驗(yàn)室分為兩類,分別是與高校院所共建,、與優(yōu)勢企業(yè)共建,。在聯(lián)合實(shí)驗(yàn)室的建設(shè)上,智源研究院遵循「成熟一個(gè),、啟動一個(gè)」的原則,,擇優(yōu)支持共建,最多可連續(xù)支持三年,。


「北京智源-曠視智能模型設(shè)計(jì)與圖像感知聯(lián)合實(shí)驗(yàn)室」已通過立項(xiàng)論證,,成為北京智源聯(lián)合實(shí)驗(yàn)室首個(gè)成功落地的項(xiàng)目,擬由曠視首席科學(xué)家,、曠視研究院院長孫劍任實(shí)驗(yàn)室主任,,資深研究員周舒暢任實(shí)驗(yàn)室副主任。

微信圖片_20190421154009.jpg

曠視首席科學(xué)家,、曠視研究院院長孫劍


孫劍表示,,成立這個(gè)實(shí)驗(yàn)室,既有國家戰(zhàn)略層面的考慮,,也是為了解決行業(yè)痛點(diǎn),。


2017 年 7 月,,國務(wù)院發(fā)布《新一代人工智能發(fā)展規(guī)劃》,人工智能上升為國家戰(zhàn)略,。建立開源開放的人工智能開放創(chuàng)新平臺,,服務(wù)企業(yè)應(yīng)用技術(shù)開發(fā)成為當(dāng)前該領(lǐng)域的難點(diǎn)。


國家也希望龍頭企業(yè),,通過打造人工智能開源開放創(chuàng)新平臺,,調(diào)動產(chǎn)學(xué)研,社會各類創(chuàng)新創(chuàng)業(yè)主體參與共同打造我國自主知識產(chǎn)權(quán)的產(chǎn)業(yè)生態(tài),,提升國際影響力,,促進(jìn)行業(yè)整體發(fā)展。


而北京市是第一個(gè)國家新一代人工智能創(chuàng)新發(fā)展試驗(yàn)區(qū),,因此希望充分調(diào)動北京技術(shù),、人才方面優(yōu)勢,通過組織機(jī)制創(chuàng)新,,通過創(chuàng)新舉措,,依托龍頭行業(yè)牽引進(jìn)行多主體協(xié)同創(chuàng)新,打造我國乃至全球技術(shù)高地,。


現(xiàn)在確實(shí)有大量的高校,、研究院所、創(chuàng)新創(chuàng)業(yè)人員和行業(yè)客戶,,想?yún)⑴c到人工智能創(chuàng)新中,,但苦于沒有數(shù)據(jù),算力或算法等資源,,無法施展,。


因此,曠視與智源研究院通過聯(lián)手打造數(shù)據(jù)集和建設(shè)聯(lián)合實(shí)驗(yàn)室,,推動整個(gè)行業(yè)協(xié)同創(chuàng)新發(fā)展,,建設(shè)共性技術(shù)開放創(chuàng)新平臺,構(gòu)建自主可控產(chǎn)業(yè)生態(tài),,突破人工智能重大核心共性關(guān)鍵技術(shù),,推動行業(yè)全面演進(jìn)。


全球最大的物體檢測數(shù)據(jù)集 Objects365 發(fā)布


會上,,曠視研究院聯(lián)合北京智源人工智能研究院發(fā)布了全球最大的物體監(jiān)測數(shù)據(jù)集 Objects365。

 

微信圖片_20190421154150.jpg

Objects365 樣例


「我們的目的是打造世界上最大規(guī)模的通用物體數(shù)據(jù)檢測集,,做到規(guī)模大,、質(zhì)量高、泛化能力強(qiáng),?!?/p>


孫劍介紹,「我們第一批定義在生活中最常見的 365 個(gè)類別,比如,,室內(nèi)常見的椅子,、桌子、茶杯,、瓶子都包含在這個(gè)類別中,。第一階段,我們已經(jīng)標(biāo)注了超過 60 萬張這樣的圖片,,其中這些標(biāo)注框已經(jīng)超過了 1000 萬,。」


這個(gè)數(shù)據(jù)集有多大,?孫劍將微軟 2014 年創(chuàng)建的大規(guī)模圖像物體檢測數(shù)據(jù)集 COCO 作為參照物,,將二者進(jìn)行了對比,「COCO 是目前最大的,、全標(biāo)注數(shù)據(jù)集,,訓(xùn)練數(shù)據(jù)大概 12 萬,總共數(shù)據(jù)大概不超過 20 萬,,其中還有很多數(shù)據(jù)沒有標(biāo),。我們(Objects365)第一期開放(的)圖片數(shù)是 COCO 的 5 倍,標(biāo)注框超過 COCO 的 11 倍,?!?/p>

微信圖片_20190421154249.jpg


「我們的目標(biāo)是,三年內(nèi),,這個(gè)數(shù)據(jù)集達(dá)到 200 萬張圖片,,2400 萬個(gè)標(biāo)注框?!箤O劍說,。


算法優(yōu)化的上限嚴(yán)重依賴于基準(zhǔn)數(shù)據(jù)集術(shù)的質(zhì)量。為保證標(biāo)注質(zhì)量,,在打造 Objects365 時(shí),,曠視設(shè)計(jì)出一套科學(xué)而嚴(yán)格的標(biāo)注流程,每一張圖片的背后至少會經(jīng)過 9 名標(biāo)注工人之手,。


此外,,作為一個(gè)優(yōu)秀的預(yù)訓(xùn)練數(shù)據(jù)集,Objects365 預(yù)訓(xùn)練模型在使用過程中,,可以輕松超越現(xiàn)有算法的精度,,顯著加速收斂過程,表現(xiàn)出極強(qiáng)的泛化能力,。在執(zhí)行 COCO,、VOO Det,、CityPersons 等檢測任務(wù)時(shí),在 VOC Seg 和 ADE 等分割任務(wù)上均有顯著提升,。


如何共建聯(lián)合實(shí)驗(yàn)室,?

「一個(gè)平臺、四個(gè)突破點(diǎn)」


「北京智源-曠視智能模型設(shè)計(jì)與圖像感知聯(lián)合實(shí)驗(yàn)室 將圍繞『一個(gè)平臺,、四個(gè)突破點(diǎn)』進(jìn)行建設(shè),。」孫劍介紹道,。


「一個(gè)平臺」是指,,建設(shè)一體化的數(shù)據(jù)共享、模型設(shè)計(jì)和場景測試的開放創(chuàng)新平臺,。


「四個(gè)突破點(diǎn)」是指,,在數(shù)據(jù)方向、模型方向,、真實(shí)數(shù)據(jù)測試方向和模型部署方向做技術(shù)突破,,推進(jìn)大數(shù)據(jù)背景下模型架構(gòu)設(shè)計(jì)、優(yōu)化和部署等方面的研究,。


「深度學(xué)習(xí)成不成功,,很大程度上取決于數(shù)據(jù),很多靠算法帶來的提升遠(yuǎn)低于一個(gè)高質(zhì)量的數(shù)據(jù)(集)所能帶來的提升,?!箤O劍說。


除了最新發(fā)布的 Objects365,,曠視此前還發(fā)布了大規(guī)模擁擠場景人體檢測數(shù)據(jù)集 CrowdHuman 及一些數(shù)據(jù)標(biāo)注工具,。


實(shí)驗(yàn)室將立足曠視算法落地場景豐富、數(shù)據(jù)積累深厚的優(yōu)勢,,以開源數(shù)據(jù)集,、預(yù)抽取特征等形式,持續(xù)開放通用物體分類,、物體檢測追蹤,、人像人形識別屬性等視覺問題數(shù)據(jù),助力相關(guān)領(lǐng)域研究,。


針對高搜索效率,、高準(zhǔn)確率、高靈活性等關(guān)鍵指標(biāo),,該實(shí)驗(yàn)室還將開展支持大計(jì)算量模型的新神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索算法(NAS)研究,,構(gòu)建一站式深度模型自動化設(shè)計(jì)平臺等工作。


該平臺包括面向特定問題的自動化深度模型設(shè)計(jì)工具,、自動化數(shù)據(jù)篩選/數(shù)據(jù)增強(qiáng)工具,、自動化深度學(xué)習(xí)模型優(yōu)化工具,從而在 Object365 上實(shí)現(xiàn)自動訓(xùn)練比純?nèi)斯ふ{(diào)優(yōu)精度超過至少一個(gè)百分點(diǎn),,消耗卡時(shí)不超過三倍的目標(biāo),。


實(shí)驗(yàn)室還將開放眾多預(yù)訓(xùn)練模型,包括 ResNet,、ShuffleNet 這樣的基礎(chǔ)模型以及 Faster RCNN,、Mask RCNN、SSD 檢測模型,。


近年來,,模型架構(gòu)搜索(NAS)成為了 AI 領(lǐng)域的熱門研究方向。


不久前,,曠視首次披露了 NAS 新成果:單路徑 One-Shot 模型,。這是一個(gè)簡單靈活的通用模型搜索框架,支持構(gòu)建塊(building block),、通道(channel)和混合精度(mixed-precision)多搜索空間聯(lián)合搜索,;支持任意直接度量方法做硬約束(hard constraint),從而滿足實(shí)際業(yè)務(wù)要求,。據(jù)介紹,,同等情況下,單路徑 One-Shot NAS 的搜索精度和速度均超過目前公開的 FBNet,、ProxylessNAS 等 SOTA 框架,。


「很多時(shí)候,我們把一個(gè)技術(shù)(算法)落地,,真的是不是能在實(shí)際數(shù)據(jù)中做得很好,,其實(shí)不知道的。實(shí)際數(shù)據(jù)中有一些是非公開數(shù)據(jù),,不能到真正的場景中去測,;另外一些數(shù)據(jù)涉及到隱私,需要脫敏,?!箤O劍說,聯(lián)合實(shí)驗(yàn)室的計(jì)劃是,,提供一個(gè)實(shí)戰(zhàn)場景開發(fā)和測試環(huán)境,,大家上交模型,在這個(gè)環(huán)境中進(jìn)行測試,。


聯(lián)合實(shí)驗(yàn)室將建設(shè)人臉抓拍識別,、結(jié)構(gòu)化檢測、大規(guī)模人像比對等驗(yàn)證場景,,提供自動分析報(bào)告服務(wù),,為研究算法調(diào)優(yōu)提供環(huán)境,。他們還將積極探索低位寬等網(wǎng)絡(luò)壓縮技術(shù),研發(fā)高效硬件部署方案,,推動模型研究成果迅速投入實(shí)用,。


針對計(jì)算機(jī)視覺算法與真實(shí)場景適配的問題,實(shí)驗(yàn)室還將建設(shè)可重現(xiàn)的實(shí)景測試環(huán)境,,并提供自動化的量化錯(cuò)誤分析報(bào)告,,幫助算法迭代。


「通過以上措施,,實(shí)驗(yàn)室將被打造成為一個(gè)開放,、貼近實(shí)際場景的計(jì)算機(jī)視覺算法研究實(shí)驗(yàn)平臺,形成涵蓋數(shù)據(jù),、平臺,、場景的完整閉環(huán),有利于打造我國自主可控的技術(shù)和產(chǎn)業(yè)生態(tài),,共同助力我國圖像感知和計(jì)算領(lǐng)域的技術(shù)及應(yīng)用達(dá)到國際先進(jìn)水平,。」孫劍表示,,實(shí)驗(yàn)室平臺建成后,,將面向高校院所、創(chuàng)業(yè)企業(yè)等創(chuàng)新創(chuàng)業(yè)主體開放,,致力推動圖像感知與計(jì)算領(lǐng)域的協(xié)同創(chuàng)新,。


DIW2019 挑戰(zhàn)賽啟動,

3 個(gè)賽道冠軍將各獲 1 萬美金獎(jiǎng)勵(lì)


「我們的目標(biāo)是建設(shè)開源社區(qū),、打造產(chǎn)業(yè)生態(tài),。」孫劍說,。


除了開放預(yù)訓(xùn)練模型,,開源數(shù)據(jù)標(biāo)注、模型分析,、模型自動調(diào)優(yōu)等全套相關(guān)工具,,他們還將提供實(shí)驗(yàn)例程、開源完整的訓(xùn)練代碼庫,,支持高校本科及研究生教學(xué),,每年培訓(xùn)學(xué)生人數(shù)不少于 500 人;每年還會組織圍繞平臺的國際比賽,。


今年,,曠視聯(lián)合智源研究院舉辦 Detection In the Wild 2019(DIW 2019)挑戰(zhàn)賽。


孫劍介紹,DIW 2019 挑戰(zhàn)賽是基于 2019 年 CVPR 的 workshop(研討會),,為了推動目標(biāo)檢測技術(shù)的發(fā)展而設(shè)計(jì)的,,可以改善現(xiàn)有目標(biāo)檢測數(shù)據(jù)集的類別覆蓋不全,標(biāo)注精度不高,,密集場景缺少等問題,。


DIW 2019 挑戰(zhàn)賽共有三個(gè)賽道:


Objects365 賽道:選手利用公開的 365 種類別,60 萬張圖片超過 1000 萬個(gè)框的完整訓(xùn)練集對檢測模型進(jìn)行訓(xùn)練,;在 3 萬張圖片構(gòu)成的驗(yàn)證集上調(diào)試算法,并在 10 萬張圖片構(gòu)成的測試集上進(jìn)行最終挑戰(zhàn),。

Objects365 小賽道:從 Objects365 數(shù)據(jù)集中挑選出 65 個(gè)類別,,選手可以用 1 萬張圖片進(jìn)行模型訓(xùn)練。

CrowdHuman 賽道:為了解決現(xiàn)實(shí)生活中的遮擋問題,,其算法的提升將會推動人體檢測算法落地,。屆時(shí),選手將基于專門為了密集場景人體檢測設(shè)計(jì)的 CrowdHuman 數(shù)據(jù)集進(jìn)行訓(xùn)練,,數(shù)據(jù)集包含有豐富標(biāo)注信息和多種場景,。


挑戰(zhàn)賽已于發(fā)布會當(dāng)天啟動;5 月 10 日,,將開放測試集,;6 月 12 日,結(jié)果提交截止,;最終結(jié)果將在 6 月 17 日(美國當(dāng)?shù)貢r(shí)間)公布,。每個(gè)賽道的冠軍將獲得 1 萬美金獎(jiǎng)勵(lì),優(yōu)勝隊(duì)伍將被邀請至 CVPR 的研討會上做經(jīng)驗(yàn)分享,。


「智源學(xué)者計(jì)劃」啟動,,

每人每年至少可獲 50 萬支持


發(fā)布會當(dāng)天,智源研究院還啟動了「智源學(xué)者計(jì)劃」,。


「『智源學(xué)者計(jì)劃』的目標(biāo),,就是要找到最好的人,給他自由支配的經(jīng)費(fèi),,提供他需要的資源,,支持開展人工智能領(lǐng)域特定方向上的重大基礎(chǔ)問題研究,或者開展前沿問題的自由探索,?!裹S鐵軍院長說。


「智源學(xué)者計(jì)劃」將依托北京大學(xué),、清華大學(xué),、中科院等優(yōu)勢高校院所,以及曠視等骨干企業(yè)研究院,,對智源科學(xué)家首席(CS),、智源研究項(xiàng)目經(jīng)理(PM),、智源研究員(PI)和智源青年科學(xué)家(38 歲以下)四類人才進(jìn)行重點(diǎn)支持。


經(jīng)過提名,、初評,、審議等流程,已經(jīng)遴選出首批智源學(xué)者候選人,,共 21 人,,并即將啟動公示程序。


據(jù)悉,,首批青年科學(xué)家推選工作開展以來,,清華、北京各單位專家共計(jì)推選了 54 名候選人,,參加答辯 42 人,,經(jīng)專家評審,最終選出了 9 名,。年級最輕的一位僅 28 歲,,是曠視研究院模型研究組負(fù)責(zé)人張祥雨博士。


在官網(wǎng)上進(jìn)行一個(gè)月公示后,,若無意外,,智源研究院將與他們簽訂聘任協(xié)議。


屆時(shí),,智源研究院將直接向他們支付費(fèi)用,,不用走單位的人事體制。黃院長說,,「我們看重他是一個(gè)有潛力的人,,我們就直接給他,大概就是不低于 50 萬的每年的支持力度(每個(gè)人),?!?/p>


這些智源學(xué)者不需要在智源研究院辦公,還在原單位繼續(xù)從事學(xué)術(shù)研究, 成果也全部屬于其所在單位,,「研究院不擁有也不期望去獲得任何知識產(chǎn)權(quán)」,,「因?yàn)樗龅氖侨斯ぶ悄埽欠蠂业膽?zhàn)略方向,,是符合北京市的方向,,所以我們給他支持?!裹S院長說,。


此外,這些智源學(xué)者在科研工作中所需要的經(jīng)費(fèi),也會獲得研究院支持,。黃院長表示,,只要不用到違規(guī),怎么用,,完全由自己決定,。


黃院長還表示,智源學(xué)者的申報(bào)不是每年只有一次,,而是不分批次,,只要是符合要求的人才,通過申報(bào)程序,,可以隨時(shí)進(jìn)入研究院支持的范圍,。

微信圖片_20190421154315.jpg


今年,智源研究院將計(jì)劃遴選智源學(xué)者 100 人,,大概覆蓋 5 到 7 個(gè)重大方向,其中,,青年科學(xué)家 30-50 人,。2020 年和 2021 年再分別增加 100 人,智源學(xué)者總體規(guī)模保持在 300 人左右,。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn),。轉(zhuǎn)載的所有的文章,、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者,。如涉及作品內(nèi)容、版權(quán)和其它問題,,請及時(shí)通過電子郵件或電話通知我們,,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失,。聯(lián)系電話:010-82306118,;郵箱:[email protected]