曠視聯(lián)合智源發(fā)布全球最大物體檢測數(shù)據(jù)集Objects365，舉辦CVPR DIW2019挑戰(zhàn)賽-AET-電子技術(shù)應(yīng)用

曠視聯(lián)合智源發(fā)布全球最大物體檢測數(shù)據(jù)集Objects365，舉辦CVPR DIW2019挑戰(zhàn)賽

日期： 2019-04-21

關(guān)鍵詞： 人工智能 BAAI 圖像感知智能模型設(shè)計(jì)

4 月 16 日，北京智源人工智能研究院（Beijing Academy of Artificial Intelligence，BAAI，2018 年 11 月 14 日成立）在北京會議中心召開了「智源學(xué)者計(jì)劃暨聯(lián)合實(shí)驗(yàn)室發(fā)布會」。

北京智源人工智能研究院（簡稱「智源研究院」）是在科技部和北京市委市政府的指導(dǎo)和支持下，由北京市科委和海淀區(qū)政府推動(dòng)成立，依托北京大學(xué)、清華大學(xué)、中國科學(xué)院、百度、小米、字節(jié)跳動(dòng)、美團(tuán)點(diǎn)評、曠視 MEGVII 等北京人工智能領(lǐng)域優(yōu)勢單位共建的新型研發(fā)機(jī)構(gòu)。

引進(jìn)培育高端人才、共建聯(lián)合實(shí)驗(yàn)室、建設(shè)人工智能社區(qū)、加強(qiáng)產(chǎn)學(xué)研合作，是智源研究院的主要四項(xiàng)任務(wù)。

智源研究院聯(lián)合曠視，

成立智能模型設(shè)計(jì)與圖像感知聯(lián)合實(shí)驗(yàn)室

智源聯(lián)合實(shí)驗(yàn)室分為兩類，分別是與高校院所共建、與優(yōu)勢企業(yè)共建。在聯(lián)合實(shí)驗(yàn)室的建設(shè)上，智源研究院遵循「成熟一個(gè)、啟動(dòng)一個(gè)」的原則，擇優(yōu)支持共建，最多可連續(xù)支持三年。

「北京智源-曠視智能模型設(shè)計(jì)與圖像感知聯(lián)合實(shí)驗(yàn)室」已通過立項(xiàng)論證，成為北京智源聯(lián)合實(shí)驗(yàn)室首個(gè)成功落地的項(xiàng)目，擬由曠視首席科學(xué)家、曠視研究院院長孫劍任實(shí)驗(yàn)室主任，資深研究員周舒暢任實(shí)驗(yàn)室副主任。

微信圖片_20190421154009.jpg

曠視首席科學(xué)家、曠視研究院院長孫劍

孫劍表示，成立這個(gè)實(shí)驗(yàn)室，既有國家戰(zhàn)略層面的考慮，也是為了解決行業(yè)痛點(diǎn)。

2017 年 7 月，國務(wù)院發(fā)布《新一代人工智能發(fā)展規(guī)劃》，人工智能上升為國家戰(zhàn)略。建立開源開放的人工智能開放創(chuàng)新平臺，服務(wù)企業(yè)應(yīng)用技術(shù)開發(fā)成為當(dāng)前該領(lǐng)域的難點(diǎn)。

國家也希望龍頭企業(yè)，通過打造人工智能開源開放創(chuàng)新平臺，調(diào)動(dòng)產(chǎn)學(xué)研，社會各類創(chuàng)新創(chuàng)業(yè)主體參與共同打造我國自主知識產(chǎn)權(quán)的產(chǎn)業(yè)生態(tài)，提升國際影響力，促進(jìn)行業(yè)整體發(fā)展。

而北京市是第一個(gè)國家新一代人工智能創(chuàng)新發(fā)展試驗(yàn)區(qū)，因此希望充分調(diào)動(dòng)北京技術(shù)、人才方面優(yōu)勢，通過組織機(jī)制創(chuàng)新，通過創(chuàng)新舉措，依托龍頭行業(yè)牽引進(jìn)行多主體協(xié)同創(chuàng)新，打造我國乃至全球技術(shù)高地。

現(xiàn)在確實(shí)有大量的高校、研究院所、創(chuàng)新創(chuàng)業(yè)人員和行業(yè)客戶，想?yún)⑴c到人工智能創(chuàng)新中，但苦于沒有數(shù)據(jù)，算力或算法等資源，無法施展。

因此，曠視與智源研究院通過聯(lián)手打造數(shù)據(jù)集和建設(shè)聯(lián)合實(shí)驗(yàn)室，推動(dòng)整個(gè)行業(yè)協(xié)同創(chuàng)新發(fā)展，建設(shè)共性技術(shù)開放創(chuàng)新平臺，構(gòu)建自主可控產(chǎn)業(yè)生態(tài)，突破人工智能重大核心共性關(guān)鍵技術(shù)，推動(dòng)行業(yè)全面演進(jìn)。

全球最大的物體檢測數(shù)據(jù)集 Objects365 發(fā)布

會上，曠視研究院聯(lián)合北京智源人工智能研究院發(fā)布了全球最大的物體監(jiān)測數(shù)據(jù)集 Objects365。

微信圖片_20190421154150.jpg

Objects365 樣例

「我們的目的是打造世界上最大規(guī)模的通用物體數(shù)據(jù)檢測集，做到規(guī)模大、質(zhì)量高、泛化能力強(qiáng)。」

孫劍介紹，「我們第一批定義在生活中最常見的 365 個(gè)類別，比如，室內(nèi)常見的椅子、桌子、茶杯、瓶子都包含在這個(gè)類別中。第一階段，我們已經(jīng)標(biāo)注了超過 60 萬張這樣的圖片，其中這些標(biāo)注框已經(jīng)超過了 1000 萬。」

這個(gè)數(shù)據(jù)集有多大？孫劍將微軟 2014 年創(chuàng)建的大規(guī)模圖像物體檢測數(shù)據(jù)集 COCO 作為參照物，將二者進(jìn)行了對比，「COCO 是目前最大的、全標(biāo)注數(shù)據(jù)集，訓(xùn)練數(shù)據(jù)大概 12 萬，總共數(shù)據(jù)大概不超過 20 萬，其中還有很多數(shù)據(jù)沒有標(biāo)。我們（Objects365）第一期開放（的）圖片數(shù)是 COCO 的 5 倍，標(biāo)注框超過 COCO 的 11 倍。」

微信圖片_20190421154249.jpg

「我們的目標(biāo)是，三年內(nèi)，這個(gè)數(shù)據(jù)集達(dá)到 200 萬張圖片，2400 萬個(gè)標(biāo)注框。」孫劍說。

算法優(yōu)化的上限嚴(yán)重依賴于基準(zhǔn)數(shù)據(jù)集術(shù)的質(zhì)量。為保證標(biāo)注質(zhì)量，在打造 Objects365 時(shí)，曠視設(shè)計(jì)出一套科學(xué)而嚴(yán)格的標(biāo)注流程，每一張圖片的背后至少會經(jīng)過 9 名標(biāo)注工人之手。

此外，作為一個(gè)優(yōu)秀的預(yù)訓(xùn)練數(shù)據(jù)集，Objects365 預(yù)訓(xùn)練模型在使用過程中，可以輕松超越現(xiàn)有算法的精度，顯著加速收斂過程，表現(xiàn)出極強(qiáng)的泛化能力。在執(zhí)行 COCO、VOO Det、CityPersons 等檢測任務(wù)時(shí)，在 VOC Seg 和 ADE 等分割任務(wù)上均有顯著提升。

如何共建聯(lián)合實(shí)驗(yàn)室？

「一個(gè)平臺、四個(gè)突破點(diǎn)」

「北京智源-曠視智能模型設(shè)計(jì)與圖像感知聯(lián)合實(shí)驗(yàn)室將圍繞『一個(gè)平臺、四個(gè)突破點(diǎn)』進(jìn)行建設(shè)。」孫劍介紹道。

「一個(gè)平臺」是指，建設(shè)一體化的數(shù)據(jù)共享、模型設(shè)計(jì)和場景測試的開放創(chuàng)新平臺。

「四個(gè)突破點(diǎn)」是指，在數(shù)據(jù)方向、模型方向、真實(shí)數(shù)據(jù)測試方向和模型部署方向做技術(shù)突破，推進(jìn)大數(shù)據(jù)背景下模型架構(gòu)設(shè)計(jì)、優(yōu)化和部署等方面的研究。

「深度學(xué)習(xí)成不成功，很大程度上取決于數(shù)據(jù)，很多靠算法帶來的提升遠(yuǎn)低于一個(gè)高質(zhì)量的數(shù)據(jù)（集）所能帶來的提升。」孫劍說。

除了最新發(fā)布的 Objects365，曠視此前還發(fā)布了大規(guī)模擁擠場景人體檢測數(shù)據(jù)集 CrowdHuman 及一些數(shù)據(jù)標(biāo)注工具。

實(shí)驗(yàn)室將立足曠視算法落地場景豐富、數(shù)據(jù)積累深厚的優(yōu)勢，以開源數(shù)據(jù)集、預(yù)抽取特征等形式，持續(xù)開放通用物體分類、物體檢測追蹤、人像人形識別屬性等視覺問題數(shù)據(jù)，助力相關(guān)領(lǐng)域研究。

針對高搜索效率、高準(zhǔn)確率、高靈活性等關(guān)鍵指標(biāo)，該實(shí)驗(yàn)室還將開展支持大計(jì)算量模型的新神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索算法（NAS）研究，構(gòu)建一站式深度模型自動(dòng)化設(shè)計(jì)平臺等工作。

該平臺包括面向特定問題的自動(dòng)化深度模型設(shè)計(jì)工具、自動(dòng)化數(shù)據(jù)篩選/數(shù)據(jù)增強(qiáng)工具、自動(dòng)化深度學(xué)習(xí)模型優(yōu)化工具，從而在 Object365 上實(shí)現(xiàn)自動(dòng)訓(xùn)練比純?nèi)斯ふ{(diào)優(yōu)精度超過至少一個(gè)百分點(diǎn)，消耗卡時(shí)不超過三倍的目標(biāo)。

實(shí)驗(yàn)室還將開放眾多預(yù)訓(xùn)練模型，包括 ResNet、ShuffleNet 這樣的基礎(chǔ)模型以及 Faster RCNN、Mask RCNN、SSD 檢測模型。

近年來，模型架構(gòu)搜索（NAS）成為了 AI 領(lǐng)域的熱門研究方向。

不久前，曠視首次披露了 NAS 新成果：單路徑 One-Shot 模型。這是一個(gè)簡單靈活的通用模型搜索框架，支持構(gòu)建塊（building block）、通道（channel）和混合精度（mixed-precision）多搜索空間聯(lián)合搜索；支持任意直接度量方法做硬約束（hard constraint），從而滿足實(shí)際業(yè)務(wù)要求。據(jù)介紹，同等情況下，單路徑 One-Shot NAS 的搜索精度和速度均超過目前公開的 FBNet、ProxylessNAS 等 SOTA 框架。

「很多時(shí)候，我們把一個(gè)技術(shù)（算法）落地，真的是不是能在實(shí)際數(shù)據(jù)中做得很好，其實(shí)不知道的。實(shí)際數(shù)據(jù)中有一些是非公開數(shù)據(jù)，不能到真正的場景中去測；另外一些數(shù)據(jù)涉及到隱私，需要脫敏。」孫劍說，聯(lián)合實(shí)驗(yàn)室的計(jì)劃是，提供一個(gè)實(shí)戰(zhàn)場景開發(fā)和測試環(huán)境，大家上交模型，在這個(gè)環(huán)境中進(jìn)行測試。

聯(lián)合實(shí)驗(yàn)室將建設(shè)人臉抓拍識別、結(jié)構(gòu)化檢測、大規(guī)模人像比對等驗(yàn)證場景，提供自動(dòng)分析報(bào)告服務(wù)，為研究算法調(diào)優(yōu)提供環(huán)境。他們還將積極探索低位寬等網(wǎng)絡(luò)壓縮技術(shù)，研發(fā)高效硬件部署方案，推動(dòng)模型研究成果迅速投入實(shí)用。

針對計(jì)算機(jī)視覺算法與真實(shí)場景適配的問題，實(shí)驗(yàn)室還將建設(shè)可重現(xiàn)的實(shí)景測試環(huán)境，并提供自動(dòng)化的量化錯(cuò)誤分析報(bào)告，幫助算法迭代。

「通過以上措施，實(shí)驗(yàn)室將被打造成為一個(gè)開放、貼近實(shí)際場景的計(jì)算機(jī)視覺算法研究實(shí)驗(yàn)平臺，形成涵蓋數(shù)據(jù)、平臺、場景的完整閉環(huán)，有利于打造我國自主可控的技術(shù)和產(chǎn)業(yè)生態(tài)，共同助力我國圖像感知和計(jì)算領(lǐng)域的技術(shù)及應(yīng)用達(dá)到國際先進(jìn)水平。」孫劍表示，實(shí)驗(yàn)室平臺建成后，將面向高校院所、創(chuàng)業(yè)企業(yè)等創(chuàng)新創(chuàng)業(yè)主體開放，致力推動(dòng)圖像感知與計(jì)算領(lǐng)域的協(xié)同創(chuàng)新。

DIW2019 挑戰(zhàn)賽啟動(dòng)，

3 個(gè)賽道冠軍將各獲 1 萬美金獎(jiǎng)勵(lì)

「我們的目標(biāo)是建設(shè)開源社區(qū)、打造產(chǎn)業(yè)生態(tài)。」孫劍說。

除了開放預(yù)訓(xùn)練模型，開源數(shù)據(jù)標(biāo)注、模型分析、模型自動(dòng)調(diào)優(yōu)等全套相關(guān)工具，他們還將提供實(shí)驗(yàn)例程、開源完整的訓(xùn)練代碼庫，支持高校本科及研究生教學(xué)，每年培訓(xùn)學(xué)生人數(shù)不少于 500 人；每年還會組織圍繞平臺的國際比賽。

今年，曠視聯(lián)合智源研究院舉辦 Detection In the Wild 2019（DIW 2019）挑戰(zhàn)賽。

孫劍介紹，DIW 2019 挑戰(zhàn)賽是基于 2019 年 CVPR 的 workshop（研討會），為了推動(dòng)目標(biāo)檢測技術(shù)的發(fā)展而設(shè)計(jì)的，可以改善現(xiàn)有目標(biāo)檢測數(shù)據(jù)集的類別覆蓋不全，標(biāo)注精度不高，密集場景缺少等問題。

DIW 2019 挑戰(zhàn)賽共有三個(gè)賽道：

Objects365 賽道：選手利用公開的 365 種類別，60 萬張圖片超過 1000 萬個(gè)框的完整訓(xùn)練集對檢測模型進(jìn)行訓(xùn)練；在 3 萬張圖片構(gòu)成的驗(yàn)證集上調(diào)試算法，并在 10 萬張圖片構(gòu)成的測試集上進(jìn)行最終挑戰(zhàn)。

Objects365 小賽道：從 Objects365 數(shù)據(jù)集中挑選出 65 個(gè)類別，選手可以用 1 萬張圖片進(jìn)行模型訓(xùn)練。

CrowdHuman 賽道：為了解決現(xiàn)實(shí)生活中的遮擋問題，其算法的提升將會推動(dòng)人體檢測算法落地。屆時(shí)，選手將基于專門為了密集場景人體檢測設(shè)計(jì)的 CrowdHuman 數(shù)據(jù)集進(jìn)行訓(xùn)練，數(shù)據(jù)集包含有豐富標(biāo)注信息和多種場景。

挑戰(zhàn)賽已于發(fā)布會當(dāng)天啟動(dòng)；5 月 10 日，將開放測試集；6 月 12 日，結(jié)果提交截止；最終結(jié)果將在 6 月 17 日（美國當(dāng)?shù)貢r(shí)間）公布。每個(gè)賽道的冠軍將獲得 1 萬美金獎(jiǎng)勵(lì)，優(yōu)勝隊(duì)伍將被邀請至 CVPR 的研討會上做經(jīng)驗(yàn)分享。

「智源學(xué)者計(jì)劃」啟動(dòng)，

每人每年至少可獲 50 萬支持

發(fā)布會當(dāng)天，智源研究院還啟動(dòng)了「智源學(xué)者計(jì)劃」。

「『智源學(xué)者計(jì)劃』的目標(biāo)，就是要找到最好的人，給他自由支配的經(jīng)費(fèi)，提供他需要的資源，支持開展人工智能領(lǐng)域特定方向上的重大基礎(chǔ)問題研究，或者開展前沿問題的自由探索。」黃鐵軍院長說。

「智源學(xué)者計(jì)劃」將依托北京大學(xué)、清華大學(xué)、中科院等優(yōu)勢高校院所，以及曠視等骨干企業(yè)研究院，對智源科學(xué)家首席（CS）、智源研究項(xiàng)目經(jīng)理（PM）、智源研究員（PI）和智源青年科學(xué)家（38 歲以下）四類人才進(jìn)行重點(diǎn)支持。

經(jīng)過提名、初評、審議等流程，已經(jīng)遴選出首批智源學(xué)者候選人，共 21 人，并即將啟動(dòng)公示程序。

據(jù)悉，首批青年科學(xué)家推選工作開展以來，清華、北京各單位專家共計(jì)推選了 54 名候選人，參加答辯 42 人，經(jīng)專家評審，最終選出了 9 名。年級最輕的一位僅 28 歲，是曠視研究院模型研究組負(fù)責(zé)人張祥雨博士。

在官網(wǎng)上進(jìn)行一個(gè)月公示后，若無意外，智源研究院將與他們簽訂聘任協(xié)議。

屆時(shí)，智源研究院將直接向他們支付費(fèi)用，不用走單位的人事體制。黃院長說，「我們看重他是一個(gè)有潛力的人，我們就直接給他，大概就是不低于 50 萬的每年的支持力度（每個(gè)人）。」

這些智源學(xué)者不需要在智源研究院辦公，還在原單位繼續(xù)從事學(xué)術(shù)研究, 成果也全部屬于其所在單位，「研究院不擁有也不期望去獲得任何知識產(chǎn)權(quán)」，「因?yàn)樗龅氖侨斯ぶ悄埽欠蠂业膽?zhàn)略方向，是符合北京市的方向，所以我們給他支持。」黃院長說。

此外，這些智源學(xué)者在科研工作中所需要的經(jīng)費(fèi)，也會獲得研究院支持。黃院長表示，只要不用到違規(guī)，怎么用，完全由自己決定。

黃院長還表示，智源學(xué)者的申報(bào)不是每年只有一次，而是不分批次，只要是符合要求的人才，通過申報(bào)程序，可以隨時(shí)進(jìn)入研究院支持的范圍。

微信圖片_20190421154315.jpg

今年，智源研究院將計(jì)劃遴選智源學(xué)者 100 人，大概覆蓋 5 到 7 個(gè)重大方向，其中，青年科學(xué)家 30-50 人。2020 年和 2021 年再分別增加 100 人，智源學(xué)者總體規(guī)模保持在 300 人左右。

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請及時(shí)通過電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：[email protected]。

曠視聯(lián)合智源發(fā)布全球最大物體檢測數(shù)據(jù)集Objects365，舉辦CVPR DIW2019挑戰(zhàn)賽

日期： 2019-04-21

相關(guān)內(nèi)容