驅(qū)雷策電馭水火,,碎裂大地分全球。在技術的發(fā)展歷程中,,技術與人的關系不斷發(fā)生演變,。在技術處于機器的時代中,人雖然生產(chǎn)了機器,,但也僅僅能俯瞰機器,。隨著技術與市場的推進,人機之間的關系逐漸得到改善,。未來伴隨著生物工程,、人工智能和會聚技術的發(fā)展,人類與技術的距離將越來越近,。
尤其在中國這個特殊的國度,,擁有著網(wǎng)民最多、移動互聯(lián)網(wǎng)應用最為發(fā)達,、語言最為復雜的環(huán)境,,人工智能迎來了獨立發(fā)展的最佳時機。在這樣的背景下,,近年來市場中不斷涌現(xiàn)出以人工智能為發(fā)展定位的新興企業(yè),,而這些企業(yè)的領軍人往往以80后、90后居多,。
曠視科技有限公司商務總監(jiān)宋晨
曾經(jīng)有人這么說過,,所有的模型都能計算,但是唯一不能被計算的就是年輕的互聯(lián)網(wǎng)創(chuàng)業(yè)者的潛力,,這些年輕企業(yè)的生命力,、創(chuàng)造力讓大眾眼前一亮,而曠視科技有限公司(以下簡稱“曠視科技”)便是這群年輕生力軍中的佼佼者,,以機器視覺與人工智能為核心,,在短短的四年內(nèi),成為全球領先的人臉識別及深度學習技術服務的領跑者。
“先讓機器看懂世界,,再讓機器真正思考”是曠視科技成立的初衷,,隨著近四年的探索,以技術為驅(qū)動,,目前曠視科技已經(jīng)真正地將人臉識別技術進行商業(yè)化,,從支付寶到平安信貸,再到近期的杭州G20峰會,,讓全社會興起一股“刷臉”的熱潮,。
曠視科技公司一角
人工智能“看得見”的未來
人工智能涵蓋范圍較廣,機器視覺作為其核心技術,,已經(jīng)在虛擬現(xiàn)實,、無人駕駛汽車、機器人,、智慧城市以及物聯(lián)網(wǎng)中看到它的成功應用,。機器視覺,簡單地理解便是利用機器代替人眼進行測量與判斷,。
自2010年伊始,中國機器視覺市場進入快速發(fā)展的軌道,,經(jīng)過4-5年的孕育及積累,,電子制造、市政交通,、汽車,、食品等眾多行業(yè)的需求帶動著該市場的增長,其也被視為未來的藍海,。在安防領域,,圍繞著機器視覺,已經(jīng)有不少廠商正在發(fā)力金融,、地產(chǎn),、安防、機器人,、智能汽車等領域,。在此趨勢下,曠視科技將人臉識別的技術優(yōu)勢進行商業(yè)化,,向著人工智能大步邁進,,目前已經(jīng)在金融、商業(yè)樓宇,、安防等領域初露鋒芒,。
曠視科技前臺
近幾年來,人臉識別技術早已經(jīng)不是讓人望而止步的高深技術,在各類手機應用,、公司考勤,、銀行業(yè)務中隨處可見,徹底改變了傳統(tǒng)的生活習慣,、業(yè)務辦理方式,,讓生活更加的便捷及科技化。但相比這些,,人臉識別發(fā)展的歷程卻鮮為人知,,曠視科技有限公司商務總監(jiān)宋晨認為,從技術的誕生到目前的商業(yè)化應用,,其實已經(jīng)走過至少四個階段,。
“第一階段是在2011年前后,人臉識別公司更多強調(diào)的是自身算法的排名,,標榜的是自身算法的層級,,但卻忽視了算法結(jié)果是在實驗室場景下產(chǎn)生的,距離真正的應用和產(chǎn)品化仍然有段距離,;第二階段的特征是圍繞軟件,,通過打包軟件或者SDK讓用戶能實現(xiàn)人臉識別功能,但缺陷在于僅僅提供了軟件和算法,,卻沒有告知用戶具體的適應場景(識別距離,、光線問題等),軟件與用戶業(yè)務邏輯上的結(jié)合度較低,;第三個階段是既提高算法和軟件也提供單一的產(chǎn)品,,例如刷臉門禁產(chǎn)品,也實現(xiàn)了在非配合的情況下的精準識別,,但由于一個簡單的識別功能,,未能給用戶的業(yè)務邏輯帶來更多的幫助,所以其使用很受限制,;第四個階段便是端到端整體的人工智能解決方案,,例如在企業(yè)、樓宇,、園區(qū)的行業(yè)解決方案中,,從訪客刷臉注冊開始,系統(tǒng)便將信息推送給拜訪對象,,訪客在無需任何他人幫助下便能刷臉通過閘機通道,,梯控也會自動設定到指定樓層,通過樓層的電子指引,,到達拜訪地點,,迎賓的前臺便會工作,,一整套的端到端的人臉識別的邏輯,大大減少人力投入,,讓訪客拜訪更加便捷,。廠商在這個階段不僅需要提供標準軟件層級的支持(標準API接口調(diào)用),而且還掌握接口的調(diào)取實現(xiàn)的具體效果,,減少后期的開發(fā)工作,。”宋晨分析,。
雖然這四個階段的趨勢已經(jīng)非常明顯,,但如果從一些企業(yè)的宣傳文案上來看,目前一些公司仍停留在算法階段,,更多的聚焦在一到三階段,。“如果僅僅停留在早期的階段,,則無法形成行業(yè)或者生態(tài)的平臺效應,,曠視科技在2011年成立公司之后,一直聚焦人臉識別技術,,目前已經(jīng)擁有了較深的技術積累,,并把目光聚焦在三與四的階段,為用戶在端到端的方案中提供標準性的接口,?!?/p>
從技術角度上看,人臉識別準確率已經(jīng)超過了人眼的水平,,據(jù)悉,目前在金融,、安防等領域已經(jīng)在擬定相關的行業(yè)標準,,未來更多的規(guī)模化應用及生態(tài)建設將不斷成熟,。
曠視科技公司一角
三箭齊發(fā)技術轉(zhuǎn)化商業(yè)價值
人臉識別在商業(yè)領域的運用,,其實并不是近幾年的事。早在許多年前,,國外眾多優(yōu)秀的廠商早以自身的技術優(yōu)勢躋身行業(yè),,形成自身的生態(tài)鏈。初生之犢不懼虎,,曠視科技對此并沒有畏懼,,他們相信技術的壁壘會隨著科技的發(fā)展不斷消失,而用戶將逐步成熟,,重視服務的性價比,,而這便是他們與國外廠商最大的競爭優(yōu)勢,。“在華為進軍通訊行業(yè)之前,,國外廠商的供應鏈,、生產(chǎn)、客戶,,海外大廠已經(jīng)形成了一套完整的方法論和客戶壁壘,,市場猶如‘死海’,,為什么華為能夠成功地打入呢,?一方面是華為不斷縮短與國外廠商的技術差距,另一方面,,華為重視服務的性價比,,提供吻合客戶需求的服務,用戶無需過多為超出需求范圍的內(nèi)容埋單,?!彼纬拷忉尅K硎?,曠視也將秉持自身的觀念,,堅持性價比,重視客戶實際需求,,不讓超額的服務成為用戶的累贅,。
曠視科技公司一角
“人工智能技術要轉(zhuǎn)化為生產(chǎn)力和商業(yè)價值,必須依附于不同的行業(yè)與產(chǎn)品之中,,形成數(shù)據(jù),、技術、產(chǎn)品不斷循環(huán)的滾雪式閉環(huán),?!彼纬空f。目前整個人臉識別行業(yè)中,,雖然每家企業(yè)宣稱的不太一致,,但如果從本質(zhì)上而言,大致可以分為以下三個重要的領域,。
其一,,泛金融領域,強調(diào)的是人證的核身,。隨著互聯(lián)網(wǎng)技術的發(fā)展,,互聯(lián)網(wǎng)金融不斷興起,諸如支付寶等金融機構(gòu)并沒有傳統(tǒng)金融機構(gòu)的線下營業(yè)廳,,為了保證遠程開戶人員信息的準確性,,過往傳統(tǒng)的機構(gòu)采取的是網(wǎng)絡視頻的方式,,雖然通過人工遠程視頻通話可以解決問題,但其投入的人工成本也較高,,隨著互聯(lián)網(wǎng)金融用戶的增加,,僅僅依靠人力并不是良性發(fā)展的現(xiàn)象。例如曠視的合作伙伴南京銀行,,便將人臉識別技術用于手機銀行,、信用卡、柜面網(wǎng)點,、以及發(fā)卡機等業(yè)務流程中,。據(jù)南京銀行相關負責人表示,當客戶無法親臨柜面或者沒有帶身份證件時完全可以通過移動終端或智能機具進行身份驗證,,先進的人臉識別技術可以在幾秒之內(nèi)完成客戶的身份驗證,,相比人工肉眼識別更精準高效。
其二,,泛商業(yè)領域,,根據(jù)商業(yè)應用場景的不同,人臉識別為用戶提供不同的服務:智能企業(yè)核心是訪客的權(quán)限管理,,例如通過人臉識別結(jié)合傳統(tǒng)的門禁,、考勤、訪客注冊等,,形成高效便捷的生態(tài)環(huán)境,;智能小區(qū)強調(diào)的則是通過非接觸式(非侵犯式的)人臉識別,圍繞業(yè)主營造門禁,、迎賓,、物業(yè)通知(水電費通知、車庫信息等)等更加友好自然的生活體驗,;在消費場景中,,大型連鎖店用戶為了更好地識別VIP客戶,獲取更精準的數(shù)據(jù)分析(消費者行為,、年齡性別、VIP客戶識別等),,人臉識別技術讓線下實體商家能像電商一樣掌握每個節(jié)點的數(shù)據(jù),,提升自身銷售轉(zhuǎn)化率。
為了讓筆者更詳細的了解實際情況,,宋晨分別舉出案例來分享,,在不久前,某全國性股份制商業(yè)銀行引用了曠視科技(Face++)的配合式人臉識別智能管理系統(tǒng),,實現(xiàn)了無卡考勤,、迎賓系統(tǒng),、門禁等應用,員工可通過人臉識別,,進出公司,。銀行采用的方案是針對白名單的比對和識別,這種方式主要應用于包括銀行,、機房,、財務室,甚至工地等具有較高安保要求的場所,。除此之外,,此解決方案還可以為客戶提供陌生人提醒功能。也就是說,,當白名單之外的人來申請授權(quán)的時候,,管理員會收到相應提醒,針對以往‘蹭卡進門’的不安全事件將會得以有效控制,,以此提升安全等級,。而在商超行業(yè)中,用戶畫像一直是商家的痛點,,曠視科技已與某國際連鎖快餐品牌展開深度合作,,為該店提供客流分析和VIP識別服務。為線下客群進行實時標注,,包括性別,、年齡、身高等特征信息,。而這種對于用戶信息畫像的數(shù)據(jù)服務,,已經(jīng)從零售行業(yè)最先迸發(fā)出來。
其三,,泛安防領域,,人臉識別技術運用較多的是在與行政機關以及公安部對接的智慧城市項目中。其主要結(jié)合公安部的嫌犯的黑名單,,在公共交通的出入口處,,部署攝像頭,通過攝像頭抓拍人像,,從而進行比對,,快速鎖定犯罪嫌疑人。
“圍繞著三個領域的生態(tài)鏈建設,,覆蓋人的工作環(huán)境,、生活環(huán)境、消費場景的生活狀態(tài),,打通這三者的數(shù)據(jù)鏈條之后,,便會有征信,、精準營銷的業(yè)務,為更多用戶提供咨詢及服務,,這便是公司的最終的戰(zhàn)略目標——成為一間真正的數(shù)據(jù)運營公司,。”宋晨說,。
除了依靠自身在行業(yè)戰(zhàn)略中部署外,,曠視科技也在尋找合適的合作伙伴,形成更好的物理層級,、產(chǎn)品層級,、應用邏輯層級的開放生態(tài)環(huán)境和平臺?!叭绻枰衙總€行業(yè)都做得同樣深與透,,這對企業(yè)而言無形中是巨大的挑戰(zhàn),所以我們希望能找到行業(yè)內(nèi)有標桿和旗幟影響力的企業(yè),,能共同滿足用戶更深層次的需求,。”宋晨透露,。
產(chǎn)業(yè)生態(tài)鏈的健康發(fā)展本是如此,,曠視科技通過開放的平臺,將更多的感應器件接入進來,,通過結(jié)構(gòu)化的數(shù)據(jù)支撐上層應用和業(yè)務邏輯,,充分發(fā)揮出自己的所長,也讓更多的合作伙伴受惠,?!拔覀兊暮献骰锇橹饕幸韵氯悾阂粸榫哂锌蛻糍Y源但沒有開發(fā)能力(交付能力)的,合作主要集中在銷售渠道的建設,,通過曠視科技的產(chǎn)品以及技術平臺,,其利用原有客戶資源形成銷售網(wǎng)絡;二為沒有客戶資源,,但擁有系統(tǒng)集成能力的,,可以將我們的核心技術集成到他們的系統(tǒng)方案之中,例如在學校行業(yè)方案中的考勤以及訪客登記中加入人臉識別技術等,,形成差異化優(yōu)勢,;三為既有客戶資源又有系統(tǒng)集成能力(交付能力),可以將曠視的核心技術和產(chǎn)品在自身的銷售網(wǎng)絡中去強化競爭力,,形成聯(lián)合品牌的生態(tài)產(chǎn)品,例如人臉識別閘機,、機器人等,,這些生態(tài)產(chǎn)品以雙方的logo呈現(xiàn),,結(jié)合他們的行業(yè)優(yōu)勢和曠視的人工智能優(yōu)勢,快速建立起新的生態(tài),?!彼纬垦a充。[page]
軟硬結(jié)合打造最佳的人臉識別體驗
人臉識別技術已經(jīng)發(fā)展多年,,過去在靜態(tài)識別技術日趨成熟,,但在動態(tài)識別中發(fā)展較為平緩,市場并沒有取得實質(zhì)性的突破,,主要應用也僅停留在靜態(tài)的識別之中,,但在2011年之后,國內(nèi)動態(tài)識別技術如雨后春筍般發(fā)展開來,,尤其在平安城市,、智慧城市中,面對越來越復雜的環(huán)境,,人臉識別的實戰(zhàn)能力得到用戶的一致認可,。
眾所周知,相比靜態(tài)識別,,動態(tài)識別中非配合與精準識別為其最大挑戰(zhàn),,這不僅關系到用戶的體驗度,也是技術發(fā)展的難點,。雖然目前識別率并不能達到100%正確,,但隨著數(shù)據(jù)的積累,識別率將不斷朝著這一方向發(fā)展,?!俺思夹g本身,前端硬件的挑戰(zhàn)也是無需置疑的,。人工智能下的人臉識別并不是在某個場景下抓拍部分人臉的特征,,結(jié)合在另一個場景下抓拍的特征,拼在一起進行比對,。而是通過在每秒25-30幀的動態(tài)識別中,,關注人的變化,如果人在這過程中達到質(zhì)量判斷(機器判斷是否有效的照片)的閾值,,那系統(tǒng)便可以進行人臉判斷和識別,,如果沒有達到,工作將繼續(xù)與算法服務器進行比對,。但如果因為攝像頭的問題,,這點在技術上是無法改變的。”宋晨補充,,“針對這種情況,,我們除了基于軟件及算法的優(yōu)化,加強質(zhì)量判斷的方式之外,,也會基于硬件的優(yōu)化(寬動態(tài),、逆光曝光調(diào)節(jié)等),讓更多攝像頭保持位置不變的前提下,,改善動態(tài)識別的效果,。”
雖然開放的平臺和技術,,在理論上賦予任何系統(tǒng)都不會存在問題,,但如果本身硬件的性能限制,動態(tài)人臉識別的效果必然會大打折扣,。宋晨提到,,為了更好地搭配后端的算法處理器,曠視科技創(chuàng)造性地推出了模塊化智能攝像機(MegviiC1),,可以根據(jù)不同的場景更換不同的攝像頭與算法處理器,,形成最佳以及最具性價比的方案?!耙驗楹芏嗲闆r下,,其他廠商的硬件與我們的軟件的適配程度會出現(xiàn)一些問題,所以我們推出與算法處理器適配最好的攝像機,。但我們對于其他品牌的態(tài)度是非常開放的,,如果某個行業(yè)的合作伙伴,其硬件能夠匹配到我們軟件,,我們也會積極地提供軟件支持,,形成不同的方案,覆蓋到其他的行業(yè)中去,?!?/p>
人工智能的未來:賦能+激活+創(chuàng)新
在過去的幾十年里,人工智能還只是“存活”在好萊塢的科幻大片中,,但自2014年谷歌以4億美元收購人工智能創(chuàng)業(yè)公司DeepMind,,到其旗下的機器人Alphago大戰(zhàn)李世石并獲取最終勝利開始,預示著人工智能的爆發(fā)已經(jīng)成為了現(xiàn)實,,它正不斷走進我們的生活中來,。
牛津大學相關專家稱,在不久的將來,,人工智能可能將占據(jù)美國近一半的就業(yè)機會,,意味該領域未來潛在著巨大的商業(yè)價值,。然而,更重要的是人工智能絕不僅僅是模仿人類從而取代人類,,而是利用龐大的數(shù)據(jù)推算出比人類更好的判斷,,但目前市場關于人工智能定義不一,甚至一些產(chǎn)品及功能在嚴格意義上與智能絲毫不沾邊,,但也被冠以“人工智能”之名。
宋晨認為,,目前依賴數(shù)據(jù),,是人工智能的一個重要因素,但人工智能絕不是簡單的編程程序,,而是更像一個不斷學習的小孩,,通過各種數(shù)據(jù)來提升訓練引擎的精準度,形成自動判別的能力,,當數(shù)據(jù)量足夠大的時候,,它什么都學得會,最終不再需要數(shù)據(jù)訓練,,能不斷進行數(shù)據(jù)循環(huán),,為新的商業(yè)模式造血和營造應用場景。
簡單地理解便是,,人工智能通過數(shù)據(jù)來提升自身的算法和技術,,先有數(shù)據(jù)產(chǎn)生,再有產(chǎn)品誕生,,然后有客戶使用,,客戶在使用之后又會產(chǎn)生新的數(shù)據(jù),這些新數(shù)據(jù)又會優(yōu)化產(chǎn)品,,最終提升客戶的體驗,,形成一個閉合循環(huán)的環(huán)狀生態(tài)。
盡管海外人工智能的起步要比國內(nèi)快,,但因為這樣的環(huán)狀生態(tài),,中國市場產(chǎn)生的群體數(shù)據(jù)量是最大的,所以國內(nèi)的廠商的加速度會比國外走得更快,,而且數(shù)據(jù)的獲得更加的容易和豐富,,甚至在某些領域,國內(nèi)的技術已經(jīng)超越了國外,。
宋晨強調(diào),,這正是人工智能的魅力——數(shù)據(jù)不僅能提升系統(tǒng)的精準度,而且還能產(chǎn)生新的商業(yè)價值,?!袄缙髽I(yè)拿到年齡及性別數(shù)據(jù),,不僅可以提升系統(tǒng)的判斷,也能通過設計商業(yè)模式將數(shù)據(jù)進行營銷,,讓數(shù)據(jù)賦上行業(yè)的屬性,。數(shù)據(jù)除了正向循環(huán)之外,環(huán)也會越來越多,,根據(jù)功能(訓練系統(tǒng),、商業(yè)體外循環(huán)等)能為企業(yè)帶來更多的收益?!?/p>
“我們專注在人工智能的視覺模塊,,通過人臉識別技術賦予在傳統(tǒng)的攝像頭或者門禁產(chǎn)品上,形成完整的業(yè)務生態(tài),,而不是簡單的單品或者概念,。”宋晨說,。萬物互聯(lián),,傳統(tǒng)的物品被賦能、激活,、創(chuàng)新,,讓傳統(tǒng)場景、傳統(tǒng)產(chǎn)品獲得新的使命,,這便是曠視科技眼中的人工智能,。而現(xiàn)在前路已經(jīng)浮現(xiàn)曙光,曠視科技也將向著初心一直走下去,。