在最新的一期《麻省理工科技評(píng)論》評(píng)選出的2017年最聰明的50家公司中,,除了大家耳熟能詳Google,、Apple、Amazon,、Alibaba等巨頭,,以及NVdia、Telsa,、SpaceX等明星公司外,,還有一家看似不起眼的公司引起了我們的注意——Sophia Genetics。
這是一家總部位于瑞士洛桑的的生物醫(yī)藥公司,,成立于2011年,,主營(yíng)業(yè)務(wù)是幫助醫(yī)療機(jī)構(gòu)建立基因分析系統(tǒng),協(xié)助其利用機(jī)器學(xué)習(xí)技術(shù)分析患者基因數(shù)據(jù),,給出診療建議,。2017年9月該公司拿到歐洲知名風(fēng)投機(jī)構(gòu)Balderton的3000萬(wàn)美元的D輪融資。
過(guò)去兩年里AI和基因熱度不減,,這兩個(gè)領(lǐng)域似乎在世界范圍內(nèi)都不是新鮮事,,為何唯獨(dú)選擇了Sophia Genetics?
智能,,平臺(tái)與隱私
智能
當(dāng)我們對(duì)給定樣本測(cè)序完畢后,,基因測(cè)序診斷分析一般要經(jīng)過(guò)三個(gè)步驟:序列比對(duì)(Alignment)—變體識(shí)別(Variant Calling)—診斷預(yù)測(cè)(predictions)。
每一個(gè)部分都有對(duì)應(yīng)的通用算法,。但是由于基因種類(lèi)太多,這些通用算法的效果并不讓人十分滿意,。
Sophia Genetics于是抓住了這個(gè)痛點(diǎn),,研制出了三款以人工智能為基礎(chǔ)的基因分析專(zhuān)利技術(shù):PEPPER?, MUSKAT? 和 MOKA?,分別是為了識(shí)別單核苷酸多態(tài)性變異與刪除(SNP and INDEL),,識(shí)別拷貝變異數(shù)(CNV)以及對(duì)基因的變異進(jìn)行嚴(yán)重性的評(píng)估,。
編者注:單核苷酸多態(tài)性變異,,堿基的刪除,拷貝變異都是基因突變的種類(lèi),。分析基因,,很大程度上就是在找到這些突變基因,并且評(píng)估他們會(huì)帶來(lái)的潛在危險(xiǎn),。)
由于筆者未能在網(wǎng)上找到其專(zhuān)利數(shù)據(jù),,因此不能做出進(jìn)一步分析,但是根據(jù)官網(wǎng)顯示,,這些技術(shù)能夠?qū)崿F(xiàn)99%以上的準(zhǔn)確率,。
Sophia Genetics CEO Dr. Jurgi Camblong
Sophia Genetics的聯(lián)合創(chuàng)始人之一,現(xiàn)任CEO Jurgi Camblong博士在一次采訪中談到,,智能算法作為企業(yè)的核心技術(shù),,他們投入了大量精力進(jìn)行研發(fā)。
為了得到適用范圍更廣的算法,,他們花費(fèi)幾年時(shí)間組織專(zhuān)家一起標(biāo)注了來(lái)自10000名患者的近50000條基因信息,,從最底層開(kāi)始設(shè)計(jì)算法,以求完全理解每一個(gè)細(xì)節(jié),。
功夫沒(méi)有白費(fèi),,Sohpia公司智能算法對(duì)基因變體的分類(lèi)準(zhǔn)確率由原來(lái)的85%上升到99%。
Jurgi 面對(duì)媒體采訪時(shí),,表示“正是這種一步步從底層開(kāi)始建立模型,,融合專(zhuān)業(yè)知識(shí),力求了解每一個(gè)細(xì)節(jié)的技術(shù)堅(jiān)持,,讓他們和領(lǐng)域內(nèi)其他的公司區(qū)分開(kāi)來(lái),。”
投資方Balderton的合伙人James Wise也對(duì)媒體表示,,Sophia Genetics 最吸引他們的一點(diǎn)在于,,他們的算法能夠處理來(lái)自各種不同測(cè)序儀的基因數(shù)據(jù),并且給出的預(yù)測(cè)已經(jīng)達(dá)到可供臨床使用的準(zhǔn)確率,。
目前,,Sophia Genetics主打腫瘤,遺傳性癌癥,,心血管疾病,,代謝疾病,兒科疾病五大門(mén)類(lèi)的基因輔助診斷與智能預(yù)測(cè),。
涉及的疾病診斷門(mén)類(lèi)
平臺(tái)
如果說(shuō)對(duì)技術(shù)的執(zhí)著是Sophia Genetics能夠脫穎而出的底氣與資本,,準(zhǔn)確把握醫(yī)院需求,建立共享平臺(tái)則是其對(duì)未來(lái)的憧憬與投資。
Sophia DDM是公司推出的一款平臺(tái),。DDM代表 Data-Driven for Medicine (以數(shù)據(jù)驅(qū)動(dòng)醫(yī)療),,反映了公司的愿景。
上述提到的智能算法,,都包含在這款平臺(tái)上,。Sophia Genetics瞄準(zhǔn)的是B端的醫(yī)療機(jī)構(gòu),其核心業(yè)務(wù)就是通過(guò)幫助那些有測(cè)序條件的醫(yī)療機(jī)構(gòu),,接入SophiaDDM平臺(tái),,從而使得醫(yī)務(wù)工作人員能夠快速準(zhǔn)確得對(duì)基因進(jìn)行分析。
在醫(yī)生上傳基因數(shù)據(jù)的同時(shí),,其實(shí)也同時(shí)貢獻(xiàn)了一條新的基因數(shù)據(jù),,并且很有可能會(huì)給出自己的診斷結(jié)果。
這樣一來(lái),,隨著使用DDM平臺(tái)進(jìn)行分析的人數(shù)越來(lái)越多,,后臺(tái)積累的標(biāo)注過(guò)的數(shù)據(jù)也越多,底層的智能算法,,得益于高質(zhì)量的數(shù)據(jù),,表現(xiàn)也會(huì)越來(lái)越好,由此形成了一個(gè)良性循環(huán),。
當(dāng)被問(wèn)到為何要如此堅(jiān)定的推進(jìn)平臺(tái),,提供軟件服務(wù),Camblong 表示,,隨著測(cè)序成本的不斷下降,,人們獲取自己的基因信息也變得越發(fā)容易,這也就意味著市場(chǎng)上必然會(huì)有大量的對(duì)于快速,、準(zhǔn)確的基因分析算法的需求,。
好的基因分析算法離不開(kāi)專(zhuān)業(yè)知識(shí)和優(yōu)質(zhì)的數(shù)據(jù)。因此,,如果能夠與醫(yī)院建立良好的聯(lián)系,,幫助醫(yī)院建立系統(tǒng),去分析患者的基因數(shù)據(jù),,這樣一方面得到了患者的數(shù)據(jù),,另外一方面還能夠利用醫(yī)生的專(zhuān)業(yè)知識(shí)對(duì)基因進(jìn)行標(biāo)注。
平臺(tái)連接的醫(yī)院越多,,儲(chǔ)存的基因數(shù)據(jù),,凝結(jié)的專(zhuān)業(yè)知識(shí)也越多,由此訓(xùn)練出的算法更加智能,,能夠吸引的醫(yī)院也更多,。這是一個(gè)自激過(guò)程,。
當(dāng)然,,Camblong 坦言,,這個(gè)過(guò)程并不輕松。
這是一個(gè)先有雞還是先有蛋的過(guò)程—也就是說(shuō),,如何在診斷算法表現(xiàn)并不突出的情況下,,和醫(yī)院建立好的聯(lián)系?Camblong給的答案是,,發(fā)現(xiàn)醫(yī)院當(dāng)時(shí)在基因分析中面臨的最大問(wèn)題,,先解決這個(gè)痛點(diǎn)!
在當(dāng)時(shí)2011年,,他們發(fā)現(xiàn)的痛點(diǎn)的是,,醫(yī)院里采集的基因數(shù)據(jù)精度太低了,噪聲太大,。因此團(tuán)隊(duì)便在早期專(zhuān)門(mén)設(shè)計(jì)算法來(lái)解決提高采集基因數(shù)據(jù)的準(zhǔn)確率,。早期的幫助于是換來(lái)了醫(yī)院的長(zhǎng)期信賴(lài)與支持。
2011年公司成立,。從2014年初推出平臺(tái),,到2014年底平臺(tái)上就有了50家醫(yī)院。而現(xiàn)在,,這個(gè)數(shù)字已經(jīng)上升到了400,。
這400家醫(yī)院分部于全世界55個(gè)國(guó)家,截至發(fā)稿,,官網(wǎng)上顯示,,已經(jīng)有167000名患者通過(guò)DDM平臺(tái)得到了診斷。
Sophia Genetics號(hào)稱(chēng)要推進(jìn)基因測(cè)序分析的“去中心化”,,要建立世界上最大的臨床基因社區(qū),,讓基因密碼真正服務(wù)于臨床診斷,幫助更多的患者盡早擺脫病魔,。
對(duì)一個(gè)尚處在D輪融資階段的公司來(lái)說(shuō),,這個(gè)愿景十分遠(yuǎn)大,但是我們卻確實(shí)能夠看到Sophia Genetics在一步步得推進(jìn)自己的平臺(tái)帝國(guó),。
隱私
在平臺(tái)共享基因數(shù)據(jù),,這個(gè)想法很讓人心動(dòng)。但是,,隨之帶來(lái)最大的麻煩就是基因數(shù)據(jù)的隱私安全問(wèn)題,。
自從基因分析走入人們視線以來(lái),有關(guān)基因數(shù)據(jù)的隱私安全,,倫理道德的討論就不絕于耳,。Sophia Genetics也想到了這一點(diǎn),,隱私安全是它的第三項(xiàng)法寶。最后簡(jiǎn)單介紹一下Sophia Genetics在用戶(hù)數(shù)據(jù)隱私上的考量,。
Sophia Genetics的信息安全管理體系拿到了ISO27001的國(guó)際認(rèn)證,。
同時(shí),它和洛桑聯(lián)邦理工學(xué)院信息安全相關(guān)專(zhuān)家,,斯坦福大學(xué)的生物醫(yī)學(xué)專(zhuān)家正在共同研發(fā)一款能夠保障在全球范圍內(nèi)儲(chǔ)存獲取平臺(tái)上基因數(shù)據(jù)的信息安全技術(shù)(SECRAM, Selective retrieval on Encrypted and Compressed Reference-oriented Alignment Map,,有專(zhuān)利信息)。
公司承諾,,所有的私密信息都將在私有的數(shù)據(jù)中心,,至少保存5年,同時(shí)嚴(yán)格限制讀取,。所有患者的個(gè)人信息將不會(huì)以任何形式披露,。
Camblong 表示,在這個(gè)行業(yè)已經(jīng)有一些公司做了不好的示范,,沒(méi)能保護(hù)好患者的數(shù)據(jù),,公司因此非常重視隱私問(wèn)題。
Sophia Genetics也永遠(yuǎn)不會(huì)考慮面向C端個(gè)人客戶(hù),,他們堅(jiān)信,,大的醫(yī)療機(jī)構(gòu)始終能夠吸納更多客戶(hù),與這些大型醫(yī)療機(jī)構(gòu)打交道也會(huì)讓信息安保流程更加可靠,。
尾聲
在被問(wèn)到對(duì)公司未來(lái)發(fā)展的規(guī)劃時(shí),,Camblong談到,希望在推進(jìn)DDM平臺(tái)的同時(shí),,強(qiáng)化多層次醫(yī)療數(shù)據(jù)的處理能力,。
具體來(lái)說(shuō),希望能夠綜合醫(yī)學(xué)影像數(shù)據(jù)和基因數(shù)據(jù),,從而從多個(gè)角度為臨床提供參考和決策信息,。
比如,借助影像數(shù)據(jù)和基因信息,,醫(yī)生可以得知腫瘤在未來(lái)的一段時(shí)間內(nèi)的生長(zhǎng)情況,,由此決定是否要立刻實(shí)施手術(shù)。這也是所謂精準(zhǔn)醫(yī)療的應(yīng)用場(chǎng)景,。
Sophia在希臘語(yǔ)中是智慧的意思,,我們也衷心希望,未來(lái)有那么一天,,能像Jurgi Camblong 希望的那樣,,我們能夠參透基因密碼告訴我們的所有信息,從而更好得戰(zhàn)勝病魔,,面對(duì)未來(lái),。