今年是新修訂的《醫(yī)療器械監(jiān)督管理條例》施行的第一年,企業(yè)的質量主體責任更加突出,產(chǎn)品的驗證與確認活動趨于多元化,,對標準規(guī)范的需求更加強烈,。在人工智能醫(yī)療器械監(jiān)管研究方面,國家藥監(jiān)局取得了豐碩的成果,,圍繞產(chǎn)品的分類界定,、審評審批等發(fā)布了多個指導原則的征求意見稿。在國家政策與監(jiān)管科學的支持下,,國內(nèi)獲批上市的產(chǎn)品數(shù)量持續(xù)增加,,影響力不斷壯大,臨床轉化與推廣步伐加快,。與此同時,,國外法規(guī)、監(jiān)管與標準化研究處于新的活躍期,,對國內(nèi)的工作帶來有益的啟示,。
在此背景下,人工智能醫(yī)療器械標準化技術歸口單位(以下簡稱歸口單位)緊密跟蹤監(jiān)管需求和行業(yè)動態(tài),,在國家藥監(jiān)局的領導下積極開展工作,。本文對近年的進展進行總結,對后續(xù)計劃和任務進行展望,。
國外動態(tài)與分析
當前,,人工智能作為熱點創(chuàng)新技術,廣泛應用于包括醫(yī)療器械在內(nèi)的各行各業(yè),,各國針對人工智能本身的監(jiān)管認識與法規(guī)建設不斷升級,。
今年4月,歐盟發(fā)布了人工智能立法框架,,提出了人工智能風險分級管理的理念,。其中,人工智能的醫(yī)學應用被劃入了高風險的等級,預示著對人工智能醫(yī)療器械的監(jiān)管將趨于嚴格,。該立法框架與歐盟在2019年所提出的“可信賴的人工智能”倫理理念一脈相承,,從人與AI的關系出發(fā),旨在強調和保護人的安全,、權益和公平,。
美國FDA在今年1月份發(fā)布了《基于人工智能/機器學習的醫(yī)療器械軟件行動計劃》。該計劃回應了2019年FDA發(fā)布的《基于人工智能/機器學習的醫(yī)療器械軟件變更監(jiān)管框架》收到的社會反饋,。在質量管理方面,,該計劃繼續(xù)研究軟件持續(xù)學習背景下的預定義變更控制的指南草案,開發(fā)良好機器學習規(guī)范以評估和改進機器學習算法,。在監(jiān)管要求方面,,該計劃提倡以患者為中心的路徑,包括器械對用戶的透明度,,與歐盟的立法框架存在相通之處,。在質量評價方面,該計劃重視對算法偏倚和魯棒性的評價,,推動真實世界性能監(jiān)測的試點,。
國際醫(yī)療器械監(jiān)管者論壇(IMDRF)的人工智能醫(yī)療器械工作組在今年組織了多次線上會議。各國監(jiān)管機構的代表圍繞基于人工智能/機器學習的醫(yī)療器械術語文稿的編制展開了細致的討論,。其中,,歐美各國關注持續(xù)學習、算法變更等關鍵詞,,重視良好機器學習規(guī)范在質量管理中的作用,,值得關注。
根據(jù)國外的發(fā)展趨勢,,人工智能倫理思想,、全生命周期質量管理的理念、產(chǎn)品快速更新的需求等因素對人工智能醫(yī)療器械的標準化產(chǎn)生了較大影響,,產(chǎn)品的測試思路也在轉型,,與傳統(tǒng)計算機輔助診斷軟件產(chǎn)品的差異越來越大。
國內(nèi)標準化進展
2020年我國首批人工智能醫(yī)療器械行業(yè)標準《人工智能醫(yī)療器械 質量要求與評價 第1部分:術語》和《人工智能醫(yī)療器械 質量要求與評價 第2部分:數(shù)據(jù)集通用要求》已經(jīng)進入報批階段,?!度斯ぶ悄茚t(yī)療器械 質量要求與評價 第1部分:術語》旨在為人工智能醫(yī)療器械的質量評價提供基礎通用的術語,為后續(xù)標準的起草提供字典,。該標準在基礎共性技術,、數(shù)據(jù)集、質量評價指標,、質量評價方法,、應用場景等方面給出了一百多個詞條及定義,,并以附錄的形式給出了部分公式?!度斯ぶ悄茚t(yī)療器械 質量要求和評價 第2部分:數(shù)據(jù)集通用要求》旨在把數(shù)據(jù)集納入人工智能醫(yī)療器械的質量評價體系,,明確數(shù)據(jù)集的評價對象及技術路徑。該標準借鑒了醫(yī)療器械領域,、信息技術領域,、臨床試驗等領域對數(shù)據(jù)質量的管理思路,結合了人工智能可解釋性,、可溯源性等方面的需要,,提出了數(shù)據(jù)集的描述文檔、質量特性,、風險分析文檔等方面的要求,,并給出了評價方法。同時,,中檢院聯(lián)合中華醫(yī)學會放射學分會、國家衛(wèi)生健康委能力建設與繼續(xù)教育中心等共同發(fā)布了《胸部CT肺結節(jié)數(shù)據(jù)集及質量控制專家共識》,,為標準的落地提供參考,。
根據(jù)國家藥監(jiān)局公示的標準制修訂計劃,2021年中檢院作為歸口單位圍繞《人工智能醫(yī)療器械 質量要求和評價 第3部分:數(shù)據(jù)標注通用要求》和《人工智能醫(yī)療器械 肺部影像輔助分析軟件 算法性能測試方法》兩個主題開展標準立項起草工作,。
數(shù)據(jù)標注是影響人工智能醫(yī)療器械質量的重要技術服務,,直接關系到算法研發(fā)與測試所依據(jù)的參考標準的準確性和可靠性。目前業(yè)內(nèi)在數(shù)據(jù)標注環(huán)節(jié)的差異較大,,標注的實施主體,、工作流程、質控與驗收等環(huán)節(jié)參差不齊,,急需標準規(guī)范,。《人工智能醫(yī)療器械 質量要求和評價 第3部分:數(shù)據(jù)標注通用要求》在參照國內(nèi)臨床領域人工智能數(shù)據(jù)標注專家共識基礎上,,對標注任務的定義,、描述、組織等相關內(nèi)容進行了規(guī)定,,把相關的技術工具,、平臺納入考量。該標準草案也是對《人工智能醫(yī)療器械 質量要求和評價 第2部分:數(shù)據(jù)集通用要求》的呼應和補充,,有助于促進數(shù)據(jù)集的開發(fā)活動,。
《人工智能醫(yī)療器械 肺部影像輔助分析軟件 算法性能測試方法》是中檢院歸口單位標準立項的第一個方法標準草案,面向肺結節(jié),、肺炎等臨床用途的人工智能醫(yī)療器械軟件的測試需求,,描述了輔助診斷,、輔助檢測等場景下的常見指標與測試方法。同時,,該標準草案根據(jù)近年來人工智能軟件測試的發(fā)展趨勢,,對人工智能醫(yī)療器械軟件的一些特殊性能提出考量,包括對抗測試,、壓力測試等,。
2021年3月,中檢院歸口單位召集來自臨床,、教育,、科研、企業(yè)等領域的專家,,形成了標準草案的框架,。在起草組的配合下,標準草案的初稿已完成編制,,在歸口單位內(nèi)部進行了研討,。下一步,歸口單位將結合具體的產(chǎn)品開展技術驗證工作,。
與此同時,,中檢院歸口單位在年初面向社會啟動了2022年度標準立項征集工作,共收到立項提案20余份,,提案內(nèi)容涉及基礎通用要求,、臨床試驗特殊要求、軟件開發(fā)管理,、算法性能測試,、數(shù)據(jù)集專用要求等主題。本年度的部分提案內(nèi)容參考了國外2020年發(fā)布的技術文獻,,與國際前沿的接軌程度有所提升,,反映了國內(nèi)各界對標準研究的熱情和投入。為了確保提案遴選的科學性和效率,,秘書處依據(jù)醫(yī)療器械標準制修訂工作規(guī)范,,在6月底舉行線上線下相結合的標準研討會,組織歸口單位專家組進行專題研究和投票,,下一步將按照標準制定程序辦理后續(xù)事宜,。
國際標準合作進展
在推進國內(nèi)標準研究的同時,歸口單位也在積極拓展國際合作,。2021年3月,,國家藥監(jiān)局和國家標準委批復同意由中檢院專家加入國際電工委員會IEC TC62委員會的軟件網(wǎng)絡與人工智能顧問團,參與IEC在醫(yī)療器械創(chuàng)新領域的國際標準研究,。在顧問團的首個正式研究報告中,,中檢院承擔了部分章節(jié)的編寫和校對任務,,宣傳了我國在人工智能醫(yī)療器械監(jiān)管與標準化方面取得的研究成果,獲得了顧問團的認可,。
中檢院牽頭的IEEE人工智能醫(yī)療器械標準也取得了顯著的進展,。在近期的工作組會議上,來自中國,、美國,、德國、荷蘭等國的十余個成員單位對IEEE P2802 人工智能醫(yī)療器械質量評價術語標準的技術內(nèi)容進行了審議并達成共識,,即將提交IEEE進行文稿格式審查,,啟動外部投票與征求意見進程。該標準在起草階段即獲得了國際同行的關注,,已被美國NIST的人工智能標準體系規(guī)劃,、美國FDA的機器學習/人工智能行動計劃、美國ANSI CTA 2089-1標準等文件引用,。該標準在凝聚我國國內(nèi)行業(yè)共識的基礎上形成初稿,,在國際交流的背景下進行了修改完善。它的起草與發(fā)布有助于增進國內(nèi)外的標準協(xié)調與合作,。IEEE P2801數(shù)據(jù)集質量管理標準草案在今年也推出了新的版本,,即將進行組內(nèi)的技術審議。
標準落地應用進展
為了促進標準的落地應用,、提升產(chǎn)品檢測服務能力,中檢院在科技部重點研發(fā)計劃項目的資助下,,正在建設醫(yī)學人工智能產(chǎn)品檢測平臺,,面向科研院所、企業(yè),、臨床機構,、檢測機構等開展應用示范。平臺使用中心化云端部署的模式,,使用私用數(shù)據(jù)和公有數(shù)據(jù)相結合的渠道,,打通數(shù)據(jù)集開發(fā)與質控、數(shù)據(jù)標注,、測試方案定制,、算法指標評估、對抗測試等關鍵環(huán)節(jié),,形成可定制,、標準化的產(chǎn)品測試服務模式,滿足產(chǎn)品上市前測試,、臨床在用質控,、真實世界性能監(jiān)測,、算法更新與再評價等階段的評價需求,從而支持人工智能產(chǎn)品的全生命周期質量控制,。
在開發(fā)階段,,項目組集成了智能檢索、智能標注,、對抗攻擊等先進技術,,擴展了產(chǎn)品魯棒性、臨床性能動態(tài)評估等方面的評價能力,。在項目參與單位的共同努力下,,包含數(shù)據(jù)入庫、人員管理,、檢測業(yè)務申請,、待測算法部署、數(shù)據(jù)中臺,、檢測報告編輯等在內(nèi)的主要模塊基本達到中期設計指標,,平臺處于聯(lián)合調試和內(nèi)測階段。目前,,已有十余家來自企業(yè),、檢測機構、臨床機構的用戶參與平臺的調試,,待測產(chǎn)品涉及肺部影像,、眼底彩照、心電,、血糖,、電子病歷等數(shù)據(jù)模態(tài)。同時,,項目組完成4個單模態(tài)典型樣板數(shù)據(jù)集,、2個多模態(tài)典型樣板數(shù)據(jù)集,為數(shù)據(jù)集的社會共籌共建模式提供了參照,。平臺預計在今年10月份正式上線并面向社會征集應用示范單位,,提供公益技術服務,支持標準的應用落地和宣貫培訓,。
綜上所述,,我國人工智能醫(yī)療器械標準化工作在理論與實踐兩方面協(xié)同推進,密切關注國內(nèi)外行業(yè)與監(jiān)管形勢的變化,。隨著我國人工智能醫(yī)療器械產(chǎn)業(yè)的發(fā)展壯大和監(jiān)管科學研究的推進,,我國的人工智能醫(yī)療器械標準化工作逐步走向自主創(chuàng)新的道路,為行業(yè)和監(jiān)管需求提供技術保障,。