北京市衛生健康委近日發布《關于開展醫療領域人工智能應用評測工作的通知》,宣布正式面向企業及科研機構開放醫療AI評測服務。這一舉措旨在規范醫療人工智能應用發展,確保技術安全可靠地服務于臨床診療需求,標志著我國醫療AI監管體系邁出關鍵一步。
隨著人工智能技術深度融入醫療領域,輔助診斷、智能影像識別等應用加速落地。如何平衡技術創新與醫療安全,成為行業發展的核心命題。為此,北京市在國家醫療人工智能應用中試基地框架下,專門成立醫療人工智能應用評測中心,通過構建標準化評測體系,為醫療AI產品設立質量門檻。
該評測中心建立了覆蓋六大核心維度的考核標準,包括醫學倫理合規性、醫學知識更新度、通用輔助能力、專科診療質量管控、診療流程適配性及決策準確性。體系內設70余項具體評測任務,既考察隱私保護、倫理規范等安全底線,也評估對最新醫學教材和診療指南的掌握程度,更注重驗證AI系統與臨床思維的契合度及診斷建議的合理性。
為保障評測數據質量,中心聯合三甲醫院、科研院所及權威專家團隊,構建了包含臨床案例、醫學教材、診療指南的多維度數據集。其中典型病例覆蓋從常見病到罕見病的全譜系疾病,所有"考題"均由國內頂級專科資深醫師參與編審,確保評測場景真實反映臨床實際需求。
在評測流程設計上,中心采用"系統初評+專家復核"的雙軌機制。申請評測的AI系統需通過自動化任務匹配完成初步考核,生成包含診療邏輯分析的詳細報告后,再由臨床專家組進行結果復核。評分環節創新引入AI輔助評分模型,該模型可綜合分析系統的推理路徑、證據引用及最終結論,避免單純以診斷正確率評判優劣。例如在對比兩款診斷正確的AI系統時,模型會為邏輯鏈條更完整、依據更充分的一方給予更高評分。
本次評測服務作為國家醫療AI中試基地首次對外開放的專業評測,初期聚焦胸外科診療領域開展專項評估。參評單位可自主選擇是否公開評測結果,表現優異的產品將優先納入基地推廣體系,向全國醫療機構重點推薦。據透露,后續評測范圍將逐步擴展至內科、外科、兒科等全學科領域,形成覆蓋醫療AI全產業鏈的質量監控網絡。
業內專家指出,北京市建立的這套評測體系,通過量化指標和科學方法解決了醫療AI評估的標準化難題,其"重過程、看邏輯"的評測理念,為行業樹立了質量管控新標桿。隨著評測服務的常態化開展,有望推動我國醫療人工智能產業進入規范發展新階段。









