腸息肉輔助診斷軟件臨床試驗設計思考
腸息肉輔助診斷軟件(以下簡稱腸息肉AI)是一類利用深度學習算法,在內鏡檢查過程中同步、實時識別結直腸息肉的輔助診斷軟件。腸息肉AI可有效提高內鏡醫(yī)師在結腸鏡檢查中息肉的檢出率,相當于醫(yī)生的“第三只眼”,有利于達到結直腸癌早發(fā)現(xiàn)、早治療的目的,尤其適用于基層醫(yī)療機構以及經驗相對不足的內鏡醫(yī)生。目前,腸息肉AI產品的臨床試驗設計是深度學習輔助診斷軟件研究的熱點之一。
兼顧準確度與優(yōu)效性
從檢測對象來看,腸息肉AI是對目標疾病的病變病灶進行輔助檢測的產品。根據(jù)國家藥監(jiān)局醫(yī)療器械技術審評中心于2019年7月發(fā)布的《深度學習輔助決策醫(yī)療器械軟件審評要點》以及于今年5月發(fā)布的一則題為《基于深度學習的計算機輔助決策產品臨床試驗設計類型如何考慮》的共性問題解答,對于此類產品的臨床試驗,建議采用對照設計,試驗組為醫(yī)師與申報產品共同檢測,對照組則為傳統(tǒng)檢測診斷方法(如臨床醫(yī)師的閱片/綜合診斷)。對于主要評價指標,應考慮診斷準確度指標,同時,為體現(xiàn)產品的臨床價值,應采用優(yōu)效性檢驗。因此,腸息肉AI的臨床試驗應采用“AI+人>人”的試驗設計。
與常規(guī)病灶輔助檢測的產品不同,腸息肉AI為實時檢測診斷產品,用于電子結腸鏡檢查過程中結直腸息肉的實時識別?;颊咴陔娮咏Y腸鏡檢查過程中,結直腸息肉,尤其是可疑的腺瘤性息肉,往往會被內鏡醫(yī)師摘除,患者的疾病狀態(tài)在檢查過程中會不斷發(fā)生變化,因此,腸息肉AI無法像傳統(tǒng)病灶輔助檢測產品一樣采用嚴格意義上的配對診斷試驗設計,而一般以平行對照設計為主,并在試驗過程中對研究者聯(lián)合申報產品的病灶診斷水平進行評價,分析其是否優(yōu)于傳統(tǒng)結腸鏡檢查的診斷水平。
兩類臨床試驗設計各有利弊
從目前已有的文獻報告及產品申報情況來看,腸息肉AI產品的臨床試驗設計主要分為兩種:傳統(tǒng)平行對照和平行序貫對照。其中,傳統(tǒng)平行對照設計以研究者聯(lián)合申報產品進行結腸鏡檢查作為試驗組,傳統(tǒng)結腸鏡檢查作為對照組,主要評價指標一般為息肉檢出率或腺瘤檢出率,以評價試驗組的息肉/腺瘤檢出率在統(tǒng)計學意義上優(yōu)于對照組,從而體現(xiàn)產品的臨床價值。傳統(tǒng)平行對照對每例受試者僅進行1次電子結腸鏡檢查,受試者依從性往往較高,且試驗操作與臨床實際診療流程基本相符,研究者的接受程度也較高,因此,傳統(tǒng)平行對照是目前大部分文獻以及產品申報的主流試驗設計方式之一。
盡管傳統(tǒng)平行對照試驗的可操作性較好,但在產品評價上存在一些難以避免的固有偏倚。例如,傳統(tǒng)平行對照設計的主要評價指標一般為息肉(或腺瘤)檢出率,而檢出率往往受發(fā)病率及研究者診療水平的影響較大。雖然試驗設計可引入分層區(qū)組隨機,以盡量使試驗組及對照組的發(fā)病率趨于相同,但組間研究者經驗水平差異帶來的試驗偏倚將無法避免。因此,傳統(tǒng)平行對照設計得出的優(yōu)效性結果可能帶有研究者經驗水平的混雜因素,且試驗結果可能存在較為顯著的中心效應。另外,大樣本臨床試驗及薈萃分析均顯示,我國目前通過傳統(tǒng)電子結腸鏡檢查的息肉(或腺瘤)檢出率依然偏低,遠達不到臨床指南的推薦水平,因此,采用傳統(tǒng)平行對照設計的樣本量往往較大,一般在800例左右。
除了傳統(tǒng)平行對照設計外,腸息肉AI產品的臨床試驗還可以采用平行序貫對照設計的試驗方法。該類試驗設計具體為同一研究者對同一受試者在使用AI與不使用AI的條件下分別進行2次電子結腸鏡檢查,且研究者是否使用AI進行檢查的順序隨機。平行序貫對照設計的主要評價指標為息肉(或腺瘤)漏診率。其中,漏診率的定義為,研究者在第二次檢查中新發(fā)現(xiàn)的息肉(或腺瘤)數(shù)目占前后兩次檢查發(fā)現(xiàn)的息肉(或腺瘤)總數(shù)的比例。由于漏診率是研究者與自身在是否使用AI的情景下對比獲得,故平行序貫對照設計可有效避免研究者診療水平造成的偏倚。除此以外,平行序貫對照設計還可按照受試者的就診原因進行組間分層,以使得不同就診原因下患者的發(fā)病率差異在兩組間趨于均衡,從而有效避免受試者發(fā)病率的偏倚。由此可見,平行序貫對照設計可較好地反映產品本身的診斷性能。
然而,平行序貫對照設計的主要難點在于受試者需要進行連續(xù)2次電子結腸鏡檢查,依從性可能較差。因此,研究者在采用平行序貫對照設計時,建議在全麻狀態(tài)下對受試者進行電子結腸鏡檢查,以改善受試者的檢查體驗。值得注意的是,由于結直腸息肉在臨床實踐中不一定會被全部摘除或進行活檢,試驗設計還應考慮設立“金標準”閱片小組,以評價那些沒有被摘除或活檢但被“發(fā)現(xiàn)”的息肉的準確性。除此以外,在序貫設計中,由于兩次結腸鏡檢查的部位和角度不可能完全相同,評價息肉漏診時,可能還需要對比兩次結腸鏡檢查所拍攝的位置是否完全一致,以更加準確評價息肉的漏診情況。
總體來說,由于腸息肉AI的臨床試驗設計具有較大的特殊性,與常規(guī)病灶識別的輔助診斷產品具有較大的差別,其臨床試驗設計應從控制偏倚的角度入手,以充分體現(xiàn)產品的臨床應用性能和價值。
(責任編輯:譙英固)
右鍵點擊另存二維碼!
互聯(lián)網(wǎng)新聞信息服務許可證10120170033
網(wǎng)絡出版服務許可證(京)字082號
?京公網(wǎng)安備 11010802023089號 京ICP備17013160號-1
《中國醫(yī)藥報》社有限公司 中國食品藥品網(wǎng)版權所有