HNSCC 試驗設計的缺口:分子創新 vs 設計保守
AACR 2026 的 61 個 HNSCC FIH 摘要有一個矛盾:
這些分子是 first-in-class,試驗設計卻不是。
一、現狀:61 個 FIH,幾乎同一套劇本
AACR 2026 共有 61 份頭頸癌 first-in-human(FIH,首次人體試驗)或早期臨床試驗的摘要。這個數字本身是一個訊號:HNSCC 的新藥開發活動量已經遠超過十年前。但當你逐一讀完這 61 份摘要,你會發現它們共用著幾乎相同的試驗設計邏輯:
標準 HNSCC FIH 試驗設計(2026 仍在用的模板)
┌─────────────────────────────────────┐
│ 入組標準:RECIST 可測量病灶 │
│ ≥1 line 先前治療 │
│ ECOG PS 0-1 │
│ 劑量爬坡:3+3 或 BOIN 設計 │
│ 主要終點:MTD / RP2D(最大耐受劑量) │
│ 生物標記:exploratory(次要終點) │
│ 疾病選擇:不分 HPV 狀態 │
│ 設計類型:單藥,單一生物標記 │
└─────────────────────────────────────┘
這套設計沒有錯。它是 FDA 熟悉的路徑,GCP(良好臨床規範)合規,能清楚回答劑量安全性的問題。但它是 1990 年代為細胞毒性化療設計的框架,被照搬到 2026 年的 first-in-class 免疫療法、ADC、bispecific 抗體上。
問題在於:分子的複雜度上升了,但試驗設計的複雜度沒有同步跟上。
二、分子創新 vs 設計保守:量化的落差
2-1. 這些分子到底有多新
AACR 2026 在 HNSCC 展示的新分子,幾乎每一個都打了前所未有的靶點或使用了前所未有的機制:
- STRO-227:雙 payload ADC(一個抗體掛兩種細胞毒)
- RT023:CEACAM5/EGFR bispecific ADC(先雙特異性,再 conjugate payload)
- LGTX-101:機器學習設計結合架構的 Nectin-4×CD3 TCE
- Rilvegostomig (AZD2936):PD-1/TIGIT bispecific,同時打兩個 checkpoint
- CS5006:integrin β4 ADC,HNSCC 從未有過的 ADC 靶點
- AB#5395 / fatostatin:p53-cholesterol 代謝依賴的靶向治療
這些分子的共同特徵:它們的 mechanism of action 不只是單一靶點的加強版,而是在架構層面就是全新的。
2-2. 設計保守的三個症狀
症狀一:單藥設計在組合機制的分子上
以 rilvegostomig(PD-1/TIGIT bispecific)為例:這個分子的設計哲學是「T 細胞深度耗竭需要同時解除兩個剎車(PD-1 和 TIGIT)」。但它的 FIH 試驗設計仍是單藥爬坡,而非從一開始就測試它在 IL-1α 高表現(抗 EGFR 抗藥的主要驅動因子)患者中的組合策略。
同樣的情況出現在幾乎所有 ADC 設計上:ADC 透過 payload 觸發免疫原性細胞死亡(immunogenic cell death, ICD),本質上具有「啟動免疫」的功能,但 FIH 試驗幾乎沒有從第一劑量爬坡就設計搭配 checkpoint inhibitor 的 combination arm。
症狀二:HPV 狀態不在入組設計中,只在亞組分析中
從 KEYNOTE-689 到 AACR 2026 的單細胞空間資料,都一致指向一個事實:HPV- HNSCC 不只是 HPV+ 的「難治版本」,它們是不同生物學的疾病:
HPV+(口咽為主) HPV-(口腔、下咽、喉)
────────────────────────── ──────────────────────────
WTp53 為主 TP53 突變 >70%
CD8+ T 細胞尚存 深度 T 細胞耗竭
CXCL14 正常水準 CXCL14 缺乏(化學趨向驅動不足)
Checkpoint 反應 ~20% Checkpoint 反應更低
治療後 ctDNA 清除較快 微小殘留病灶持續時間更長
儘管如此,絕大多數 FIH 設計仍然是「HNSCC/SCCHN」(頭頸部鱗狀細胞癌,不分亞型)的 mixed population,HPV 狀態只是在 exploratory biomarker 或事後亞組分析中出現。這等於把兩種不同生物學的疾病混在一起,降低了每個假說的信噪比。
症狀三:生物標記是 exploratory,不是入組條件
在 309 份含有 biomarker work 的 HNSCC 摘要中,進入臨床試驗的摘要裡,biomarker 幾乎清一色是「exploratory secondary endpoint」——也就是說,你不需要特定 biomarker 才能入組,biomarker 資料是在試驗結束後再回頭分析。
這種設計的問題是:如果新分子真的有 biomarker-specific 效果(比如 fatostatin 的 p53 缺失敏感性),混合 biomarker 陽性和陰性患者會稀釋試驗信號,導致看起來沒有療效的 Phase II 結果——這是 HNSCC 歷史上已經重複發生多次的悲劇。
三、缺失的元素
3-1. Adaptive Dosing Design
傳統 3+3 設計假設:毒性與劑量單調遞增,找到最大耐受劑量就是 RP2D(推薦 Phase 2 劑量)。但免疫療法和 ADC 的劑量-效果關係不是單調的:
- 免疫療法存在「過低劑量無法充分占據 receptor」的 threshold 效應
- ADC 的 payload 在不同腫瘤中的 internalization 效率差異巨大
BOIN(貝葉斯最優區間設計)已被多個 FIH 採用,是比 3+3 更好的選擇。但更進階的 model-based adaptive designs(如 CRM、EWOC),以及允許在爬坡中根據 biomarker 反應動態調整劑量選擇的設計,在 HNSCC FIH 中幾乎缺席。
3-2. Multi-Arm Biomarker-Driven Basket Design
Basket 設計(按 biomarker 而非腫瘤部位入組)在 HNSCC 中尚未被廣泛採用。考慮到 HPV 狀態、p53 突變、EGFR amplification、CXCL14 表現這些維度的組合,HNSCC 其實是一個高度 molecularly heterogeneous(分子異質性高)的疾病群組,非常適合多臂 biomarker 驅動的設計:
理想的 HNSCC Phase I/II 設計概念
入組前 genomic screening
▼
┌───────────────┼───────────────┐
▼ ▼ ▼
p53 mutant HPV-/CXCL14- EGFR high
TP53 mut+ exhausted TME amplified
▼ ▼ ▼
fatostatin PD-1/TIGIT ADC-based
+ backbone bispecific backbone
▼ ▼ ▼
Arm A Arm B Arm C
▼ ▼ ▼
共同 safety 各臂獨立 ORR 交叉 biomarker
run-in endpoint 探索
3-3. AI-Augmented Patient Selection
AI 推導的 H&E 組織學評分已被驗證為比 CPS 更準的 checkpoint 反應預測工具,但幾乎沒有 FIH 設計把它納入入組標準或 stratification factor。唾液 fragmentome 同樣如此——作為可以在治療期間動態監測的工具,它的潛在應用遠超過目前「只在基線收集樣本」的用法。
四、三個 Actionable 建議
建議一:從 Phase 1 就設計 Combination Arm
IL-1α 是目前 HNSCC 中證據最充分的 EGFR 抵抗機制——它跨越所有世代的 EGFR 抑制劑。這不是一個 Phase II 才要處理的問題,它是從 Phase 1 就應該設計的組合策略。
具體操作:在 EGFR-targeted 新藥的 FIH 試驗中,應在 Phase 1b 擴充階段(expansion cohort)設計 anti-IL-1 combination arm,收集 IL-1α 表現水準作為入組分層因子。這個設計不會增加太多複雜度,但可以在同一個試驗中同時回答「單藥安全性」和「組合策略信號」兩個問題。
同樣的邏輯適用於有 ICD 機制的 ADC:設計 payload-plus-checkpoint 的組合 arm,從第一個試驗就開始探索免疫協同效應。
建議二:從第一天就用 Biomarker-Matched 入組
唾液 fragmentome + AI H&E 評分是目前最接近 operationally ready 的 HNSCC biomarker 組合:
- 唾液 fragmentome 採集成本低(非侵入性),可在 screening 訪視時完成
- AI H&E 評分不需要額外染色,從 screening 活檢切片直接計算
在 FIH 設計中,即使不把這兩個指標作為強制入組條件,也應該作為 mandatory stratification factor——在隨機分配或劑量分層時確保 biomarker 陽性和陰性患者均衡分布,為後續的 biomarker-defined subset 分析保留統計效力。
如果 AB#5395 的 p53-cholesterol 發現能在 Phase I 藥物中進一步驗證,TP53 突變狀態理所當然應成為相關 SREBP 靶向藥物的必要入組條件,而非事後分析。
建議三:HPV 狀態作為設計層面的變數,不是腳注
這一點需要改變試驗設計的思維方式,而不只是修改統計分析計劃(SAP)。
實際做法:
- 分層隨機(對 randomized Phase II):HPV 狀態作為主要 stratification variable,確保各臂 HPV 分布均衡
- 分開入組標準(對 FIH):設計獨立的 HPV- HNSCC expansion cohort,有獨立的假設和獨立的樣本量計算
- 獨立假設:HPV- 疾病的 primary endpoint 可以不同——對於深度耗竭的 TME,ORR 可能不是最好的早期指標,ctDNA clearance 或 TME 重塑的 biomarker 反應可能更適合作為 Phase II 早期終點
五、藥廠決策框架:從 First Indication 到 Companion Diagnostic
5-1. 如何選擇 First Indication
HNSCC 在 first indication 選擇上有三個特殊考量:
考量 1:疾病異質性要求 subtype 決策
選 HPV+ 口咽癌作為 first indication,入組速度快(PD-L1 CPS 有現成的 companion diagnostic),但競爭激烈;選 HPV- HNSCC,入組相對困難(需要更精準的 molecular screening),但差異化空間更大。
考量 2:手術/放射治療交織的複雜性
HNSCC 有相當比例的患者接受根治性放射(chemoradiation),而非手術。新藥與放射療法的組合潛力——或拮抗潛力——是 first indication 設計必須考量的因素,許多 FIH 摘要忽略了這一點。
考量 3:R/M(復發/轉移)vs 局部晚期的選擇
R/M HNSCC 是大多數新藥的 first indication,因為倫理上允許更早的 FIH 入組,但 PFS 短,腫瘤演化快,biomarker-drug relationship 可能被先前治療干擾。局部晚期 HNSCC(neoadjuvant 設定)雖然複雜,但 ctDNA clearance 作為 surrogate endpoint 在這個設定中最有潛力——因為基線腫瘤負荷高,治療後 ctDNA 動態最清晰。
5-2. Companion Diagnostic 策略
HNSCC Companion Diagnostic 選擇矩陣
分子靶向類型 最適 CDx 策略 監管路徑
─────────────────────────────────────────────────────
EGFR/ADC EGFR IHC/FISH PMA(與藥物 co-develop)
+ AI H&E score(輔助)
p53-targeted NGS TP53 mutation 補充檢測(已有商業平台)
CHECKPOINT AI H&E + CPS 組合 LDT(實驗室自建)→ 逐步 PMA
MCED / ctDNA 唾液 fragmentome IVD(體外診斷)新平台
HPV status p16 IHC(現有) 已核准
+ 唾液 DNA(補充) IVD 新適應
AI H&E 評分的監管路徑最值得關注。它不是傳統的 IHC companion diagnostic,FDA 目前對 AI pathology 算法有 De Novo 和 510(k) 兩條途徑,取決於是否有 predicate device。未來三年,第一個在頭頸癌 NDA 申請中被接受的 AI H&E companion diagnostic 將設定先例。藥廠應從 Phase II 就開始與 FDA 討論 analytical validation 的要求,而非等到 NDA 申請時。
5-3. Regulatory Pathway 考量
對於 HPV- HNSCC 這個 unmet need 明確的族群,Breakthrough Therapy Designation (BTD) 的申請機會值得提早評估。BTD 的核心要求是:有初步臨床證據顯示比現有治療有實質性改善,且針對嚴重疾病。HPV- 晚期 HNSCC 的 pembrolizumab 反應率低、整體預後差,BTD 的門檻在有強力 biomarker-defined Phase I 訊號的前提下是可以達到的。
此外,HNSCC 中有幾個 rare subtypes(如 AB#11204 研究的腺樣囊性癌)符合 Orphan Drug Designation (ODD) 的條件,可以提前佈局。
六、設計轉型的阻力與突破點
為什麼試驗設計沒有跟上分子的進步?有幾個真實的阻力:
阻力 1:FDA 熟悉度
監管機構對創新設計的審查週期較長,申辦方寧願走熟悉的路徑,哪怕它次優。
阻力 2:Biomarker 標準化未完成
唾液 fragmentome 和 AI H&E 評分還沒有像 PD-L1 CPS 一樣的統一平台和切分點(cutoff),用它們作為入組條件存在「分析平台不一致」的風險。
阻力 3:Patient recruitment 複雜度
加入 molecular screening 後,入組速度會降低,試驗成本上升。在資金緊張的 biotech 環境中,這是真實的壓力。
但 AACR 2026 的資料提供了反駁的依據:如果設計對了,Phase II 不需要那麼多病人。一個 biomarker-enriched HPV- HNSCC Phase II,30-50 位患者提供的信號,可能比混合設計的 150 位患者更有說服力。統計效力換個方式算,分子越匹配,需要的樣本量越小。
結語:設計的差距不是技術問題,是思維問題
AACR 2026 的 HNSCC 數據提供了前所未有豐富的工具:AI 病理分析、唾液 fragmentome、p53-cholesterol 依賴性、PKA 抗藥機轉。這些工具已經成熟到可以進入試驗設計,不需要等待下一個突破。
試驗設計的保守性,核心上是一個思維框架的問題——把 safety signal 和 biological signal 視為兩個試驗的事,把 biomarker selection 視為 Phase III 的工作,把 HPV 狀態視為統計學家事後分析的事。
AACR 2026 之後,如果還用 2010 年的設計框架去做 first-in-class 分子的 FIH,是在把分子創新的優勢交給競爭對手做更精準的試驗吃掉。設計的差距,最終會反映在 Phase III 的失敗率上。
參考摘要
| AB# | 標題 | 對試驗設計的啟示 |
|---|---|---|
| AB#5395 | Cholesterol pathways in p53-deficient HNSCC | p53 mutation = 必要的 companion biomarker,不是 exploratory |
| AB#4569 | PKA-driven resistance to metformin + NSAIDs | IL-1/COX2 軸 = 組合試驗設計的分子根據 |
| AB#11204 | Intratumoral microdevices in ACC | FIH 前可用 IMD 平台 pre-screen 個人化藥物選擇 |
| AB#2264 | Genie-ADLA methylation MCED | 甲基化 cfDNA 可作為 neoadjuvant 設定的動態 endpoint |
| AB#3226 | Oral cancer screening feasibility | 篩查需生物標記風險分層,設計複雜但可行 |
| AB#6372 | TReg quantification in HNSCC/NSCLC/CRC/GEJ | CCR8+FoxP3+ Treg 密度 = 抗 Treg 療法的 predictive biomarker |
| AB#2071 | Deep-learning CT biomarker in Phase II NSCLC | AI 影像 biomarker 可替代 BOR/PFS 作為早期療效終點(power 60% vs 35%) |
本文根據 AACR 2026 年會摘要及 Apex AI Institute Head and Neck Cancer Briefing(2026-05-01)整理。
目標讀者:藥廠臨床開發部門、FIH 試驗 PI、Oncology Business Development。