捧起她娇臀猛烈冲刺h,久久亚洲精品无码网站,公与媳系列100小说,欧美大片18禁aaa片免费,国产成人无码a区视频,xxxx欧美丰满大屁股 free,韩国在线无码中文字幕,2021年精品国产福利在线,日本成年片黄网站色品善网

版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們

牛津大學(xué)等深挖746萬成年人健康數(shù)據(jù)開發(fā)早篩算法,基于血液指標(biāo)實(shí)現(xiàn)15種癌癥早期預(yù)測

HyperAI超神經(jīng)
原創(chuàng)
人工智能說明書,了解 AI 的功效和副作用。
收藏

在英國,癌癥生存率長期面臨嚴(yán)峻挑戰(zhàn),臨床結(jié)果在發(fā)達(dá)國家中處于較低水平。這一現(xiàn)狀的背后,是大量癌癥患者因確診時已處于中晚期、錯失最佳治療時機(jī)的客觀現(xiàn)實(shí)。 2011 年,英國國家醫(yī)療服務(wù)體系(NHS)發(fā)布癌癥戰(zhàn)略,明確提出將 75% 的癌癥在可治愈階段(1 期或 2 期)確診的目標(biāo),旨在通過優(yōu)化診斷流程改善現(xiàn)狀。該戰(zhàn)略以初級保健為突破口,通過預(yù)測算法提升早期診斷效能,為癌癥診療模式革新指明方向。

在此背景下,基于大規(guī)模初級保健電子健康數(shù)據(jù)庫開發(fā)的癌癥預(yù)測算法應(yīng)運(yùn)而生,如 QCancer 評分等模型,整合年齡、性別、貧困狀況、吸煙、飲酒、家族史、癥狀等多維度因素,評估個體未確診癌癥的絕對概率。國家臨床指南建議,當(dāng)癌癥陽性預(yù)測值超過特定閾值(如 3%)時,臨床醫(yī)生需考慮進(jìn)一步檢查或轉(zhuǎn)診。這些算法整合至初級保健臨床計算機(jī)系統(tǒng),在患者就診時實(shí)時評估患癌風(fēng)險,為臨床決策提供數(shù)據(jù)支撐。

截至 2020 年,英格蘭地區(qū)僅有略超半數(shù)的癌癥在 1 期或 2 期確診,距離 2028 年達(dá)到 75% 的目標(biāo)仍有顯著差距。近年來,血液檢測技術(shù)進(jìn)展為突破這一瓶頸提供新方向——多項(xiàng)研究表明,血紅蛋白、白細(xì)胞計數(shù)、血小板等血液指標(biāo)異常變化可能早于臨床癥狀數(shù)年出現(xiàn),提示其作為癌癥早期預(yù)警生物標(biāo)志物的潛力,促使研究者探索將血液檢測數(shù)據(jù)納入預(yù)測模型,以提升算法對無癥狀或不典型癥狀癌癥的識別能力。

基于此,倫敦瑪麗女王大學(xué)與牛津大學(xué)研究團(tuán)隊合作,基于英格蘭地區(qū) 746 萬成年人的匿名電子健康記錄,開發(fā)了 2 種新型癌癥預(yù)測算法:基礎(chǔ)算法整合傳統(tǒng)臨床因素與癥狀變量,進(jìn)階算法進(jìn)一步納入全血細(xì)胞計數(shù)、肝功能檢測等血液指標(biāo)。

研究通過多項(xiàng)式邏輯回歸模型對男女群體分別建模,不僅實(shí)現(xiàn)整體患癌概率預(yù)測,還首次實(shí)現(xiàn)肝癌、口腔癌等 15 種癌癥類型的單獨(dú)風(fēng)險評估。在 500 萬例獨(dú)立驗(yàn)證中,新型算法表現(xiàn)出優(yōu)于現(xiàn)有模型的區(qū)分能力、校準(zhǔn)能力和敏感性,為優(yōu)化臨床決策流程、推進(jìn)癌癥早期診斷提供了科學(xué)依據(jù)。此外,該團(tuán)隊提出,該方法是初級保健中,首個用于估算當(dāng)前尚未確診的肝癌概率的算法。

相關(guān)研究成果以「Development and external validation of prediction algorithms to improve early diagnosis of cancer」為題,已發(fā)表于國際權(quán)威期刊 Nature Communications 。

雙數(shù)據(jù)庫多隊列研究:樣本量均超百萬,全方位構(gòu)建數(shù)據(jù)支撐

該研究的數(shù)據(jù)取自 QResearch(版本 48)和臨床實(shí)踐研究數(shù)據(jù)鏈(CPRD Gold)兩大電子病歷數(shù)據(jù)庫,前者基于 EMIS 系統(tǒng)覆蓋英格蘭地區(qū),后者基于 Vision 系統(tǒng)包含了位于北愛爾蘭、蘇格蘭和威爾士的診所數(shù)據(jù),形成地理獨(dú)立的外部驗(yàn)證隊列,保障數(shù)據(jù)多樣性與代表性。

研究人群方面,如下圖所示,英格蘭 QResearch 診所數(shù)據(jù)隨機(jī)分配為開發(fā)隊列(derivation cohort),共 7,464,507 人,包含 129,715 例新發(fā)癌癥,驗(yàn)證隊列(validation cohort)共 2,637,184 人,包含 44,984 例新發(fā)癌癥,CPRD 驗(yàn)證隊列共 2,736,726 人,包含 32,328 例新發(fā)癌癥。

三大隊列樣本量均超百萬,覆蓋 18-84 歲人群,含年輕人好發(fā)的血液系統(tǒng)惡性腫瘤、乳腺癌及中老年常見癌癥類型,時間跨度為 2015 年 1 月 1 日至 2023 年 3 月 31 日,隨訪期 2 年,聚焦入組時未確診癌癥患者,通過排除入組前 12 個月內(nèi)有「紅旗癥狀」者等標(biāo)準(zhǔn),確保新發(fā)癌癥數(shù)據(jù)準(zhǔn)確性。數(shù)據(jù)涵蓋年齡、性別、貧困狀況、吸煙、飲酒、家族史、癥狀、血液檢測(全血細(xì)胞計數(shù)、肝功能檢測)等維度,除英格蘭隊列在自我報告的種族、吸煙、飲酒和 BMI 數(shù)據(jù)完整性略高外,各隊列基線特征總體一致,為模型開發(fā)提供均衡數(shù)據(jù)基礎(chǔ)。


模型開發(fā)隊列和驗(yàn)證隊列的數(shù)據(jù)分布

該研究基于全科醫(yī)生、醫(yī)院、死亡率和癌癥登記處四大數(shù)據(jù)源,識別 QCancer 已包含的 13 種癌癥(肺癌、結(jié)直腸癌等)及新增的肝癌、口腔-咽部癌等共 15 種類型,CPRD 隊列因數(shù)據(jù)限制僅基于全科醫(yī)生記錄診斷,形成分層驗(yàn)證體系。這些數(shù)據(jù)具有樣本量大、地域廣、時間跨度長、預(yù)測因素多元且臨床相關(guān)性強(qiáng)的特點(diǎn),通過開發(fā)隊列構(gòu)建預(yù)測模型,借助不同地區(qū)和系統(tǒng)的驗(yàn)證隊列(尤其 CPRD 外部隊列)評估模型普適性與可靠性,確保算法在真實(shí)臨床場景中的有效性和穩(wěn)定性,為癌癥早期診斷提供數(shù)據(jù)支撐。

癌癥預(yù)測模型開發(fā):多項(xiàng)式邏輯回歸建模與多維度驗(yàn)證

在模型開發(fā)中,該研究基于現(xiàn)有算法和文獻(xiàn)篩選候選預(yù)測變量,涵蓋人口統(tǒng)計學(xué)特征、煙酒習(xí)慣、癌癥家族史、合并癥,以及癥狀和血液檢測結(jié)果。癥狀細(xì)分為「紅旗癥狀(強(qiáng)癌癥關(guān)聯(lián)性、臨床指南緊急轉(zhuǎn)診依據(jù))」和非特異性癥狀,血液檢測納入隊列前 2 年記錄值以捕捉潛在信號。

為了確保模型的科學(xué)性和準(zhǔn)確性,研究人員在建模中采用多項(xiàng)式邏輯回歸估計各癌種預(yù)測變量系數(shù),分男女?dāng)M合模型。通過鏈?zhǔn)椒匠潭嘀夭逖a(bǔ)法(男女各 5 次插補(bǔ) + Rubin 規(guī)則合并)填充飲酒、吸煙狀態(tài)及血液指標(biāo)缺失值,二元變量以全科醫(yī)生診斷記錄二分類編碼。模型擬合時保留顯著性水平 ≤ 0.01 的變量,將風(fēng)險比 0.80-1.20 且不顯著的系數(shù)設(shè)為零,結(jié)合 P 值與效應(yīng)大小構(gòu)建簡潔模型,避免單純依賴統(tǒng)計顯著性的自動變量選擇,確保臨床相關(guān)性。

研究運(yùn)用分?jǐn)?shù)多項(xiàng)式模擬連續(xù)變量非線性關(guān)系,測試預(yù)測變量與年齡的交互作用。在評估模型的樂觀性時,研究人員通過啟發(fā)式收縮因子評估模型樂觀性,兩模型收縮值均 > 0.99,證實(shí)無過度擬合。最終推導(dǎo)模型 A(臨床因素 + 癥狀)和模型 B(模型 A + 血液檢測結(jié)果),后者旨在通過新增癌癥相關(guān)信號提升預(yù)測精度。

模型評估在兩個獨(dú)立驗(yàn)證隊列展開,除計算 AUROC 評估區(qū)分能力外,研究人員引入多類別區(qū)分指數(shù)(PDI,男性 12 類 / 女性 14 類,含無癌癥類別)衡量整體分類效能(PDI 越接近 1 區(qū)分越精準(zhǔn)),并通過校準(zhǔn)曲線、斜率及截距檢驗(yàn)預(yù)測概率與實(shí)際值的一致性。早期癌癥專項(xiàng)分析聚焦 2015-2020 年病例,以 1 期 / 2 期為早期定義,分層評估地理區(qū)域、種族、年齡組等亞組,驗(yàn)證模型在不同人群中的普適性。

癌癥預(yù)測模型應(yīng)用:首次納入肝癌與口腔癌,解析血液指標(biāo)與癌癥風(fēng)險關(guān)聯(lián)

在模型應(yīng)用與實(shí)驗(yàn)驗(yàn)證環(huán)節(jié),該研究圍繞新型預(yù)測模型的變量關(guān)聯(lián)、區(qū)分能力、校準(zhǔn)效果及臨床價值展開多維度驗(yàn)證。與現(xiàn)有 QCancer 算法相比,新模型新增肝硬化、乙肝、丙肝(肝癌相關(guān))及艾滋?。ㄑ喊⒛I癌相關(guān))4 種醫(yī)療狀況,補(bǔ)充肺癌 / 血液癌家族史關(guān)聯(lián),及瘙癢、瘀傷、腹部腫塊等 7 種跨癌癥狀。

年齡與癥狀交互作用存在性別差異:男性多數(shù)癌癥風(fēng)險年輕時關(guān)聯(lián)更強(qiáng),女性相反。年齡與 BMI 分析顯示,除睪丸癌、宮頸癌外,全癌種風(fēng)險隨年齡增長上升;BMI 降低與多癌種正相關(guān),女性子宮癌、卵巢癌風(fēng)險隨 BMI 升高增加。

如下圖 2-4 所示,針對模型 B 納入的血液指標(biāo)分析表明:

* 血紅蛋白(haemoglobin):男性該指標(biāo)下降與肺癌(lung)、結(jié)直腸癌(colorectal)相關(guān),女性與結(jié)直腸癌(colorectal)、肝癌(liver)相關(guān);

* 淋巴細(xì)胞(lymphocyte):與多數(shù)癌癥負(fù)相關(guān),與血液癌(blood)強(qiáng)正相關(guān);

* 中性粒細(xì)胞(neutrophil):女性該指標(biāo)升高廣泛關(guān)聯(lián)癌癥(肺癌最顯著),男性呈「雙向關(guān)聯(lián)(高值與 6 種癌癥相關(guān),低值與肝癌、前列腺癌 prostate 相關(guān))」;

* 血小板(platelet):該指標(biāo)升高與男女多種癌癥正相關(guān)(男性結(jié)直腸癌、女性卵巢癌 ovarian 最強(qiáng)),且與中性粒細(xì)胞升高、淋巴細(xì)胞減少協(xié)同關(guān)聯(lián);

* 肝功能(liver function):白蛋白降低、堿性磷酸酶升高普遍預(yù)示癌癥風(fēng)險,膽紅素升高與肝癌、血液癌密切相關(guān)。

年齡、 BMI 、血紅蛋白的分?jǐn)?shù)多項(xiàng)式

白細(xì)胞和血小板的分?jǐn)?shù)階多項(xiàng)式


肝功能檢測的分?jǐn)?shù)多項(xiàng)式

在區(qū)分能力評估中,如下圖所示,模型 B(含血液檢測)的 c 統(tǒng)計值(AUROC)整體優(yōu)于模型 A,男性總體區(qū)分效能(0.876)高于女性(0.844),15 種癌癥中多數(shù) c 值 > 0.8,僅女性口腔癌(oral,0.747)、宮頸癌(cervical,0.694)略低。多類別區(qū)分指數(shù)(PDI)顯示,模型 B 在男女中區(qū)分能力(男性 0.323,女性 0.266)均優(yōu)于模型 A,對睪丸癌(testicular,男性 PDI 0.641)、子宮癌(uterine,女性 PDI 0.439)分類效能突出。亞組分析表明,模型在不同種族、年齡、地理區(qū)域中性能穩(wěn)定,罕見癌種因事件數(shù)少略有波動。


模型 A 與模型 B 在 QResearch 驗(yàn)證隊列的 c 統(tǒng)計值區(qū)分

校準(zhǔn)能力方面,如下圖所示,模型 A/B 在英格蘭隊列中校準(zhǔn)斜率接近 1(女性 1.00,男性 0.99),截距趨近于零;但在外部 CPRD 隊列中對男女癌癥概率存在一定高估。決策曲線顯示,模型 B 凈收益高于模型 A 和 QCancer,尤其在 3% 轉(zhuǎn)診閾值下,模型 A/B 對男性癌癥敏感性(82.6%)高于 QCancer(78.1%),女性從 66.0% 提升至 77% 以上,且對 1 期 / 2 期早期癌癥識別能力與全階段相當(dāng)(女性 75% 、男性 81%)。重新分類分析表明,模型 A 較 QCancer 將更多高齡人群歸為高風(fēng)險、年輕人群歸為低風(fēng)險,優(yōu)化了臨床資源分配精準(zhǔn)性。


決策曲線分析

全球癌癥預(yù)測算法與早期診斷:高??蒲信c企業(yè)創(chuàng)新的跨學(xué)科進(jìn)展

在癌癥預(yù)測算法與早期診斷領(lǐng)域,全球高校科研團(tuán)隊與科技企業(yè)正通過跨學(xué)科創(chuàng)新,推動理論研究向臨床應(yīng)用加速轉(zhuǎn)化。

例如,北京大學(xué)董彬與沈琳團(tuán)隊開發(fā)的 MuMo 模型,整合 HER2 陽性胃癌患者的影像學(xué)、病理學(xué)及臨床數(shù)據(jù),為個體化治療提供精準(zhǔn)預(yù)測;中國科學(xué)院計算機(jī)網(wǎng)絡(luò)信息中心基于「東方」超算系統(tǒng),利用 Transformer 架構(gòu)構(gòu)建 SuRe-Transformer 模型,將乳腺癌病理圖像 HRD 預(yù)測精度提升 21%;清華大學(xué)李梢課題組通過弱監(jiān)督學(xué)習(xí)框架 HistoCell,實(shí)現(xiàn)病理影像中細(xì)胞空間關(guān)聯(lián)網(wǎng)絡(luò)的無監(jiān)督推斷,為腫瘤微環(huán)境研究提供新工具。

哈佛醫(yī)學(xué)院聯(lián)合斯坦福大學(xué)開發(fā)的 CHIEF 模型,以 94% 的精度診斷 19 種癌癥,并能基于病理圖像預(yù)測患者生存率;劍橋大學(xué)構(gòu)建的 ResNetRS50 深度學(xué)習(xí)模型,通過分析血液數(shù)據(jù)預(yù)測血液癌癥,較先進(jìn)模型兼具更高準(zhǔn)確率、速度及更低錯誤率。

企業(yè)界創(chuàng)新則更注重技術(shù)落地與臨床結(jié)合。微軟 AI for Health 平臺整合基因組與電子健康記錄,構(gòu)建個體患癌風(fēng)險圖譜,乳腺癌高危人群預(yù)測準(zhǔn)確率達(dá) 89%;谷歌 DeepMind 的 AlphaScan 系統(tǒng)在早期肺癌檢測中準(zhǔn)確率達(dá) 96%;AI 醫(yī)療科技公司推想醫(yī)療 InferRead 肺部影像 AI 解決方案,基于深度學(xué)習(xí)的肺結(jié)節(jié)檢測系統(tǒng)已應(yīng)用于臨床 CT,顯著提升診斷效率。

整體來看,癌癥預(yù)測算法與早期診斷領(lǐng)域正從單癌種篩查向多癌種泛癌早篩演進(jìn):美國 Grail 的 Galleri 檢測通過血液甲基化分析篩查 50 種癌癥并定位原發(fā)灶,中國企業(yè)鹍遠(yuǎn)生物的 PanSeer?技術(shù)有效實(shí)現(xiàn) 5 種高發(fā)癌癥早期篩查。隨著人工智能與大數(shù)據(jù)深度融合,癌癥預(yù)測算法有望在基層醫(yī)療普及,推動診療模式從「經(jīng)驗(yàn)醫(yī)學(xué)」向「精準(zhǔn)數(shù)據(jù)醫(yī)學(xué)」轉(zhuǎn)型,為實(shí)現(xiàn)「早發(fā)現(xiàn)、早干預(yù)」奠定基礎(chǔ)。

評論
、? !
太師級
2025-05-27