首页 资讯动态 详情
人工智能:眼科基础模型-从“看见”到“预见”的医疗革命
来源:医脉通 发布日期:2025-08-08 00:00:00 访问量:31

人工智能:眼科基础模型-从“看见”到“预见”的医疗革命

发布时间: 2025-08-08 来源: 医脉通



何为眼科基础模型?

人工智能特色专题

眼科基础模型(Ophthalmic Foundation Models)是医疗AI领域的颠覆性范式——通过自监督学习在百万级未标注眼科影像上预训练,形成具备多任务泛化能力的底层智能体。与传统“单病种单模态”AI相比,其核心突破在于:

  1. 通才诊断:单模型识别数十种眼病(如VisionFM支持12类眼病联合诊断)

  2. 全身预警:从视网膜血管变化预测中风、帕金森等系统疾病(RETFound已验证8项全身病关联)

  3. 极简微调:仅需10%标注数据即可适配新任务(RETFound效率提升90%)


图片

正如Nature所述:“它如同眼科AI的‘预训练大脑’,只需少量临床数据注入,就能快速成长为专科医生。” 



技术突破

当眼睛成为全身健康的“数据接口”



1、多模态融合:打破眼科数据孤岛

  • VisionFM(香港中文大学)整合8种成像模态(OCT/眼底彩照/UBM等),覆盖340万张影像,首次实现从单一眼底照预测38项生理指标(如肝功、血脂)。

  • EyeCLIP(香港理工)构建视觉-语言联合模型,输入眼底图可自动关联病理报告,支持“以图搜文”决策。

2、自监督学习:破解医学标注困境

  • RETFound采用掩码自编码技术,让AI自行重构被遮挡的视网膜图像,减少对昂贵专家标注的依赖。其在糖尿病视网膜病变分级中AUC达0.935,性能超越传统监督模型。

3、跨种族泛化:攻克临床落地最大瓶颈

  • 尽管RETFound在欧美数据训练下表现优异,但在亚洲人群青光眼诊断中仍存偏差(AUC仅提升0.03)。学界正推动全球多民族数据集共建,清华长庚团队呼吁:“避免AI诊断盲区需从数据源头破局。”


中国方案

眼科基础模型的“三级跳”战略


图片



落地革命

偏远地区医生手机里的“三甲眼科诊室”



喀什实践

40名村医的AI赋能奇迹

在新疆伽师县英买里乡,维吾尔族大爷买买提江通过手机扫码接入ChatZOC眼科大模型

  • 预问诊系统:上传眼部照片+描述症状,AI 3秒生成诊断(准确率98.1%)

  • 情绪感知引擎:自动切换维汉双语沟通,为老人提供“有温度”的关怀

  • 三级诊疗网:疑似重症直通中山眼科中心专家,10天完成2500例筛查。

普惠价值

重新定义医疗资源分配

  • 资源杠杆:单台5G巡诊车搭载ChatZOC可覆盖10万人口,筛查成本降低70%

  • 公平承诺:在70%眼病患者居住的农村地区(仅占30%医疗资源),AI将诊疗效率提升75%。



2025年

关于基础模型的核心技术突破点



1

中国香港

多模态基础模型 VisionFM

  • 跨模态泛化能力:基于340万张涵盖OCT/眼底彩照/UBM等8种成像模态的影像预训练,单模型实现12类眼病联合诊断+38项全身指标预测(如肝功能、脑卒中风险),内部验证AUROC高达0.974,媲美中级眼科医师。

  • 临床落地场景:在河南社区筛查中,通过眼底照预测血液生化指标的准确率达75%,目标年内提升至90%,推动“以眼观全身”的预防医学范式。

2

中国汕头

不确定性评估模型 FMUE

  • 破解AI误诊风险:首创带置信度输出的基础模型,对OCT影像中的16类视网膜疾病诊断F1分数达97.44%(阈值优化后),显著超越视网膜专家(86.95%)及GPT-4V(32.39%)。

  • 安全机制创新:对>85%的低质量图像或非靶病灶主动标记高不确定性,触发人工复核,使AI在开放临床环境中可靠性提升50%。

3

全球协作

标签清洗技术

根治数据噪声痛点:利用开源框架Cleanlab清洗多模态视网膜数据集,标签错误率降低62.9%,清洗后训练的RETFound模型分类准确率最高提升52.9%。

安全边界控制:自动清洗仅产生0.4-10.6%的误判率,避免过度清洗导致的特征丢失。



应用落地标杆案例

1

爱尔数字人生态(中国)

垂直大模型+情感化交互:

  • AierGPT:基于爱尔千万级临床病历训练的专科模型,支持复杂症状分析与诊后管理决策。

  • 数字人管家:融合情感计算技术,实现多轮对话中自动切换沟通策略(如为维吾尔族患者提供双语关怀),问诊满意度达98.1%。

  • 基层赋能价值:搭载于5G巡诊车,在新疆伽师县10天完成2500例筛查,资源覆盖成本降低70%。

2

中山眼科中心全域AI网(中国)

三级诊疗体系:

ChatZOC助手:基层医生通过手机上传图像,3秒获取诊断建议,月活超150万。

5G智能巡诊车:整合区块链技术实现检查数据直通三甲医院,年服务偏远地区患者超10万人次。

手术机器人:完成全球首例AI辅助视网膜下注射,操作精度达微米级。

3

居家筛查革命(全球趋势)

  • 智能手机眼底成像:中山眼科林浩添团队开发算法,使普通手机摄像头可替代专业设备完成婴幼儿眼肿瘤筛查,误诊率低于5%。

  • 慢性病管理闭环:鹰瞳Airdoc2.0新增视网膜静脉阻塞模块,用户居家拍摄眼底照即可获全身病风险预警,获批中国NMPA三类械证。


挑战与反思

1

泛化鸿沟显现(清华长庚研究)

  • 种族数据偏差:明星模型RETFound在亚洲人群青光眼诊断中,性能与传统模型无显著差异(P≥0.2),仅用25%数据微调时AUC提升不足0.03。

  • 解决路径:需建立多民族协作数据集(如非洲青光眼高发人群数据),避免AI诊断盲区。

2

临床融合深水区

  • 人机协作瓶颈:FMUE虽实现高精度诊断,但医生对AI不确定性提示的响应率仅68%(来源:NPJ Digital Medicine 2025)。

  • 伦理框架缺失:数字人诊疗责任主体尚未立法界定,制约大规模部署。


结语:眼科AI的“清醒进化”

人工智能特色专题

图片

当汕头的不确定性模型与清华的泛化研究形成张力,当爱尔的数字人走进新疆村落而VisionFM解码眼底的全身密码——2025年的眼科基础模型正从“技术狂热”转向临床价值深挖。正如《NEJM AI》社论所言:“谁能在‘精准’与‘普惠’间找到平衡点,谁将定义下一代智能医疗的全球标准。”

COOC2026即将在2026年4月9-11日举行,其中【第三届人工智能眼科应用与发展国际会议】将为与会者带来更多,更新,更全的人工智能与眼科领域的资讯和报道。

全文数据来源:Nature、NEJM AI、NPJ Digital Medicine、中华网数码(2025)、中山眼科中心临床报告(2023-2025)


延展思考

欢迎读者在评论区留言讨论

01

VisionFM模型在预测全身疾病方面的具体算法原理是什么?

02

眼科基础模型在罕见病诊断方面还存在哪些技术瓶颈?

03

中国5G巡诊车+AI模式相比欧美同类方案有哪些独特优势?



图片


(本网站所有内容,凡注明来源为“医脉通”,版权均归医脉通所有,未经授权,任何媒体、网站或个人不得转载,否则将追究法律责任,授权转载时须注明“来源:医脉通”。本网注明来源为其他媒体的内容为转载,转载仅作观点分享,版权归原作者所有,如有侵犯版权,请及时联系我们。)

主办单位:浙江省卫生健康委员会
承办单位:浙江省医学科技教育发展中心