何为眼科基础模型?
人工智能特色专题
眼科基础模型(Ophthalmic Foundation Models)是医疗AI领域的颠覆性范式——通过自监督学习在百万级未标注眼科影像上预训练,形成具备多任务泛化能力的底层智能体。与传统“单病种单模态”AI相比,其核心突破在于:
通才诊断:单模型识别数十种眼病(如VisionFM支持12类眼病联合诊断)
全身预警:从视网膜血管变化预测中风、帕金森等系统疾病(RETFound已验证8项全身病关联)
极简微调:仅需10%标注数据即可适配新任务(RETFound效率提升90%)

正如Nature所述:“它如同眼科AI的‘预训练大脑’,只需少量临床数据注入,就能快速成长为专科医生。”
技术突破
当眼睛成为全身健康的“数据接口”
VisionFM(香港中文大学)整合8种成像模态(OCT/眼底彩照/UBM等),覆盖340万张影像,首次实现从单一眼底照预测38项生理指标(如肝功、血脂)。
EyeCLIP(香港理工)构建视觉-语言联合模型,输入眼底图可自动关联病理报告,支持“以图搜文”决策。
RETFound采用掩码自编码技术,让AI自行重构被遮挡的视网膜图像,减少对昂贵专家标注的依赖。其在糖尿病视网膜病变分级中AUC达0.935,性能超越传统监督模型。
尽管RETFound在欧美数据训练下表现优异,但在亚洲人群青光眼诊断中仍存偏差(AUC仅提升0.03)。学界正推动全球多民族数据集共建,清华长庚团队呼吁:“避免AI诊断盲区需从数据源头破局。”
中国方案
眼科基础模型的“三级跳”战略

落地革命
偏远地区医生手机里的“三甲眼科诊室”
喀什实践
40名村医的AI赋能奇迹
在新疆伽师县英买里乡,维吾尔族大爷买买提江通过手机扫码接入ChatZOC眼科大模型:
预问诊系统:上传眼部照片+描述症状,AI 3秒生成诊断(准确率98.1%)
情绪感知引擎:自动切换维汉双语沟通,为老人提供“有温度”的关怀
三级诊疗网:疑似重症直通中山眼科中心专家,10天完成2500例筛查。
普惠价值
重新定义医疗资源分配
资源杠杆:单台5G巡诊车搭载ChatZOC可覆盖10万人口,筛查成本降低70%
公平承诺:在70%眼病患者居住的农村地区(仅占30%医疗资源),AI将诊疗效率提升75%。
2025年
关于基础模型的核心技术突破点
中国香港
多模态基础模型 VisionFM
跨模态泛化能力:基于340万张涵盖OCT/眼底彩照/UBM等8种成像模态的影像预训练,单模型实现12类眼病联合诊断+38项全身指标预测(如肝功能、脑卒中风险),内部验证AUROC高达0.974,媲美中级眼科医师。
临床落地场景:在河南社区筛查中,通过眼底照预测血液生化指标的准确率达75%,目标年内提升至90%,推动“以眼观全身”的预防医学范式。
中国汕头
不确定性评估模型 FMUE
破解AI误诊风险:首创带置信度输出的基础模型,对OCT影像中的16类视网膜疾病诊断F1分数达97.44%(阈值优化后),显著超越视网膜专家(86.95%)及GPT-4V(32.39%)。
安全机制创新:对>85%的低质量图像或非靶病灶主动标记高不确定性,触发人工复核,使AI在开放临床环境中可靠性提升50%。
全球协作
标签清洗技术
根治数据噪声痛点:利用开源框架Cleanlab清洗多模态视网膜数据集,标签错误率降低62.9%,清洗后训练的RETFound模型分类准确率最高提升52.9%。
安全边界控制:自动清洗仅产生0.4-10.6%的误判率,避免过度清洗导致的特征丢失。
应用落地标杆案例
爱尔数字人生态(中国)
垂直大模型+情感化交互:
AierGPT:基于爱尔千万级临床病历训练的专科模型,支持复杂症状分析与诊后管理决策。
数字人管家:融合情感计算技术,实现多轮对话中自动切换沟通策略(如为维吾尔族患者提供双语关怀),问诊满意度达98.1%。
基层赋能价值:搭载于5G巡诊车,在新疆伽师县10天完成2500例筛查,资源覆盖成本降低70%。
中山眼科中心全域AI网(中国)
三级诊疗体系:
ChatZOC助手:基层医生通过手机上传图像,3秒获取诊断建议,月活超150万。
5G智能巡诊车:整合区块链技术实现检查数据直通三甲医院,年服务偏远地区患者超10万人次。
手术机器人:完成全球首例AI辅助视网膜下注射,操作精度达微米级。
居家筛查革命(全球趋势)
智能手机眼底成像:中山眼科林浩添团队开发算法,使普通手机摄像头可替代专业设备完成婴幼儿眼肿瘤筛查,误诊率低于5%。
慢性病管理闭环:鹰瞳Airdoc2.0新增视网膜静脉阻塞模块,用户居家拍摄眼底照即可获全身病风险预警,获批中国NMPA三类械证。
挑战与反思
泛化鸿沟显现(清华长庚研究)
种族数据偏差:明星模型RETFound在亚洲人群青光眼诊断中,性能与传统模型无显著差异(P≥0.2),仅用25%数据微调时AUC提升不足0.03。
解决路径:需建立多民族协作数据集(如非洲青光眼高发人群数据),避免AI诊断盲区。
临床融合深水区
人机协作瓶颈:FMUE虽实现高精度诊断,但医生对AI不确定性提示的响应率仅68%(来源:NPJ Digital Medicine 2025)。
伦理框架缺失:数字人诊疗责任主体尚未立法界定,制约大规模部署。
结语:眼科AI的“清醒进化”
人工智能特色专题

当汕头的不确定性模型与清华的泛化研究形成张力,当爱尔的数字人走进新疆村落而VisionFM解码眼底的全身密码——2025年的眼科基础模型正从“技术狂热”转向临床价值深挖。正如《NEJM AI》社论所言:“谁能在‘精准’与‘普惠’间找到平衡点,谁将定义下一代智能医疗的全球标准。”
COOC2026即将在2026年4月9-11日举行,其中【第三届人工智能眼科应用与发展国际会议】将为与会者带来更多,更新,更全的人工智能与眼科领域的资讯和报道。
全文数据来源:Nature、NEJM AI、NPJ Digital Medicine、中华网数码(2025)、中山眼科中心临床报告(2023-2025)
延展思考
欢迎读者在评论区留言讨论
VisionFM模型在预测全身疾病方面的具体算法原理是什么?
眼科基础模型在罕见病诊断方面还存在哪些技术瓶颈?
中国5G巡诊车+AI模式相比欧美同类方案有哪些独特优势?
(本网站所有内容,凡注明来源为“医脉通”,版权均归医脉通所有,未经授权,任何媒体、网站或个人不得转载,否则将追究法律责任,授权转载时须注明“来源:医脉通”。本网注明来源为其他媒体的内容为转载,转载仅作观点分享,版权归原作者所有,如有侵犯版权,请及时联系我们。)