中国(浙江)卫生健康科技研发与转化平台

何为眼科基础模型？

人工智能特色专题

眼科基础模型（Ophthalmic Foundation Models）是医疗AI领域的颠覆性范式——通过自监督学习在百万级未标注眼科影像上预训练，形成具备多任务泛化能力的底层智能体。与传统“单病种单模态”AI相比，其核心突破在于：

通才诊断：单模型识别数十种眼病（如VisionFM支持12类眼病联合诊断）
全身预警：从视网膜血管变化预测中风、帕金森等系统疾病（RETFound已验证8项全身病关联）
极简微调：仅需10%标注数据即可适配新任务（RETFound效率提升90%）

正如Nature所述：“它如同眼科AI的‘预训练大脑’，只需少量临床数据注入，就能快速成长为专科医生。”

技术突破

当眼睛成为全身健康的“数据接口”

1、多模态融合：打破眼科数据孤岛

VisionFM（香港中文大学）整合8种成像模态（OCT/眼底彩照/UBM等），覆盖340万张影像，首次实现从单一眼底照预测38项生理指标（如肝功、血脂）。
EyeCLIP（香港理工）构建视觉-语言联合模型，输入眼底图可自动关联病理报告，支持“以图搜文”决策。

2、自监督学习：破解医学标注困境

RETFound采用掩码自编码技术，让AI自行重构被遮挡的视网膜图像，减少对昂贵专家标注的依赖。其在糖尿病视网膜病变分级中AUC达0.935，性能超越传统监督模型。

3、跨种族泛化：攻克临床落地最大瓶颈

尽管RETFound在欧美数据训练下表现优异，但在亚洲人群青光眼诊断中仍存偏差（AUC仅提升0.03）。学界正推动全球多民族数据集共建，清华长庚团队呼吁：“避免AI诊断盲区需从数据源头破局。”

中国方案

眼科基础模型的“三级跳”战略

落地革命

偏远地区医生手机里的“三甲眼科诊室”

喀什实践

40名村医的AI赋能奇迹

在新疆伽师县英买里乡，维吾尔族大爷买买提江通过手机扫码接入ChatZOC眼科大模型：

预问诊系统：上传眼部照片+描述症状，AI 3秒生成诊断（准确率98.1%）
情绪感知引擎：自动切换维汉双语沟通，为老人提供“有温度”的关怀
三级诊疗网：疑似重症直通中山眼科中心专家，10天完成2500例筛查。

普惠价值

重新定义医疗资源分配

资源杠杆：单台5G巡诊车搭载ChatZOC可覆盖10万人口，筛查成本降低70%
公平承诺：在70%眼病患者居住的农村地区（仅占30%医疗资源），AI将诊疗效率提升75%。

2025年

关于基础模型的核心技术突破点

中国香港

多模态基础模型 VisionFM

跨模态泛化能力：基于340万张涵盖OCT/眼底彩照/UBM等8种成像模态的影像预训练，单模型实现12类眼病联合诊断+38项全身指标预测（如肝功能、脑卒中风险），内部验证AUROC高达0.974，媲美中级眼科医师。
临床落地场景：在河南社区筛查中，通过眼底照预测血液生化指标的准确率达75%，目标年内提升至90%，推动“以眼观全身”的预防医学范式。

中国汕头

不确定性评估模型 FMUE

破解AI误诊风险：首创带置信度输出的基础模型，对OCT影像中的16类视网膜疾病诊断F1分数达97.44%（阈值优化后），显著超越视网膜专家（86.95%）及GPT-4V（32.39%）。
安全机制创新：对>85%的低质量图像或非靶病灶主动标记高不确定性，触发人工复核，使AI在开放临床环境中可靠性提升50%。

全球协作

标签清洗技术

根治数据噪声痛点：利用开源框架Cleanlab清洗多模态视网膜数据集，标签错误率降低62.9%，清洗后训练的RETFound模型分类准确率最高提升52.9%。

安全边界控制：自动清洗仅产生0.4-10.6%的误判率，避免过度清洗导致的特征丢失。

应用落地标杆案例

爱尔数字人生态（中国）

垂直大模型+情感化交互：

AierGPT：基于爱尔千万级临床病历训练的专科模型，支持复杂症状分析与诊后管理决策。
数字人管家：融合情感计算技术，实现多轮对话中自动切换沟通策略（如为维吾尔族患者提供双语关怀），问诊满意度达98.1%。
基层赋能价值：搭载于5G巡诊车，在新疆伽师县10天完成2500例筛查，资源覆盖成本降低70%。

中山眼科中心全域AI网（中国）

三级诊疗体系：

ChatZOC助手：基层医生通过手机上传图像，3秒获取诊断建议，月活超150万。

5G智能巡诊车：整合区块链技术实现检查数据直通三甲医院，年服务偏远地区患者超10万人次。

手术机器人：完成全球首例AI辅助视网膜下注射，操作精度达微米级。

居家筛查革命（全球趋势）

智能手机眼底成像：中山眼科林浩添团队开发算法，使普通手机摄像头可替代专业设备完成婴幼儿眼肿瘤筛查，误诊率低于5%。
慢性病管理闭环：鹰瞳Airdoc2.0新增视网膜静脉阻塞模块，用户居家拍摄眼底照即可获全身病风险预警，获批中国NMPA三类械证。

挑战与反思

泛化鸿沟显现（清华长庚研究）

种族数据偏差：明星模型RETFound在亚洲人群青光眼诊断中，性能与传统模型无显著差异（P≥0.2），仅用25%数据微调时AUC提升不足0.03。
解决路径：需建立多民族协作数据集（如非洲青光眼高发人群数据），避免AI诊断盲区。

临床融合深水区

人机协作瓶颈：FMUE虽实现高精度诊断，但医生对AI不确定性提示的响应率仅68%（来源：NPJ Digital Medicine 2025）。
伦理框架缺失：数字人诊疗责任主体尚未立法界定，制约大规模部署。

结语：眼科AI的“清醒进化”

人工智能特色专题

当汕头的不确定性模型与清华的泛化研究形成张力，当爱尔的数字人走进新疆村落而VisionFM解码眼底的全身密码——2025年的眼科基础模型正从“技术狂热”转向临床价值深挖。正如《NEJM AI》社论所言：“谁能在‘精准’与‘普惠’间找到平衡点，谁将定义下一代智能医疗的全球标准。”

COOC2026即将在2026年4月9-11日举行，其中【第三届人工智能眼科应用与发展国际会议】将为与会者带来更多，更新，更全的人工智能与眼科领域的资讯和报道。

全文数据来源：Nature、NEJM AI、NPJ Digital Medicine、中华网数码（2025）、中山眼科中心临床报告（2023-2025）

延展思考

欢迎读者在评论区留言讨论

VisionFM模型在预测全身疾病方面的具体算法原理是什么？

眼科基础模型在罕见病诊断方面还存在哪些技术瓶颈？

中国5G巡诊车+AI模式相比欧美同类方案有哪些独特优势？

(本网站所有内容，凡注明来源为“医脉通”，版权均归医脉通所有，未经授权，任何媒体、网站或个人不得转载，否则将追究法律责任，授权转载时须注明“来源：医脉通”。本网注明来源为其他媒体的内容为转载，转载仅作观点分享，版权归原作者所有，如有侵犯版权，请及时联系我们。)

人工智能：眼科基础模型-从“看见”到“预见”的医疗革命