独立评估显示部分健康咨询工具低估急症风险 引发建立安全标准呼声

一项发表《自然医学》杂志上的独立安全评估研究近日引发广泛关注;研究发现,某医疗健康系统在识别医疗紧急情况上存在显著不足,此发现对医疗AI应用的安全性提出了严峻挑战。 该系统于今年1月向部分用户推出,定位为帮助用户安全连接医疗记录和健康应用、获取健康建议的工具。据统计,每天有超过4000万人向该系统咨询健康问题,其影响范围之广令人瞩目。 研究团队采用严谨的科学方法进行了评估。他们构建了60个高度真实的患者案例,涵盖从轻微疾病到危及生命的紧急状况。三名独立医生依据临床指南对每个案例进行了评估,确定了适当的医疗处理级别。研究人员随后在不同条件下向该系统咨询这些案例,包括改变患者性别、添加检测结果以及加入家属评论,共生成近1000条回复,并将系统建议与医生判断进行了对比。 研究结果令人担忧。在所有需要立即前往医院的案例中,该系统有51.6%的情况下建议患者留在家中或预约普通门诊。这意味着在超过一半的紧急情况中,系统低估了医疗紧急程度。在一例哮喘案例中,尽管系统识别出呼吸衰竭的早期迹象,仍建议患者等待而不是立即就医。更为极端的是,在一次模拟中,系统有84%的概率将一名正在窒息的女性安排到未来的预约,而患者根本无法等到那一刻。 另外,系统的判断也存在相反的问题。研究发现,64.8%的健康个体却被建议立即就医,这表明系统的判断标准存在明显的不稳定性。更值得警惕的是,当案例中提到"朋友认为情况不严重"时,系统淡化症状严重性的概率会增加近12倍,这反映出系统容易受到无关信息的影响。 伦敦大学学院的研究人员指出,这一结果"极其危险"。他们表示,如果有人正经历呼吸衰竭或糖尿病酮症酸中毒,该系统有一半概率告诉他们情况并不严重。最令人担忧的是系统带来的虚假安全感。如果在哮喘发作或糖尿病危机期间被建议等待48小时,这种错误安慰可能会致命。 这项研究的发表反映了医疗AI应用中存在的深层问题。当前,医疗AI系统在某些典型紧急情况如中风或严重过敏反应中表现相对较好,但在复杂多变的临床场景中仍存在严重缺陷。这种不稳定性对患者生命安全构成了直接威胁。 针对这些问题,研究人员正在紧急推动建立明确的安全标准和独立审计机制。专家认为,医疗AI系统的推出和应用必须经过更加严格的安全评估,建立完善的监管框架,确保系统的可靠性和安全性。同时,用户教育也至关重要,患者需要了解该系统的局限性,在面临紧急情况时不能完全依赖AI建议。 系统开发方表示欢迎独立研究评估,但同时指出研究结果并不能完全反映用户的实际使用方式,且系统仍在持续更新和改进。这一回应虽然表明了改进的态度,但并未消除公众对医疗安全的担忧。

当涉及生命健康时,安全必须优先于技术推广。这项研究为快速发展的智能医疗行业敲响警钟:只有将临床安全作为底线,通过严格的医学验证和透明的监管,才能真正发挥技术的价值。在追求效率的同时,对生命的敬畏应是医疗创新的核心准则。