独立评估显示部分健康咨询工具低估急症风险引发建立安全标准呼声

一项发表《自然医学》杂志上的独立安全评估研究近日引发广泛关注；研究发现，某医疗健康系统在识别医疗紧急情况上存在显著不足，此发现对医疗AI应用的安全性提出了严峻挑战。该系统于今年1月向部分用户推出，定位为帮助用户安全连接医疗记录和健康应用、获取健康建议的工具。据统计，每天有超过4000万人向该系统咨询健康问题，其影响范围之广令人瞩目。研究团队采用严谨的科学方法进行了评估。他们构建了60个高度真实的患者案例，涵盖从轻微疾病到危及生命的紧急状况。三名独立医生依据临床指南对每个案例进行了评估，确定了适当的医疗处理级别。研究人员随后在不同条件下向该系统咨询这些案例，包括改变患者性别、添加检测结果以及加入家属评论，共生成近1000条回复，并将系统建议与医生判断进行了对比。研究结果令人担忧。在所有需要立即前往医院的案例中，该系统有51.6%的情况下建议患者留在家中或预约普通门诊。这意味着在超过一半的紧急情况中，系统低估了医疗紧急程度。在一例哮喘案例中，尽管系统识别出呼吸衰竭的早期迹象，仍建议患者等待而不是立即就医。更为极端的是，在一次模拟中，系统有84%的概率将一名正在窒息的女性安排到未来的预约，而患者根本无法等到那一刻。另外，系统的判断也存在相反的问题。研究发现，64.8%的健康个体却被建议立即就医，这表明系统的判断标准存在明显的不稳定性。更值得警惕的是，当案例中提到"朋友认为情况不严重"时，系统淡化症状严重性的概率会增加近12倍，这反映出系统容易受到无关信息的影响。伦敦大学学院的研究人员指出，这一结果"极其危险"。他们表示，如果有人正经历呼吸衰竭或糖尿病酮症酸中毒，该系统有一半概率告诉他们情况并不严重。最令人担忧的是系统带来的虚假安全感。如果在哮喘发作或糖尿病危机期间被建议等待48小时，这种错误安慰可能会致命。这项研究的发表反映了医疗AI应用中存在的深层问题。当前，医疗AI系统在某些典型紧急情况如中风或严重过敏反应中表现相对较好，但在复杂多变的临床场景中仍存在严重缺陷。这种不稳定性对患者生命安全构成了直接威胁。针对这些问题，研究人员正在紧急推动建立明确的安全标准和独立审计机制。专家认为，医疗AI系统的推出和应用必须经过更加严格的安全评估，建立完善的监管框架，确保系统的可靠性和安全性。同时，用户教育也至关重要，患者需要了解该系统的局限性，在面临紧急情况时不能完全依赖AI建议。系统开发方表示欢迎独立研究评估，但同时指出研究结果并不能完全反映用户的实际使用方式，且系统仍在持续更新和改进。这一回应虽然表明了改进的态度，但并未消除公众对医疗安全的担忧。

当涉及生命健康时，安全必须优先于技术推广。这项研究为快速发展的智能医疗行业敲响警钟：只有将临床安全作为底线，通过严格的医学验证和透明的监管，才能真正发挥技术的价值。在追求效率的同时，对生命的敬畏应是医疗创新的核心准则。

独立评估显示部分健康咨询工具低估急症风险 引发建立安全标准呼声

独立评估显示部分健康咨询工具低估急症风险引发建立安全标准呼声