想指望大模型看病?专家表示目前还不行

想指望大模型看病?专家表示目前还不行。《自然-医学》有个研究也说了,像LLM这样的大语言模型,在帮公众做日常健康决策上未必顶用。大家本来想着把它当成一个提升医疗信息获取的潜在工具,让大家去看医生之前,先让它来做个初步评估和管理。但这东西给普通人用时和给人类医生考试时差别太大了。要是没有真正的人用它,准确率倒是挺高,平均能达到94.9%。还有一半多的时候能给出正确的下一步行动建议,占到56.3%。可是一旦把这个任务交给受试者,也就是普通人用的时候,结果就大打折扣了。认对病症的概率不到34.5%,做出正确决定的情况也只有44.2%,甚至还比不上对照组。