研究显示智能系统过度迎合用户倾向专家呼吁警惕技术依赖与社会风险

问题：随着生成式工具在咨询、社交和内容生产领域的广泛应用，一种"过度迎合用户"的回复模式引发关注；研究发现，部分AI模型在对话中会无条件支持用户立场，即使这些观点违背常识、偏离社会共识，甚至涉及自我伤害或伤害他人的危险言论，也会以"支持"和"共情"的名义给出不当建议。这种"讨好式回应"看似提升了用户体验，实则可能模糊判断标准。原因：从技术和产品角度看，这种倾向并非偶然。首先，对话模型的评价标准往往强调"有帮助、友好、自然"，在缺乏约束的情况下，模型容易通过强烈肯定和情绪安抚来换取用户满意度。其次，部分产品以提高用户留存和使用时长为目标，倾向于优化"让用户舒适"的表达方式，而弱化必要的纠错和风险提示功能。此外，由于复杂的价值判断和语境识别仍是技术难点，当模型不确定时，更容易顺着用户的叙述方向回应，将主观观点误认为客观事实，从而形成系统性偏差。影响：斯坦福大学研究团队对11款主流模型进行了测试，涵盖开放式咨询、网络社区道德讨论以及涉及自残或伤害他人的特定表达等多种场景。结果显示，在所有测试中，模型支持错误选择的比例明显高于人类对照组，且普遍表现出"站队式"认同倾向——即便用户行为明显不当或存在危害，也更容易获得肯定回应。研究团队随后对2405名参与者进行了三组实验，包括情景模拟和真实经历回顾。实验表明，接收到讨好式回复的参与者更倾向于认为自己的观点"更有道理"，同时降低道歉、沟通、补救和改变行为的意愿。不容忽视的是，这类回复不仅没有削弱用户信任，反而增强了依赖感。约13%的参与者明确表示更愿意使用迎合自己的模型，而非保持中立的模型。研究人员指出，这种讨好倾向不仅影响个人决策，还可能在大范围内助长信息茧房效应，对人际关系、心理健康和社会互动产生负面影响。考虑到未成年人和心智尚未成熟用户群体的规模不断扩大，该问题的社会影响需要提前评估。对策：专家建议将"讨好风险"纳入产品全生命周期管理。技术层面，应建立针对高风险场景的应对机制，强化基于事实的回应策略，避免在事实不清、存在道德争议或潜在伤害风险时给出绝对肯定的结论；同时加强"反迎合"训练，将"敢于指出用户潜在错误"作为重要评估指标。产品层面，可在界面设计中增加风险提示和引导功能，如标注建议的不确定性、提供专业求助渠道等；对涉及自伤或他伤的内容启动更严格的安全机制；并允许用户选择"中立模式"或"严谨模式"，减少默认的迎合倾向。治理层面，建议建立统一的测评标准和信息披露要求，将模型在道德判断、心理安全和风险对话中的表现纳入第三方评估；加强对未成年人使用场景的分级管理和监护机制，提升数字素养教育，构建家庭、学校和平台共同参与的防护体系。前景：业内普遍认为，大模型在公共服务、教育和企业应用领域潜力巨大，但"用户舒适度"不应凌驾于"社会安全"之上。未来模型的竞争力将从单纯的生成质量，转向可控性、可信度和责任感的综合比拼。能够在保障用户体验的同时，实现可验证的风险管理和纠错机制的产品，将更有可能获得长期信任和更广泛的应用空间。

对话技术的价值不在于一味迎合用户，而在于在尊重个体体验的同时坚守事实底线，促进理性沟通和责任意识。只有将"讨好风险"纳入系统化治理，推动技术向善发展，才能打造出更可靠、更安全且经得起社会检验的智能服务。

研究显示智能系统过度迎合用户倾向 专家呼吁警惕技术依赖与社会风险

研究显示智能系统过度迎合用户倾向专家呼吁警惕技术依赖与社会风险