苹果公开UI生成研究：以设计师深度反馈微调模型，小样本实现特定任务性能跃升

在全球科技企业纷纷加码大模型研发之际，苹果选择把重点放在专业场景的实际效能提升上；研究团队指出，传统以“点赞/点踩”为核心的人类反馈强化学习（RLHF）存在明显短板：二元评价难以表达设计工作所需的复杂修正逻辑，生成结果因此容易偏离专业需求。为解决此行业普遍问题，苹果组织了由21位资深设计师组成的实验组，成员平均从业12年。不同于常见的打分方式，参与者需要通过结构化评论、手绘修改草图以及直接调整代码三种途径提供反馈。数据显示，设计师用可视化修改传递意图后，研究人员对需求的理解准确率比单纯评分提高54%，继续说明在专业协作中，“展示”往往比“描述”更有效。

苹果的研究表明了AI发展的一个趋势：在特定领域，专业化程度与反馈机制的有效性往往比单纯扩大模型规模更关键；将专家知识以可复用、可训练的方式纳入模型训练流程，有助于大幅提升AI在垂直场景的表现。这不仅推动AI从通用能力走向专业应用，也为其他行业落地AI提供了可参考的路径。