在全球科技企业纷纷加码大模型研发之际,苹果选择把重点放在专业场景的实际效能提升上;研究团队指出,传统以“点赞/点踩”为核心的人类反馈强化学习(RLHF)存在明显短板:二元评价难以表达设计工作所需的复杂修正逻辑,生成结果因此容易偏离专业需求。为解决此行业普遍问题,苹果组织了由21位资深设计师组成的实验组,成员平均从业12年。不同于常见的打分方式,参与者需要通过结构化评论、手绘修改草图以及直接调整代码三种途径提供反馈。数据显示,设计师用可视化修改传递意图后,研究人员对需求的理解准确率比单纯评分提高54%,继续说明在专业协作中,“展示”往往比“描述”更有效。
苹果的研究表明了AI发展的一个趋势:在特定领域,专业化程度与反馈机制的有效性往往比单纯扩大模型规模更关键;将专家知识以可复用、可训练的方式纳入模型训练流程,有助于大幅提升AI在垂直场景的表现。这不仅推动AI从通用能力走向专业应用,也为其他行业落地AI提供了可参考的路径。