问题—— 乐天集团发布“Rakuten AI 3.0”后不久,开发者社区对其技术来源及开源合规提出质疑。有技术人员公开下载的文件中检索到与DeepSeek系列开源模型相近的架构与配置标识,认为该模型可能基于既有开源底座再训练或微调。也有观点指出,模型开源包早期版本中与许可证、版权声明对应的的文件不完整或被移除,未能清晰体现对上游开源贡献的必要标注。围绕“约7000亿参数”的说法,亦有人将其与已公开模型的参数规模对照,认为企业在宣传中应提供更可核验的技术说明与评测依据。 原因—— 业内人士认为,基于开源模型进行二次开发是通行做法,关键在于满足许可要求:保留版权与免责声明,清楚说明改动范围与适用边界。近年来大模型研发成本和训练门槛居高不下,“开源底座+行业数据优化”的迭代路径并不少见。争议往往不在于“是否使用开源”,而在于“是否遵守规则、是否透明披露”。外部环境上,日本国内对数据安全与外部模型使用总体更为审慎,部分机构和企业对特定海外模型采取限制或谨慎使用政策。,企业对外沟通更倾向强调“自主”“国产”等表述,一旦披露不足,公信力风险随之上升。另据公开信息,相关研发与日本推进本土算力及大模型能力建设的项目方向存在交集,社会关注度因此深入放大。 影响—— 一是对企业信誉与技术品牌形成冲击。开源生态依赖信任与可追溯性,若出现许可证缺失、来源不清或表述含混,开发者更难判断模型的可靠性与可复用性,社区采用意愿和合作伙伴信心可能受挫。二是对产业政策与公共资金使用的舆论环境带来压力。若企业在获得扶持资金、承诺提升本土研发能力的同时,对成果披露边界不清,可能引发社会对“资金使用效率”“产出真实性”的进一步追问。三是对日本开源创新氛围构成挑战。开源规则以法律与惯例保障协作,合规意识不足不仅容易引发争议,也可能抬高跨国协作的摩擦成本。 对策—— 受访人士建议,企业发布开源模型时应建立更严格的合规与披露流程:其一,完整保留并显著标注上游模型、数据与代码来源,依规提供许可证文本、版权声明与变更记录;其二,就“参数规模”“训练数据范围”“评测基准与方法”等关键指标给出可核验信息,避免使用容易引发误读的模糊表述;其三,引入第三方审计或社区复核,在发布前完成“开源合规检查清单”审阅;其四,如涉及公共资金项目,同步完善阶段性成果报告与可追溯材料,明确“自研部分”“复用部分”以及创新点与贡献度,接受社会监督。 前景—— 从全球趋势看,大模型竞争正在从单纯“规模比拼”转向“能力评测、应用落地与生态治理”的综合较量。对日本产业界而言,提升本土研发能力与融入全球开源生态并不矛盾,关键在于以规则为底线、以透明为原则。只有在尊重开源贡献、完善合规治理的基础上,企业才能把开源底座转化为可持续的工程能力与产品竞争力。此次争议也提示各方:除技术创新外,治理与伦理同样是产业走向成熟的重要标志。
开源加速创新,也让事实更容易被核对。大模型时代——技术路线可以借力——但规则底线不能打折;产品能力可以迭代,但信息披露必须经得起检验。把合规视为创新的一部分、把尊重作为竞争的前提,企业才能在开放协作中积累真实的信誉与实力,产业也才能在健康生态中走得更稳、更远。