美知识产权律师: 人工智能数据采集法律风险

美国人工智能公司OpenAI与Handshake AI展开合作，引发了关于数据采集的法律风险和行业规范的讨论。随着人工智能技术向白领工作场景加速渗透，高质量训练数据变得越来越重要。这次合作涉及通过外包人员收集真实职场工作成果，以提升模型自动化处理复杂任务的能力。美国知识产权律师埃文・布朗表示，外包人员缺乏法律培训和保密审查能力，难以准确区分公开信息和商业机密。如果敏感资料被错误地放入训练数据库中，可能引发商业秘密侵权、违反保密协议等法律问题。此外，人工智能模型具有“黑箱”特性，使得敏感信息一旦被吸收就难以追溯和清除。这次争议凸显了人工智能行业快速发展与制度规范滞后之间的结构性矛盾。一方面技术创新需要大量数据支持，另一方面数据采集的合法性和安全性边界还不够明确。尽管“先采集、后治理”的策略可能在短期内加速研发，但也可能带来系统性风险。新华社报道称，部分企业采取这种策略时忽略了数据安全与合规性问题。未来，要推动人工智能技术真正赋能经济社会发展需要完善行业标准、强化立法保障以及提升企业自律。通过建立贯穿数据采集、标注、清洗及使用的全流程合规体系，并通过技术手段强化敏感信息过滤可以降低风险。同时明确外包合作中的法律责任分配也是至关重要的一步。埃文・布朗指出外包合作模式虽然可以降低成本和灵活调配资源但也存在责任模糊问题。企业难以全程监督数据筛选过程而外包人员可能忽视风险或者出于利益驱动忽视风险。另外各国在人工智能数据使用方面的立法还处于探索阶段进一步增加了合规不确定性。