《管理评论》周源：ai是如何炼成的？

为了搞清楚从2000年到2024年上市公司到底在多大程度上用了AI，我手头有一份大数据集。这6万个样本是从5700多家企业那儿收来的，里面不光有原始数据，还有算代码和运行视频，方便大伙验证。这套测算办法是参考了周源老师在《管理评论》2025年那篇文章的做法。具体流程是这样的：第一步是把年报里的“管理层讨论与分析”部分抽出来，这部分常用来分析公司数字化转型和AI使用的情况。到了第二步，得想办法让机器学习模型知道哪些句子是在说用AI的。我先从相关文献里找了个有157个关键词的AI词典，用它把所有句子分成了两类。为了确保样本的覆盖面和随机性，我还特意按年份分组，在每个年份里各挑出500句含关键词的和500句不含的。因为光是靠人力标注太累又慢，所以我就用了个生成式大语言模型GLM-4来帮忙。我给它的提示词挺简单：“你是个AI专家，判断下面的句子是否表明企业用了AI技术，只回答1或者0。”这样一来，系统就能自动给句子打标签了。最后，我用那些被判断为“1”的句子数量来衡量每家公司的AI技术采用水平。这份数据具体怎么用、怎么算都在文献里写得清清楚楚。写这篇论文的是周源、代兴良和许冠南三位老师。