《管理评论》周源:ai是如何炼成的?

为了搞清楚从2000年到2024年上市公司到底在多大程度上用了AI,我手头有一份大数据集。这6万个样本是从5700多家企业那儿收来的,里面不光有原始数据,还有算代码和运行视频,方便大伙验证。 这套测算办法是参考了周源老师在《管理评论》2025年那篇文章的做法。具体流程是这样的:第一步是把年报里的“管理层讨论与分析”部分抽出来,这部分常用来分析公司数字化转型和AI使用的情况。 到了第二步,得想办法让机器学习模型知道哪些句子是在说用AI的。我先从相关文献里找了个有157个关键词的AI词典,用它把所有句子分成了两类。为了确保样本的覆盖面和随机性,我还特意按年份分组,在每个年份里各挑出500句含关键词的和500句不含的。 因为光是靠人力标注太累又慢,所以我就用了个生成式大语言模型GLM-4来帮忙。我给它的提示词挺简单:“你是个AI专家,判断下面的句子是否表明企业用了AI技术,只回答1或者0。”这样一来,系统就能自动给句子打标签了。 最后,我用那些被判断为“1”的句子数量来衡量每家公司的AI技术采用水平。这份数据具体怎么用、怎么算都在文献里写得清清楚楚。写这篇论文的是周源、代兴良和许冠南三位老师。