大家看,这个数据集覆盖了从2024年一直往前到2006年的时间范围,主要是研究中国各省在创新突破上的表现。数据里包含了842个企业样本,涉及34个省份,这里面把中国的香港、澳门还有台湾省都算进去了。我们的测算方法跟顶刊《经济研究》上王雄元老师以前的研究差不多,用来衡量企业创新突破度的关键指标就是CD。具体来说,CD指数反映的是企业这一年各项专利CD值的平均情况。我们是参考了Park et al.(2023)的做法,通过引用模式的不同来界定专利的“突破性”。 第一步是计算单一项专利在一次引用中的突破程度CD1指数。如果专利j引用了专利i,就把fi,t设为1,没引用就设成0;要是专利j还引用了专利i的后向引用专利,就把bi,t设为1,否则设为0。要是后面的专利既引用了专利i又引用了它的后向引用专利,那么这项引用的CD1指数就是-1;要是只引用了专利i但没引用它的后向引用专利,CD1指数就是1。第二步是计算综合突破程度CD2指数,因为专利i可能会被n项专利引用,所以每项引用的CD1指数要按被引用数量加权平均一下,得到CD2指数。最后一步确定企业所有专利的综合突破程度CD指数。因为一个企业可能有n项专利,所以把企业当年度每项专利的CD2指数按专利数量加权平均一下,就能得到该企业当年度的CD指数了。理论上这个指数在-1到1之间波动,数字越大说明创新突破度越高。 这个数据集给大家提供了原始数据、计算代码还有过程截图。保留了这些原始测算痕迹能保证结果是代码真的跑出来的,不是随便编造的。大家都可以验证一下准确性。这个研究成果主要是根据王雄元和秦江缘发表在《经济研究》2023年第11期上的论文来的。