数字技术唤醒沉睡档案 上海学者创新工运史研究——珍贵口述史料获新生

【问题】 上海市档案馆珍藏的120份“老工人谈话记录”,由工人运动史料委员会自1957年起历时两年采集,是珍贵的一手口述史料,较为完整地记录了从五卅运动到三次武装起义等重大历史事件;但受限于手写稿字迹不清、篇幅庞大,以及长期缺少系统整理,这批具有重要价值的资料多年未能充分被利用。 【原因】 史料整理面临两方面难题:其一,依靠人工誊录耗时耗力,约65万字的转录量让不少研究者难以推进;其二,口述史料语言口语化、信息呈碎片状,常规整理方式不易梳理出清晰的整体脉络。上海社科院历史研究所研究员马军表示:“这些用工人方言记录的材料,既是历史见证,也是语言样本,整理难度远高于一般文献。” 【对策】 陆轶隽采用“传统+创新”的组合方法推进整理:先用半年时间完成手稿逐字录入,建立基础数据库;再引入主题建模等数字人文技术,通过算法识别文本中的关键主题及其关联。该方法大幅提升了效率,将原本需要数月的工作压缩到数天,同时也帮助识别出传统阅读不易捕捉的叙事结构与线索。 【影响】 数字化整理让史料价值得到更充分的呈现:在内容层面,更还原了1927年起义中“红布标记”“北站领路”等具体细节;在研究方法层面,也为工运史研究提供了新的路径。尤其是主题分析带出了以往较少被关注的“女工参与度”“区域联动”等潜在议题。华东师范大学历史系教授李蓓评价:“这既是在抢救革命文物,也是在唤醒集体记忆。” 【前景】 目前,团队正推进线上数据库建设,计划在2026年起义百年纪念之际向学界开放。上海市档案局表示,这一目为同类历史资料的数字化整理提供了可借鉴的经验。复旦大学历史地理研究中心主任吴松弟认为:“当技术手段与人文关怀结合起来,尘封的档案就能重新进入公共视野。”

历史的分量往往藏在普通人的讲述里,记忆也需要被妥善保存并清晰呈现。从手工誊录到数字化分析的实践表明,档案活化既关乎学术研究,也关乎公共文化建设。让沉睡的口述材料重新进入研究与社会视野,不只是为一段历史补充证据,更是在为当下与未来搭建理解过去的可靠通道。