人工智能给古籍整理带来了新的变化和可能

这次活动主要讲了一下AI技术是怎么帮忙整理古籍的,把那些老书从博物馆里拿出来给大家看。这事儿2024年就开始搞了,现在已经弄完大概15亿字的东西,还组织了1.7万多名志愿者帮忙。卢伟是全国高等院校古籍整理研究工作委员会的秘书长,他说以前大家搞这个挺累人的,现在AI上场效率高多了,还能把大家都发动起来一起干。 这次论坛是在2025年开的,杨海峥是北京大学中文系的教授,他讲OCR技术特别好用,能把老书的字扫进去变成电脑里的文字。以前标点符号、断句这些都得人工慢慢弄,现在AI帮着做不少了。北大的那个系统叫“识典古籍”,已经连了全国1450多所大学的2万名大学生还有好多社会人士。首都师范大学的方晓辰也是个志愿者,她负责《康熙字典》里的复杂字,发现AI能把那些怪笔画都认出来,查起来特别快。 张晓波是首都师范大学敦煌学的博士生,他说自己本来在机场工作,跟古籍一点关系都没有。后来他因为对历史感兴趣就加了进来,还跟高校的老师一起修《永乐大典》。方晓辰和张晓波他们的例子说明这事儿门槛不高了,不管是不是学中文的都能上手。 卢伟提到以前光靠人力太慢了,现在人工智能弥补了这个短板。方晓辰说处理那些生僻字的时候最明显,AI能帮你快速核对正确的读音和写法。张晓波也觉得这种协作挺有意思的,既学了知识又有成就感。 杨海峥还说了个事儿,就是AI能自动比对不同版本的书里的字有没有不一样的地方。以前学者要花好长时间盯着两本书找不同,现在AI都给你列出来了。杨海峥认为这让学者们能省出更多时间去做那些真正需要动脑筋的学术判断。 到2025年的时候这场活动一共覆盖了估计有2万部的古籍。大家都觉得这是个好兆头,说明传统文化不再是冷冰冰的死东西了。这种数字化行动既抢救了古籍又把它们变成了公众能参与的活资源。 北京大学中文系、首都师范大学还有敦煌学这些地方的老师和学生都在里面出力。这个过程也说明了科技和人文是可以结合起来的。 总之这次论坛表明了人工智能给古籍整理带来了新的变化和可能。全国高等院校古籍整理研究工作委员会和一些高校的师生们共同努力把这件事做好了。 大家通过这个项目看到了传统文化在现代生活中焕发新生的希望。这个项目让2万部古籍得到了很好的保护和传承。 2万名大学生和1.7万名志愿者一起用AI给15亿字的内容做了初步的校对工作。 这项工程预计要持续到2025年结束并达到预期目标。 卢伟、张晓波、方晓辰、杨海峥他们这些人都参与了这次论坛并发表了看法。 北京大学中文系和首都师范大学的师生们为这个项目提供了很多支持和帮助。