#  Extraction of Biographical Data from "Quan Song Shi" and CBDB 

 



 哈佛大学IQSS访问学者、厦门大学历史学系副教授梁建国老师以“《全宋诗》人物信息提取与CBDB”为题做了访学工作汇报。

 报告分为四部分：

 1、《全宋诗》人物信息提取的工作底本及其整理情况；

 2、《全宋诗》作者与CBDB人名ID的匹配与消歧；

 3、《全宋诗》诗题的人物信息提取；

 4、未来的工作设想。

 报告指出，由于版权问题，完整权威的《全宋诗》的电子底本尚未获得，对该工作的开展造成一定的影响。包弼德教授表示接下来会积极争取相关方面的合作。报告还指出，基于残缺的《全宋诗》底本进行分析统计，至少有3000个诗歌作者在CBDB里尚没有建立ID，如果再加上诗题中的人物，数量会更为庞大，因此，《全宋诗》人物信息提取工作的完成将会切实扩充CBDB中的人物数据。梁老师指出，CBDB项目组在对人物信息进行提取时，积极使用python等数字技术进行批量处理，再结合文史知识进行消岐和勘误，充分体现了数字人文项目跨学科合作的特点。这项工作的开展得到了包弼德教授、项目经理王宏甦、Lex、Edith的支持和指导，加拿大麦克马斯特大学的杨云飞同学发挥自己计算机专业的优势，也参与了《全宋诗》人物信息的提取工作。对于未来的工作设想，梁老师希望能够对诗题中的社会交往类型以及地名信息进行提取。

 随后，梁老师简要介绍了自己在访学期间所做的个人研究，主要是围绕北宋京畿地区洪涝治理进行资料整理和部分章节的撰写。包弼德教授和CBDB访问学者对感兴趣的问题进行了提问和热烈讨论。