2023年4月20日,“了不起的甲骨文”小程序正式发布上线,同时举行了“甲骨文数字焕活”研讨会,会议围绕古文字与人工智能、甲骨文数字焕活总体思路、算法助力甲骨文焕活、甲骨文活化利用等重要议题展开。
甲骨文是汉字源头,其保护研究与传承活化上,仍需突破一些问题:首先,已经出土的甲骨约15到16万片,自然损坏速度较快,急需进行数据采集在数字空间进行永久化保存;其次,已经发现的约4500个甲骨字,其中约3000字尚未释读,甲骨文专家学者数量少,急需智能工具帮助提升字形匹配的搜索效率、推荐破译的相关线索;第三,甲骨文作为冷门绝学,与公众的距离很远,而甲骨文蕴含着丰富的造字智慧和文化价值,急需将冷门的文化资源转化成大家喜闻乐见愿意参与的普惠文化服务;第四,甲骨文活化利用的素材有限、手段传统、渠道不畅,急需系统化开展工作。
如何将前沿数字技术应用到文化遗产保护领域,是腾讯一直在思考的问题。自去年12月起,腾讯与河南安阳牵手,历经4个月的合作,由河南安阳市文物局、安阳师范学院甲骨文信息处理教育部实验室、中国文字博物馆、中国社会科学院考古研究所安阳工作站、腾讯SSV数字文化实验室、腾讯优图实验室、QQ浏览器共同推进的人机协同助力甲骨文“破译”和传承活化的专项合作,迎来阶段性成果,“了不起的甲骨文”小程序如今发布上线,将成为“甲骨文数字焕活”专业、实用、有趣的网络载体。
“了不起的甲骨文”小程序所使用的甲骨文高质量数据,源自世界上现有资料最齐全和最权威且可免费使用的甲骨文数据平台之一的“殷契文渊”,既可以为公众提供参与甲骨文传承活化的互动平台,也可以帮助专家学者进行甲骨文保护研究。
在底层技术的突破上,将从数据采集、信息建模、文字匹配几个步骤破题。
传统的甲骨文著录里提供的拓片、摹本、照片与实物相比,信息丢失较多,而学者到收藏机构查看甲骨实物的过程很不便利。项目组将通过系统梳理殷墟出土的各类甲骨实物特点,运用光照变换矩阵技术形成便携设备,大幅提升采集的速度和精度,用于甲骨文馆藏机构的大批量采集。
这些数据借助人工智能等技术实现“微痕分析”的突破,形成“甲骨文全信息数据模型”,实现了甲骨实物在数字空间的高保真还原和保护,并不断丰富完善甲骨文模型库。
甲骨文的研究重在文字,而甲骨文尚未进行标准编码,异体字、相近字、文字演变的查询比较困难。腾讯针对性研发的视觉AI技术,将用于训练文字检测、字形匹配等定制化算法,大幅提升甲骨文考释研究和“破译”的效率和质量。
小程序可以作为中小学和文博机构、社会教育部门进行甲骨文研学的线上工具。爱好者也可以进行文字标注、提供破译线索,通过创意互动,承担甲骨文专家学者和信息处理团队已经分解的简单任务,进而形成甲骨文研究与传承双向互动的众创模式。
为了让甲骨文“冷门不冷、绝学不绝”,小程序还采用故事性引入、游戏化互动、社交化分享的方式,通过文字临摹、文字创造等功能,让公众体验了解甲骨文及汉字演变。
基于已释读的甲骨文权威数据,打开QQ浏览器搜索其中汉字即可查看权威的甲骨文对照信息,或使用“QQ浏览器扫描王”的识生字功能对该汉字进行摄像头识别,还能看到甲骨文的字源演变动画,直观感受汉字变迁源流。此外,用户还可以在腾讯搜狗百科中,全面地了解汉字的“前世今生”。
编辑 姚静霞 二审 麦苗茵 三审 张露锋