Research

古籍知识库

如今,古籍库的使用需求正在由数字化向数据化,即知识库的方向转变。数字化和数据化的最大区别是,前者仅可提供简单的字词检索,后者则具结构化、关联性,可自动进行知识再生。辅之以相应的工具,借助此前中外一切中国古典学的研究成果,

AI与碑刻数字化

碑刻数字化是古籍数字化的一个细分领域,仍存在碑刻拓片难以大量收集的问题,以及在文本OCR方面的两大难题:1.大量结构复杂多变的异构字,异构字识别的难点是样本少,种类多;2.严重的拓片图像质量退化问题,如残破、模糊、缺失等。

汉字字形的编码方法(原创)

统一字符编码标准Unicode是信息技术领域的业界标准,目的是为了整理和编码世界上大部分的文字系统(包含历史文献中的字符),使得电脑系统能以统一的字符集来处理和显示文字,减轻了过去在不同编码系统间切换和转换的困扰,并提供了一种跨平台的乱码问题解决方案。Unicode由非营利机构Unicode联盟(Unicode Consortium)负责维护。

数字化《说文解字》(北师大)

数字化《说文解字》(http://szsw.bnu.edu.cn)是运用现代信息技术,对《说文解字》

中华碑刻典藏与汉字研究平台(北师大)

中华碑刻典藏与汉字研究平台(http://ldbk.bnu.edu.cn)是在民俗典籍文字研究中心研发的“近代碑刻数字化研究平台”的基础上打造而成的。改版后的平台除继承原平台对近代碑刻资源(

汉字全息资源应用系统(北师大)

汉字全息资源应用系统(https://qxk.bnu.edu.cn)是在新型汉字学理论的指导下,运用当前的数据库技术、信息挖掘技术、可视化技术等现代化手段,