机器学习在古文字方面的研究

作为一个即喜欢机器学习又喜欢古文的攻城狮,如何有效整合这两个爱好呢?我觉得用机器学习来研究一下古文字。为此我们先研究一下相关文献


论文

  • 基于支持向量机的甲骨文文章文字结构分析

甲骨文至今 15万片,甲骨文也有75万字

  • 基于部件的甲骨文字形数据库
  • 基于已考释完成的甲骨文进行“甲骨文-- 金文” 文字对应和“甲骨文-- 现代汉语”
  • 通过监督学习、隐马尔可夫模型、贝叶斯学习等机器学习方法和原理发现新的“甲骨文-现代汉语”文字对应关系

流程图

机器学习在古文字方面的研究
image.png

部件分类

机器学习在古文字方面的研究
image.png

机器学习在古文字方面的研究
image.png

字库表

机器学习在古文字方面的研究
image.png