有人用 AI 把《史记》57万字变成了一个可以搜索、跳转、推理的知识图谱
兄弟们,今天看到一个让我直接愣住的开源项目——史记知识库,GitHub 1300 星。
一句话:有人用 AI 把《史记》57万字全部拆解标注,做成了一个可以交互、搜索、推理的知识图谱,让两千年前的文字像代码一样能语法高亮、跳转、消歧。
数据规模直接给你看清楚:
• 实体词条:14,065 个
• 标注次数:126,441 次
• 历史事件:3,198 条
• 事件关系:7,637 条
• Wiki 页面:20,830+ 页
这不是简单的文本处理,是真正的知识工程。
几个亮点真的值得单说:
(1)22类实体彩色语法高亮——人名、地名、官职、事件,每一类都有颜色标注,读《史记》像读代码一样清晰,想关哪类就关哪类
(2)史记地铁图——130条交互式时间线,支持缩放拖拽搜索,整个春秋战国到汉初的历史脉络一张图看清楚
(3)Butler AI Agent 自主维护——一个 AI Agent 持续跑了 12,000+ 轮自主更新 Wiki,不是人工录入,是 Agent 在干活
(4)矛盾检测——史记里前后记载有出入的地方,系统能自动检测出来,学术研究用这个太香了
背后的方法论也很牛:本体不是专家预先设计的,是从文本数据里"自下而上涌现"出来的,迭代速度从数周一轮压缩到数小时一轮。作者还出了两本 PDF 方法论手册,合计 863 页。
历史爱好者、做内容的、研究 AI 知识工程的,都值得去看看。
在线访问:https://t.co/Z9JoCt7KLU
GitHub:https://t.co/ARvGphJfU2
好东西转给需要的兄弟。🚀
#史记 #AI知识图谱 #开源 #老杨啊分享
点击图片查看原图