兄弟们,继上一个史记知识图谱的分享,老杨再分享一个超级的开源项目--中华古典诗词数据库,唐诗宋词诗经论语全部安排到位。
这个宝藏开源项目——chinese-poetry,GitHub 5.1万 星、10000 个 Fork,这个体量在国内开源项目里真的不多见。
一句话介绍:最全的中华古典文集数据库,全部以 JSON 格式开放,唐诗宋词宋诗诗经论语四书五经元曲楚辞,全在里面。
数据规模直接列给你看:
• 唐诗:5.5 万首
• 宋诗:26 万首
• 宋词:2.1 万首
• 唐宋诗人:1.4 万位
• 宋词词人:1,564 位
还有五代花间集、南唐二主词、蒙学、楚辞、纳兰性德诗集、御定全唐詩……基本上你能想到的古典文集,这里都有。
为什么这个值得分享:
(1)全部 JSON 格式——开发者直接拿来用,做诗词 App、AI 训练数据、古典文学分析、每日一诗推送,接进去就能跑
(2)51000 颗星说明什么——这个数据集已经在无数项目里跑了,经过大量真实验证,质量有保障
(3)完全免费 MIT 协议——商用个人用都没限制,想怎么用怎么用
做 AI 应用的、做文化类内容的、想给自己的产品接一个古诗词功能的,直接拿去用,不用自己爬数据了。
好东西转给需要的兄弟。🚀
#古典诗词 #开源数据集 #AI训练数据 #老杨啊分享
点击图片查看原图