设计前言:
识典古籍平台是北京大学和字节联合推出的古籍阅读与整理平台,为用户提供了免费公开、稳定、快速、方便的检索和阅读古籍的服务,同时也支持古籍收藏机构和整理人员的一站式古籍智能整理工作。
识典古籍平台的数据来源是什么?
识典古籍平台的数据主要来源于《四部丛刊》的影印本,这是中国古代最大的类书之一,收录了先秦至明初的各类典籍七八千种,被称为典籍渊薮、佚书宝库 。《四部丛刊》的影印本由北京大学图书馆提供,经过人工智能技术和人工校对后,转化为数字化文本,并发布到识典古籍平台上。
除了《四部丛刊》之外,识典古籍平台还计划收录其他来源的古籍数据,如《永乐大典》、《古今图书集成》等,以及其他古籍收藏机构提供的数据。未来三年,“识典古籍”将陆续完成一万种古籍的智能化整理工作,基本覆盖儒家、道家和佛家的核心书目。
识典古籍平台的数据质量如何?
识典古籍平台的数据质量分为粗校和精校两种。粗校主要是指文本较为准确,但是标点与实体的识别都是通过机器自动识别,还未经人工校对。精校则是文字、标点、实体均经过人工的认真校对。
目前平台上的部分文本正在精校过程中,已经精校的文本将陆续上线。用户可以通过图文对照的功能进行核对,以提高文本内容的可靠性与可用性。如果用户发现文本中有错误或不足之处,可以通过反馈功能向平台提出建议或意见。
识典古籍平台支持哪些检索方式?
识典古籍平台支持多种检索方式,包括全文检索、标题检索、作者检索、版本检索等 。用户可以在搜索框中输入关键词或短语,选择检索范围和排序方式,进行检索。检索结果会显示相关书名、卷数、页码、摘要等信息,用户可以点击进入具体的阅读界面 。
除了基本的检索方式之外,识典古籍平台还支持高级检索功能,用户可以在高级检索页面中输入多个关键词或短语,并指定它们之间的逻辑关系(与、或、非),进行更精确的检索 。高级检索结果也会显示相关信息,并提供进入阅读界面的链接 。
识典古籍平台支持哪些异体字?
识典古籍平台支持大量的异体字,包括常见的异体字、古代的异体字、地方的异体字等 。平台上的文本默认以繁体字型显示,用户可以通过繁简转换的功能进行切换。平台上的异体字都经过了标准化处理,可以在检索和阅读中正常显示和识别。
如果用户在平台上发现有未收录或错误的异体字,可以通过反馈功能向平台提出建议或意见。平台会定期更新和完善异体字库,以提高文本的准确性和可读性。
网站地址:
传送门:点击查看