据了解,首都图书馆向来注重当地文献资源的数字化作业,推进收藏走向群众。“北京回忆”网站始建于2003年,其时网络技术在国内图书查阅范畴尚处于开始运用阶段,网站创立后展开了多项在全国图书馆界具有创始性的作业,并紧跟读者需求,于2017年晋级;历经数十载继续建造堆集,本次再度全面改版,迭代为“北京前史背景和文化常识服务渠道”,完成从底层数据到前端体会的全链条重构,将以更宏阔的视界、更优质的资源、更强壮的功用、更友爱的界面,统筹广大读者与专家学者,为各界供给更专业、更高效的常识服务。
本次晋级,根据人物库、地址库、事情库、组织职官库四大专题资源库,现在已集成12万余条实体及36万条资源描绘结构。
“北京回忆”常识服务渠道的中心语料为首都图书馆近百年沉淀的当地文献特征资源。渠道体系整合当地文献约2万种、特征专题14个、音频2900余条,新增古籍和现代文献合计11万页的精密标引数据、4670分钟视频字幕转录。渠道对近3500余件具有极端严重史料价值的拓片以及近800张戏报等宝贵文献进行了全文辨认、元数据著录与标引,支撑在全文内容中进行单字及词语等级的精准检索,显着下降大众运用资源的专业门槛;使用时空GIS将17张北京前史舆图与现代地理坐标体系的精准匹配,完成了图中每处地址与仅有经纬度坐标的对应,然后明晰提醒城市空间的古今变迁,有用提高此类宝贵资源的使用功率。
渠道建造不只着眼于当时运用,一起安身长效运营与继续晋级,同步拟定的数据加工规范与常识标引规范,保证资源建造的可操作性与可继续性。齐备的规范体系、词频数据与体系支撑,可直接服务于后续规模化文献实体标示、精品专题数据库建造与大模型练习等深度运用,推进渠道继续建立具有深度语义相关、规模宏大的“北京前史背景和文化常识图谱”与“北京回忆”大模型,继续向智能常识服务渠道稳步晋级。