东北财经大学通过AI技术与档案管理的深度融合,目前已完成200余小时宝贵声像档案的数字化处理,并广泛应用于学校校史研究、招生宣传、校友服务和学生活动等领域。
2024年11月,为解决700余小时磁带、胶片等传统介质声像档案多年尘封、传统载体物理老化日益严重的问题,该校启动“历史声像档案数字化保护工程”。项目组引入语音识别模型,对数百小时的长音频进行语音识别和时序提取,并将DeepSeek R1模型推理能力应用到非结构化档案数据治理领域,实现声像档案的自动转写和条目著录,形成精炼的结构化、语义化的档案资源标识,实现声像档案的科学化和规范化管理。
通过匹配合理的技术体系,该项目解决了海量非结构化数据处理的效率瓶颈,有效解决了多源异构档案资源的标准化表示与融合问题,促进档案资源的互联互通与集成利用,为后续知识重构与深度应用提供了基础。
(来源:东北财经大学丨中国日报社大连记者站 张小敏)