档案数字化加工是将传统档案转化为数字形式的关键过程,其流程的科学性和严谨性直接关系到数字化成果的质量和可用性。
柳州市档案数字化加工公司
1、数字化前期准备
前期准备包括选定数字化处理场所,筛选需要扫描的纸质档案。其中处理场所应确保空间布局合理,扫描设备完善,数字化处理软件齐备,并具备合格的消防和安防系统。准备纸质档案,需要按类型、日期或其他相关标准对文件进行排序,并确保没有任何污垢其他可能影响扫描图像质量的损坏,以保障扫描过程顺利、有效的进行。
2、档案扫描
档案扫描是纸质档案转化数字档案的关键步骤。档案扫描可以使用各种不同的扫描设备来完成,例如:平板扫描仪、工程扫描仪或鼓式扫描仪。具体使用什么扫描仪将取决于所扫描文件的类型和数量,以及所需的分辨率和其他因素。原件的扫描与存储格式应完全按照国家档案管理的统一标准进行,对实际扫描卷数、每卷的页数要做好登记。
3、图像处理
(1)图像数据质量检验:
对图像偏斜度、清晰度、失真度等进行检查。发现不符合图像质量要求时,应重新进行图像的处理。
由于操作不当,造成扫描的图像文件不完整或无法清晰识别时,应重新扫描。
发现文件漏扫时,应及时补扫并正确插入图像。
发现扫描图像的排列顺序与档案原件不一致时,应及时进行调整。
认真填写相关表单,记录质检结果和处理意见
(2)纠偏:对出现偏斜的图像应进行纠偏处理,以达到视觉上基本不感觉偏斜为准。对方向不正确的图像应进行旋转还原,以符合阅读习惯。
(3)去污:对图像页面中出现的影响图像质量的杂质如黑点、黑线、黑框、黑边等应进行去污处理。处理过程中应遵循在不影响可懂度的前提下展现档案原貌的原则。
(4)图像拼接:对大幅面档案进行分区扫描形成的多幅图像,应进行拼接处理,合并为一个完整的图像,以保证档案数字化图像的整体性。
(5)裁边处理:采用彩色模式扫描的图像应进行裁边处理,去除多余的白边,以有效缩小图像文件的容量,节省存储空间。
4、图像存储
(1)存储格式:批量扫描后形成的图像文件在存储时一般应进行压缩。图像压缩指消除图像冗余或对图像近似的任一种过程,其目的是对图像以更紧凑的形式表示。纸质档案数字化过程中,较常见的有TIFF(G4)、JPEG等压缩格式。采用黑白二值模式扫描的图像文件,一般采用TIFF(G4)格式存储。采用灰模式和彩色模式扫描的文件,一般采用JPEG格式存储。存储时压缩率的选择,应以保证扫描的图像清晰可读的前提下,尽量减小存储容量为准则。提供网络查询的扫描图像,也可存储为CEB、PDF或其他格式。
(2)图像文件的命名:纸质档案目录数据库中的每一份文件,都有一个与之相对应的唯一档号,以该档号为这份文件扫描后的图像文件命名。多页文件可采用该档号建立相应文件夹,按页码顺序对图像文件命名。
5、目录建库
(1)数据格式选择:目录建库选择通用的数据格式。所选定的数据格式应能直接或间接通过XML文档进行数据交换。
(2)档案著录:按照《档案著录规则》(DA/T18)的要求进行著录,建立档案目录数据库。
(3)目录数据质量检查:采用人工校对或软件自动校对的方式,对目录数据库的建库质量进行检查。核对著录项目是否完整、著录内容是否规范、准确,发现不合格的数据应要求进行修改或重录。
6、数据挂接
数据挂接又称数据匹配,是数字归档中为保证数字档案的准确性和完整性所需要的流程。借助软件对数据库中的目录数据与对应的数字档案进行匹配挂接,并逐条对挂接结果进行检查,包括目录数据与数字档案对应的准确性、已挂接数字档案与实际扫描数量的一致性、数字档案是否能正常打开等,以实现准确关联。
7、档案还原装订
扫描工作完成后,拆除过装订物的档案应按档案保管的要求重新装订。恢复装订时,应注意保持档案的排列顺序不变,做到安全、准确、无遗漏。档案装订分为整卷装订和按件装订两种。通常采用三孔一线方法装订;文件很薄时,也可采用缝纫机扎线装订,但线脚不宜过密,以免出现折断档案现象。
8、数据验收
项目验收是档案数字化加工中,用于确保数字化后的档案符合所需质量标准和规范的过程。这通常涉及对数字档案进行一系列测试和检查,以验证它们具有足够的质量并符合指定的标准。这其中包括图像扫描、检查处理数据匹配步骤中可能存在的错误、遗漏或其他问题。在某些情况下,项目验收测试还可能涉及使用专门的软件工具来完成该过程,以确保符合所需标准。
9、数据移交
可以通过各种不同的存储技术来实现,例如:硬盘驱动器、网络连接的存储设备或云服务器等。所使用的具体技术将取决于传输图像的数量,以及相关档案管理部门的要求。这样就可以确保数字档案被妥善存储和保护,并可供将来访问和使用。
总之,档案数字化加工流程是一个环环相扣、紧密协作的过程。从前期准备到最后的质量检查,每一个步骤都不可或缺,共同确保档案数字化工作的顺利完成和高质量成果的呈现。