01、扫描方式
扫描方式要根据档案幅面的大小(A4、A3、A0)选择相应规格的扫描仪和专业扫描仪(如工程扫描可采用0号图纸扫描仪)进行扫描。大幅面档案可以采用大幅面数码平台,或者用缩微拍摄后的胶片数字化转换设备进行扫描,也可以采用小幅面扫描后的图像拼接方式处理。如果纸张较长但幅面不超过A3,可采用扫描仪长纸扫描功能,根据纸张状况设定合适的扫描幅长即可。
纸张较差的情况,或者过于薄、过软、超厚的档案,可采用平板扫描方式。纸张状况较好的档案可采用高速扫描的方式进行扫描,以提高工作效率。
纸张比较薄的档案(如信纸、便笺纸)容易破损且透光,应采用中、低档进行扫描。
纸张如有破损,可将破损纸张夹人透明塑料薄膜内,调整扫描仪进纸为厚纸模式并采用中、低档进行扫描,如破损严重且不平整,采用平板扫描仪来完成。下面以图档易扫通扫描软件为例,作以详细介绍。见图1扫描作业平台。
(1)扫描色彩模式
扫描色彩模式一般分为黑白二值、灰度、彩色等,通常采用黑白二值。页面为黑白两色,并且字迹清晰、不带插图的档案,可采用黑白二值模式进行扫描。
页面为黑白两色,但字迹清晰度差或者带有插图的档案,以及页面为多色文字的档案,可采用灰度模式扫描。
页面中带有红头、印章或者插有黑白照片、彩色照片、彩色插图的档案,可视需要采用彩色模式进行扫描。
底灰较深的纸张(如草浆纸、油印纸),如采用黑白二值应将扫描对比度及亮度适当调低,调节效果不理想则采用灰度扫描。
字迹较浅(如铅笔字)的纸张:如采用黑白二值扫描应调节临界值,拉大字迹与原稿的反差,效果不理想则采用灰度扫描。见图2扫描色彩模式。
(2)扫描分辨率
扫描分辨率参数大小的选择,原则上是以扫描后的图像清晰、完整、不影响图像的利用效果为准。为了方便以后OCR识别,扫描分辨率建议选择大于等于300dpi。一般情况下,分辨率越高识别率也就会越高。但这也不是绝对的,对于一些过大过粗的字体,设置过高的分辨率,识别率可能会降低,而且设置高分辨率后,扫描速度会大大降低。见图3扫描分辨率选择。
(3)亮度和对比度
在扫描过程中,适当地调整好扫描仪的亮度和对比度值,对识别率的高低影响比较大,在进行扫描亮度和对比度的设定时,以扫描后的图像中文字的笔画较细、均匀,且没有明显断点为准。如果扫描后的文字图像存在有黑点、黑斑或者文字线条很粗很黑,分不清楚笔画的情况下,说明亮度值太小,应该增加亮度值再重新扫描。如果文字线条凹凸不平,有断线甚至图像中汉字轮廓残缺时,说明亮度太大,应减小亮度后再重新扫描。
(4)扫描登记
认真填写纸质档案数字化扫描过程中交接登记表单,登记扫描的页数,核对每份文件的实际扫描页数和档案整理时填写的文件页数是否一致,不一致时应注明具体原因和处理方法。
2、档案数字化扫描工序
扫描工序是整理工序之后的第二道工序,主要功能就是将整理和分检好的纸质档案通过专用扫描仪生成高质量的图像文件,并进行图像压缩存储处理,为下一道工序提供基础的图像数据。
扫描工序的功能职责主要包括资料扫描、特殊资料重复扫描、页数核对等。下面将逐一进行介绍。
(1)纸质档案顺序扫描
工作人员将整理好的纸质档案按顺序放入扫描仪的入口,进行扫描处理,生成连续的图像文件。程序对扫描生成的图像数据会自动进行压缩存储。
(2)在扫描过程中工作人员应注意以下几点:
①扫描顺序
扫描时,工作人员必须按照整理好的顺序进行扫描,不能颠倒档案的扫描顺序。
②控制顺序扫描的纸张数量
在扫描时,一次性放入送纸口的文件数量不宜大多,最好不要超过10张,以避免由于在扫描过程中发生错误后,而导致大量文件重新描的现象发生,并且可以避免由于扫描仪一次进多张纸而漏扫纸张的情况发生。
③保证扫描图像质量
扫描工序必须严格把好图像质量的第一关。要保证扫描生成的图像质量清晰、无倾斜,特别是不能出现诸如漏扫、图像资料严重模糊不清等严重错误。
④核对扫描页数
一卷档案扫描完成后,必须对纸张档案页数和扫描生成的图像页数进行核对,如系统扫描后计算的页数与人工计算的页数不一致,则需视情况予以补扫描或重新扫描处理。
⑤档案排序
排序工序位于扫描之后,是扫描加工流程中四级质量监控体系中的第一道检查工序,主要功能是对扫描工序生成的图像数据进行质量检查、核对纸质档案并录入其索引数据项。
在排序工序中,扫描的档案是按“档案卷”建立索引数据项,即每一卷档案有一条索引信息。排序工序的功能职责主要包括检查图像质量、建立索引信息两部分。