您好,欢迎访问华图信息官网!
欢迎来到华图信息技术有限公司档案管理系统\档案信息化建设\档案数字化加工服务
全国咨询热线:15515975772
当前位置: 首页 > 新闻中心 > 行业资讯

纸质档案数字化幅面

作者:老师 时间:2023-03-03 11:33:11 点击:

纸质档案数字化幅面

纸质档案数字化有哪些基本要求

纸质档案是以纸张作为载体的一种档案,如保存备查的公文图纸、信札、电报、户籍、帐册、契约、证书、书稿、日记、笔记、家谱的原本和原稿。以下我为大家整理了纸质档案数字化有哪些基本要求的详细内容,希望对大家有所帮助!

纸质档案数字化基本要求

1、基本原则

纸质档案数字化的基本原则是使档案信息资源准确方便快捷地提供利用,使可以公开的档案信息资源得到共享,以满足社会对档案利用的需求。

2、数字化对像的确定原则

应当对所要进行数字化的对象按照一定的原则和方法进行确认,只有符合一定要求的纸质档案文献才能进行数字化。

1)符合国家法律法规的原则

纸质档案的数字化,必须符合国家档案开放规定以及有关规定。

2)价值性原则属于归档范围且应永久或长期保存的、社会利用价值高的'档案可列入数字化加工的范围。

3、基本环节

纸质档案数字化的基本环节主要包括:档案整理、目录建库、档案扫描、图像处理、图像存储、数据质检、数据挂接、数据验收、数据备份、成果管理等。

档案扫描

纸质档案数字化幅面

1、扫描方式

1)根据档案幅面的大小(A4、A3、A0等)选择相应规格的扫描仪或专业扫描仪(如工程图纸可采用0号图纸扫描仪)进行扫描。大幅面档案可采用大幅面数码平台,或者缩微拍摄后的胶片数字化转换设备等进行扫描,也可以采用小幅面扫描后的图像拼接方式处理。

2)纸张状况较差,以及过薄、过软或超厚的档案,应采用平板扫描方式;纸张状况好的档案可采用高速扫描方式以提高工作效率。

2、扫描色彩模式

1)扫描色彩模式一般有黑白二值、灰度、彩色等。通常采用黑白二值。

2)页面为黑白两色,并且字迹清晰、不带插图的档案,可采用黑白二值模式进行扫描。

3)页面为黑白两色,但字迹清晰度差或带有插图的档案,以及页面为多色文字的档案,可采用灰度模式扫描。

4)页面中有红头、印章或插有黑白照片、彩色照片、彩色插图的档案,可视需要采用彩色模式进行扫描。

3、扫描分辨率

1)扫描分辨率参数大小的选择,原则上以扫描后的图像清晰、完整、不影响图像的利用效果为准。

2)采用黑白二值、灰度、彩色几种模式对档案进行扫描时,其分辨率一般均建议选择≥200dpi。特殊情况下,如文字偏小、密集、清晰度较差等,可适当提高分辨率。

3)需要进行OCR汉字识别的档案,扫描分辨率建议选择≥300dpi。

纸质档案数字化处理的基本程序与方法

纸质档案数字化幅面

任何一个有一定存在历史的机构,都有一定数量的纸质档案,将这些纸质档案数字化,有利于管理与利用。
下面,将以检察院的纸质档案数字化为例,对档案数字化处理的基本程序与方法予以介绍。
创建档案管理分类架构
检察院的综合档案管理,分类架构一般为:
文书档案、财务档案、声像档案、实物档案、基建档案、设备档案、司法鉴定档案、诉讼档案和电子档案等九大类,诉讼档案是检察院最为专业、也最为重要的档案类型。
各级检察院可根据自身管理需要,进行更详细的档案分类管理。
取卷
从库房拿取需要数字化的纸质实体案卷,取卷时注意:
准确记录所取案卷的物理存放位置。
依次拿取,不要丢卷,确保案卷的完整。
档案定义
档案定义,是3Hmis的专用术语,实际上就是确定档案的最底层分类的相关属性,或称案卷的相关属性。3Hmis可同时管理纸质档案和数字化档案,如果3Hmis已存在相关案卷信息,此步骤可省略。
关于档案定义的具体操作,前面已详细介绍,这里不再重复。
拆卷
拆卷的含义是手工拆除案卷装订,如果纸质实体案卷信息已保存在3Hmis系统中,还应执行取消注册功能,相当于在3Hmis中执行拆卷操作。
拆卷的注意事项:
保证案卷的完整,检查是否有缺页、漏页及其它错误,正、副卷标注是否正确。
保持案卷的清洁。
拆开案卷,将案卷背面的封条小心撕干净,剪开装订线。
取掉案卷中的金属物。
将卷内文件一页页分开,对单面、双面等情况进行标注,以提醒扫描人员注意。
为了方便扫描及时与扫描人员沟通。
注明每卷(包括正、副卷)的页数及其他的特殊情况。
如有疑问,应及时向档案管理员进行咨询和沟通,不得擅自违规处理。
录入卷内文件信息
一份案卷,一般都由多份性质相同或相似的文件组成,即所谓卷内文件。
如果系统中已存在卷内文件目录,不必在录入,若无,则采用新建文件的方法,录入卷内文件属性信息。
扫描
对已录入相关属性的卷内文件进行扫描,并将扫描结果文件引入(上传)档案系统。
3Hmis的图片管理器内嵌扫描处理程序,可在录入卷内文件信息的同时直接调用扫描模块进行扫描(支持高速扫描仪),用户亦可使用其它扫描程序扫描文件(但使用3Hmis提供的图片管理器更为简单方便),然后,再通过引入功能将扫描文件引入档案系统,3Hmis还提供了专门的批量引入工具。
如果检察院有更严格的数字化档案安全管理要求,并有专门用于归档的电子印章,可在扫描文件上加盖归档专用的电子印章。
扫描时的注意事项如下:
根据需要设置扫描文件的格式和分辨率,3Hmis可对各种常用格式的数字化文件进行管理。
对于封面、内页、手写诉状或是发票等各类不同证据材料,需用不同的比例或扫描方法进行扫描。
根据规则设置扫描文件的存放位置和扫描结果文件的文件名(采用3Hmis图片管理器扫描时,将自动上传,股不需要存放在客户端)。
将扫描页数和拆卷人所注明的页数核对,确保不重扫、漏扫、多扫,同时保证案卷的清晰度,对扫描结果不佳的页面进行专门处理。

干货:档案数字化加工,核心7大步骤,档案管理人必备!

本期主编:橙子

话不多说,进入正题了!

(1)纸质档案数字化需要相应的设备和场所,数字化处理场所应具有足够的空间和合理的布局,并可配备门禁、防盗、视频监控等消防系统和安防系统。

(2)数字处理设备需要计算机、扫描仪、录音机和存储介质。如果可以配置服务器、 备份设备、数码相机等则更好。

(3)数字处理工作还需要相应的软件系统支持,如操作系统、文件管理软件、扫描程序、录音软件、备份软件、杀毒软件等。 确保数字处理工作的安全和保障 。

要先将扫描仪连接到计算机,安装驱动程序和扫描软件后即可使用。工作人员应能掌握和使用扫描仪的操作方法和扫描仪参数设置。

扫描动作并不复杂,就是把纸质文件放入扫描仪,扫描,把文件取出扫描仪。

在扫描之前,我们必须设置扫描模式、扫描颜色模式、扫描分辨率和图像存储格式。

目前有手持式扫描仪、平板扫描仪、鼓式扫描仪、高射扫描仪、大幅面扫描仪、 胶片扫描仪等。根据需要和档案的纸张质量进行选择。

颜色常常又和图像存储格式相关联,彩色图像通常以JPG格式存储,如果以TIFF格式存储,占用空间比较大;

扫描分辨率是影响档案直观效果的重要参数,通常的规定分辨率在300dpi以上。 具体要根据以上参数的确定,再进行亮度、对比度的微调。

标准要求扫描图像尽可能反映文件的原貌,但在扫描过程中,由于文件纸张宽度、纸张粗糙度、字迹散乱、颜色不均匀等因素。

在这些情况下,需要进行图像处理操作,一般需要通过专门 的图像处理软件来实现。它要能够实现图像拼接、图像去污、修剪、旋转、校正等图像处理,确保图像完整、正确 。

检查员必须掌握纸质文件数字化处理的标准要求,检查人员要尽职尽责,要求做到100%检查,并且合格率应达到100%。

检查的事项有图像是否清晰、画质是否色彩失真、图像是否倾斜、图像上是否有阴影或黑点,图片大小和格式是否符合规定等。

使用数字文件的方法基本上是通过目录搜索数据,要仔细的检查目录能否与图像和数字 复印一一对应,检查合格率应为100%,发现问题时,必须重新修改完善。

将通过检查的数据可以离线保存。应根据数字档案管理系统的设计模板建立包括图像文件命名方法在内的存储结构,并 尽可能完整地描述相关文档 。

包括人员登记表、数字化处理文件登记表、统计表、质量检查表、编码描述文件、数据描述等。

这是扫描和处理工作完成之前的最后一项。将档案数字化的成果移交档案管理部门,移交内容由档案管理部门规定。

交接过程包括交接前的验收和办理交接手续。 交接手续时经双方盖章确认后方才生效。

这期就说到这里,欢迎在评论区留下你的看法,觉得有用可以分享给身边的人,我们下期再见。

档案馆要弄信息数字化,需要对纸质档案进行扫描,我想问下各种幅面大小的单价是多少,比如A1的多少一张

楼主,你是要买扫描仪吗?
还是将文档进行扫描储存在电脑里面的单价?
扫描文档的成本就是机器磨损和人员工资。你这A1一张是多少钱。。。意思不是太清楚。
如果是买扫描仪你可以将你要扫描的最大幅面是多少就可以了,扫描最低参数都是:彩色(灰度、黑白),分辨率:300dpi的。
你要A4扫描仪我可以推荐:
明基5560
基本参数
产品用途:商业应用/个人家用 纠错 产品类型:平板式 纠错 最大幅面:A4 纠错 扫描元件:CCD 纠错 光学分辨率:1200x2400dpi 纠错 最大分辨率:19200×19200dpi 纠错 扫描范围:214×294mm 纠错 扫描介质:文件,图片,照片,名片 纠错 接口类型:USB2.0/1.1 纠错
性能参数 色彩位数:彩色:48bit,灰阶:16bit 纠错 灰度参数:灰阶 16bit(输入/输出) 纠错 双面扫描:手动 纠错 网络扫描:不支持 纠错
其它参数
产品尺寸:412×258×73mm 纠错 产品重量:2.2kg 纠错 操作系统:Windows XP/2000 纠错 电源类型:16V,0.9A 纠错 工作噪音:低于50dB 纠错 环境参数:工作温度:0-40℃,工作湿度:10-85% 纠错
扫描仪附件 包装清单:主机 x1
电源适配器 x1
USB电缆线 x1
使用手册 x1
随机光盘 x1
保修卡 x1 纠错 随机软件:MiraScan扫描仪驱动程序
电子档用户手册
Acrobat Reader(PDF阅读软件)
ABBYY FineReader Sprint(多国文字识别软件)
汉王OCR(中英文文字识别软件)
拼接精灵MergeMagic(享受大幅面扫描)
Ulead PhotoExplorer SE Basic(多媒体管理软件)
Ulead PhotoExpress SE(我行我速软件) 纠错
我想你问的也不是打印。。。

什么叫档案数字化,档案数字化有哪些好处?

什么叫档案数字化,档案数字化的好处
档案数字化是一种新型的档案信息管理模式,它把各种载体的档案资源转化为数字化的档案信息,以数字化的形式存储,网络化的形式互相连接,利用计算机系统进行管理,形成一个有序结构的档案信息库,及时提供利用,实现资源共享。
1.代替原件使用,有效延长原件的保存时间。
2.数字化副本分地保存。要长期或永久保存的重要档案,用数据备份的方法制成多份数字化副本的备份分地保存。
3.恢复档案材料模糊褪变的字迹。对字迹出现模糊扩散或褪变的档案,可经过计算机扫描等处理技术恢复模糊褪变字迹。
4.提高办公效率,数字化档案管理使资料能及时归档,并尽快提供利用,从而提高办公效率。
5.提高经济效益,数字化管理档案使传统的以纸质为载体的档案信息对象转为机读档案,不仅节约了保管费用,节省了占地空间,而且查阅方便迅速,避免了反复印制资料而造成的纸张和人员的浪费。

档案录入工作规范

纸质档案数字化技术规范DA/T31-2005

1 范围
本标准规定了纸质档案数字化的主要技术要求。
本标准适用于用扫描仪对各种纸质档案的数字化加工处理。

2 规范性引用文件
下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。
GB/T 17235.1 连续色调静态图像的数字压缩编码
GB/T 17235.2 连续色调静态图像的数字压缩编码
GB/T 18894?2002 电子文件归档与管理规范
ITU(CCITT)G3 二值图像压缩算法
ITU(CCITT)G4 二值图像压缩算法
DA/T18?1999 档案著录规则
档案管理软件功能要求暂行规定国家档案局档发[2001]6号

3 术语和定义
下列术语和定义适用于本标准。
3.1
数字化 Digitization
用计算机技术将模拟图像转换为数字图像的处理过程。
3.2
纸质档案数字 化Digitization of Paper?Based Records
对普通(黑色字迹清晰)的油印、铅印、胶印等印刷件或复印件纸质档案进行数字化及应用的过程。
3.3
数字图像 Digital Image
表示景物图像的整数阵列。一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。在矩阵(或其他)网络上采样一连续函数,并在采样点上将值最小化后的阵列。
3.4
黑白二值图像 Binary Image
只有黑白两级灰度的数字图像。它对应于黑和白的两种状态文字稿、线条图、指纹图等。
3.5
连续色调静态图像 Continuous?tone Still Image
以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态数字
图像。
3.6
失真度 Distortion Measure
对档案原件进行数字化转换后,在同等测试环境下,数字图像与档案原
件色彩、几何、压缩算法等差值。
3.7
可懂度 intelligibility
表示数字图像向人或机器提供信息的能力。
3.8
清除图像冗余或对图像近似的任一种过程,其目的是对图像以更紧凑的形式表现。
3. 9
   分辨率 Resolution
指单位长度内图像包含的点数或像素数。
3.10
TIFF Tagged Tmage File Format
标记图像文件格式。一种基于标记的无损(不丢失信息)压缩格式,用于在应用程序之间和计算机平台之间交换文件。因为它存储图像细微层次的信息非常多,图像的质量也得以提高,故而非常有利于原件为黑白档案的复制储存。
3.11
   JPEG Joint photographic Experts Group
联合照片专家组。一种丢失少量信息的压缩格式,尤其适用于屏幕和打印显示,支持所有主要计算机平台和Web浏览器。JPEG格式文件小,影像质量多数情况下均可接受。考虑储存空间及传输效率,原件为彩色的档案可迁此格式复制储存。

4 数字化基本流程
纸质档案数字化的基本流程主要包括案卷整理、目录建库、批量扫描、数据处理、信息存储、检索利用等工序。
4.1 案卷整理
对需要扫描的案卷进行适当整理,做出标识。
4.2 目录建库
为数字化的档案检索而建立必要的目录数据库。
4.3 批量扫描
按照档案数字化具体任务的整体安排按计划分批次进行扫描。
4.4 数据处理
4.4.1 对扫描图像进行校对,确保图像完整无误,并视需要对有问题的扫描图像进行纠偏、去污、拼接等技术处理。
4.4.2 对裸数据进行验收前的相应处理,包括文件的格式转换、逻辑分盘处理、添加说明性文件,以及数据的挂接、检验、上载、质量检查和备份。
4.5 信息存储
根据不同的扫描图像选择适当数据格式、编码方式和存储介质对信息进行保存。
4.6 检索利用
按用户需求提供检索利用。

5 案卷整理
在批量扫描之前,按下述步骤对案卷进行整理,确保档案数字化质量。
5.1 分件
5.1.1 把同一案卷中的扫描件和非扫描件分开。
5.1.2 在扫描件中将大图、照片插入指示页,便于扫描工序批量扫描,实际图像放在图像处理时进行重扫,替换指示页。
5.1.3 填写《数据加工过程处理单》(见附录A),对需要特殊处理的页,标识清楚。
5.2 分页
对批量扫描前的档案进行页号、件号的标注。如在标注中与原档案中的件数、页号不一致,应以此为准。
5.3 拆卷
去除档案中原来的装订物,以便后续扫描工作的进行。
5.4 装卷
按档案保管要求恢复原装订。

6 建目录库
6.1 目录著录
根据DA/T18确定档案著录项,并进行著录。
6.2 数据格式选择
所选定的数据格式通用,应能直接或间接与DBF文件格式或通过XML文
档进行数据交换。
6.3 目录输入
将著录好的目录输入计算机内,建立机读目录数据库。

7 批量扫描
7.1 扫描方式
纸质档案扫描可采用黑白二值图像和连续色调图像两种方式。
7.1.1 页面为单色文字的纸质档案,宜采用黑白二值图像扫描;页面为多色文字图像的档案文件,可采用连续色调图像扫描。
7.1.2 字迹清晰、不带图片的档案材料,采用黑白二值图像扫描;清晰度较差或带有图片的档案材料,可采用连续色调图像扫描。
7.2 分辨率选择
7.2.1 单色页面档案文件,扫描分辨率一般建议选择100~200dpi。
7.2.2 彩色页面档案文件,扫描分辨率可选择100dpi以上参数值进行。
7.2.3 大幅面档案文件,如工程图纸、报纸等尺寸超过A3的,可选用大幅面图像扫描仪(如A0)、大幅面数码平台、缩微照像后胶片数字转换,也可以采用小幅面扫描后的图像拼接。扫描分辨率应选择1OOdpi以上。
7.2.4 需要时可根据原件的清晰度适当调整扫描分辨率。如原件质量较差且尺寸较小,可适当提高分辨率;反之也可相应减少分辨率,增减的多少以扫描后图像按原尺寸显示后是否清晰为准。
7.3 特殊页面的扫描
7.3.1 粘贴页与表格
对于粘贴折页,可用大幅面扫描仪扫描,或先分部扫描后拼接;对部分字体很小、字迹密集的情况,可适当提高扫描分辨率,选择灰度扫描或彩色扫描,采用局部深化技术解决;对字迹与表格颜色深度不同的,采用局部淡化技术解决
7.3.2 一般文本流程图
采用适当的分辨率扫描及局部深化技术,确保文本流程图清晰。同时采用不同设备满足文本流程图的扫描工作。
7.3.3 插图
采用高分辨率灰度或彩色扫描技术将插图与文字一起扫描,保证原来的页面布局和插图清晰。
7.3. 4照片
对于页面中有黑白或彩色照片的文件,采用JPEG格式扫描,确保照片清晰度,同时可避免图像存储空间过大。
7.4 文件命名方式
7.4.1 建立文件夹
扫描时文件夹的建立应按档案实体分级建立,其中的每一份文件也需要单独建立文件夹。
7.4.2 文件夹命名方法,以档案实体中的档号命名,一般为3位数,不足3
位数的左边补“0”。

8 数据处理
8.1 图像处理
8.1.1 纠偏
  对扫描过程中出现的偏斜图像进行整体纠正,保证数字图像的偏斜角度小于1度。(图像偏斜不超过页面内半个文字)。
8.1.2 去污
  去除数字图像中影响可懂度的杂质。档案数字化图像的去污,应遵循在不影响可懂度的前提下展现原貌的原则。
8.1.2.1 局部去污,如去除黑边、污点。
8.1.2.2 整体去污,可一次性去除页面上的污渍。
8.1.3 拼接
  为保证档案数字化图像的整体性,对幅面分离的数字图像进行拼接。
8.1.4 校对
8.1.4.1 一次校对,检查扫描完的图像质量情况,对不合格的图像进行标记退回重新扫描。
8.1.4.2 纠错处理,根据一次校对中提出的诸如污渍、黑边、偏斜、图像质
量等问题,结合《数据加工过程处理单》(见附录A)情况,对每份图像进行相应的处理。
8.1.4.3 二次校对,对一次校对及数据处理后的数字图像再次进行检查,并
标记图像处理过程中不清晰的页面。不合格的退回重新处理。
8.2 数据质量检查
8.2.1 文字录入质量
  对录入域清单上所标明的各著录项的文字录入进行正确率控制,保证错误率低于3‰。
8.2.2 图像质量
  对纸质文件扫描后形成的图像文件进行清晰度、污渍、黑边、偏斜等问题的控制,以达到要求的图像质量。
保证扫描后的数字图像清晰,便于清楚阅读,适应各种纸张和手写、印刷字的情况。
8.3 数据挂接
   档案条目数据与图像文件的对应准确程度的控制。
在生成裸数据光盘之前,根据资料整理信息、扫描前的标引信息及卷内文件页号信息核查图像文件总数是否与实际文件数相等,如不相等则不能生成裸数据光盘,可打印出清单,回退给图像处理人员补扫。
8.4 数据检验
8.4.1 将裸数据进行验收前的相应处理,包括文件的格式转换、逻辑分盘处理、添加说明性文件。
8.4.2 对数据进行检验,给出合格或不合格结论。
8.4.3 将数字加工后的数据转换为裸数据光盘格式,拷贝到活动硬盘上。
8.4.4 系统应自动记录检验进度。
8.5 数据上载
档案数字化各工序的数据通过网络及时上载到数据服务器端汇总,其中数字图像自动搜索对应的目录数据,加入对应的电子地址数字图像文件名,建立起一一对应的关系。
8.6 数据备份
定期对服务器的各类数据进行备份,防止数据丢失。

9 信息存储
   以JPEG数字压缩编码或TIFF国际通用标准格式。采用国际标准的传真文档压缩格式压缩后,分别按页编号后分页存储。
数字图像的存储管理应保持原纸质档案的保管模式对应存储。
9.1 压缩存储格式
  档案数字图像格式采用TIFF和JPEG数字压缩编码。
9.1.1 黑白二值图像
     黑白二值扫描图像文件采用TIFF(CCITT G3)格式二值图像压缩算法,压缩率就绪(Cr)为15:1。也可采用TIFF(CCIFF G4)格式二值图像压缩算法,压缩率(Cr)为3 O:1。
9.1.2 连续色调静态图像
  连续色调静态图像采用JPEG数字压缩编码,平均压缩率(cr)为15:1。
9.2 编码方式
    应尽是采用实时操作性强的编码方式。失真度编码,用较少的比特率获得较好的图像质量;无失真编码,以低压缩保持信息的不失真。一般情况下
宜采用国际通用编解码算法。
9.3 存储方式与载体
 可选用在线和离线、不同载体进行存储。

10 检索利用
10.1 检索利用方式
档案数字图像检索利用可采用单机、局域网和互联网三种方式。
局域网中传输利用,应保证数据在内部局域网10Base?T带宽下,平均1秒内显示响应完成。互联网中传输利用,互联网56Kbit/s带宽下,平均5秒内显示响应完成。为此要求一般每页档案数字图像的存储容量为50K以内。
10.2 检索软件配置
检索软件应符合国家档案局制定的《档案管理软件功能要求暂行规定》的各项要求。检索软件应具备目录检索与档案数字图像方便调阅的基本功能。