古籍数字化扫描工作需注意的问题研究3600字
古籍数字化扫描工作需注意的问题研究3600字 古籍保护主要有两种:一是原生性保护,二是再生性保护。数字化是古籍再生 性保护的重要手段;古籍数字化属于古籍整理的范畴,代表着古籍整理的未来方 向。"古籍数字化"是指利用现代信息技术对古籍文献进行加工处理,使其转化为 电子数据形式,通过光盘、网络等介质保存和传播。古籍数字化是对古籍或古籍 内容的再现和加工,属于古籍整理的范畴,是古籍整理的一部分。进入21世纪以来,古籍数字化的技术日趋成熟和完善,其中数字化扫描已成 为解决古籍再生性保护的最有效手段。在进行数字化扫描时,需按照规范要求操 作,认真甄选可扫描的古籍,妥善处理好透字、折书、还原修复、图像处理等问 题,加强专业人员的业务培训。
摘 要:
古籍作为珍贵的物质遗产,蕴含着中华民族精神、思维方式和想象力、创造 力,不仅是中华文明绵延数千年、一脉相承的历史见证,也是整个人类文明的瑰 宝[1]。然而,由于人为因素和自然因素的影响,部分古籍存有不同程度的损坏。
要使这古老的灿烂文化得以延续,不仅有赖于对古籍的原生性保护,更有赖于对 古籍使用的再生性保护[2]。笔者近年来从事古籍再生性保护中的数字化古籍善 本扫描工作,对古籍数字化中的一些技术与操作略有一些了解,对一些相关问题 颇有体会,不妨抛砖引玉,对古籍数字化扫描操作过程中需注意的问题进行初步 探讨。
一、古籍数字化的兴起 古籍数字化是以保护和利用古籍为目的,利用扫描、拍照等技术手段,将古 籍的文本信息转化为识别的数字符号,进而揭示古籍文献中包含的信息资源的系 统工作[3]。古籍使用的再生性保护工作自上个世纪90年代开始以来,经历了人 工录入、缩微胶片、拍摄照片以及数字化扫描的不同阶段。进入21世纪以来,随 着计算机和网络技术的迅猛发展,古籍数字化的技术日趋成熟和完善,数字化扫 描无疑已成为解决古籍再生性保护的最有效手段,其中商业数据公司、系统和一 些科研机构,近年来都进行了卓有成效的工作,取得了丰硕的数字化成果[3]。二、古籍数字化扫描工作 古籍数字化扫描一般可分为拆卷处理、页面修正、扫描、装订还原、图像处 理五个工序。原则上古籍一般不进行拆卷处理,若因为特殊情况需要拆卷,必须 经过同意,并由专业人员进行。页面修整是对古籍页面的褶皱、折角、折痕进行 平整处理,以防止在扫描工序中对古籍纸张造成二次伤害。装订还原是对拆卷处 理的古籍按原样进行重新装订,要求检查仔细、装订美观、结实牢固、无遗漏并 认真核对数量。扫描工作中的图像处理通常采用市面上常见的ACDSee、PhotoShop 等软件,在机器工作正常的情况下,扫描一页书面仅需几秒钟时间,操作简单快 捷。扫描完毕的图像文件需要进行纠偏、去影像黑边、影像拼接等处理,要求页 面端正、图像版心位置一致、版心横向倾斜不超过1度,基本原则是最大程度保 持原书的原始信息[2]。
笔者从事数字化扫描工作期间,图书馆用于扫描善本古籍的扫描仪共有三台, 均为冷光源扫描仪,不仅有利于扫描影像的品质保证,也使得在扫描古籍时不会 由于温度过高对善本产生不良影响。三台扫描仪均可以调节版面角度,其中有两 台A3扫描仪,一台A2扫描仪,基本上解决了善本古籍版宽、尺寸不统一且扫描过 程中善本不易移动所造成的扫描不完整的问题。
扫描过程中要使扫描仪与书页确实成垂直角度,并不可以过多移动,因为机 器的移动必然会带动镜头的移动,而镜头的移动必定会影响扫描不平整的结果。
因此扫描一本古籍页面时,只需在扫描仪上选择好位置并固定即可。从扫描图片 的效果要求来说,扫描光源也需稳定且统一,这样才能保证扫描的图片色彩接近 实物颜色并清晰度高。
扫描好的古籍图片经过图像处理后只需保存在电脑的硬盘中即可。为了防止 停电、电脑感染病毒等突发情况,要在扫描后,将相关资料刻入光盘中加以保存, 需要注意的是,要将光盘存放在低温和黑暗的地方,因为光盘的使用寿命只有约 2�D5年。
数字化扫描工作一般应由常设的固定工作人员完成。因为扫描不仅需要基本 的电脑操作技能,还要对扫描的古籍图片进行最前沿的筛选,为日后的整理与再出版奠定基础。同时熟练、准确的操作对善本的保护也起到了非常重要的作用。
三、古籍数字化扫描工作中需注意的问题 古籍数字化扫描工作虽然偏重于再生性保护古籍中的信息,但也应以最大限 度地延长古籍寿命为宗旨,兼顾古籍在和研究中的双重价值[4]。虽然许多古籍 保护单位在利用高科技的手段对古籍纸质文献进行保护,然而数字化扫描对纸质 文献原件具有损坏性不可忽视。因此,在古籍数据化扫描工作中,我们需要注意 扫描中可能出现的问题,尽可能减轻对古籍原本的伤害。
(1)需要制订明确的技术规范并严格执行[2]。一般的古籍纸质文献,都是先 进行原生性的修复,接着再进行数字化扫描。这样就造成了修复、还原的古籍又 一次面临分拆和再一次进行修复还原的问题。这种重复劳动不仅费时费力,对古 籍也是一种非常严重的损坏。因此,在古籍数字化扫描工作过程中,应最大限度 地减少对古籍的折损,必须制定相关的扫描、图像处理、书目标引等操作规范、 质量标准,尽可能降低同一件古籍扫描的次数,争取一次扫描成功,避免不必要 的重复扫描。
(2)认真甄选需要数字化扫描的古籍。由于古籍体例多样,纸张状况质地不 一,抄本、刻本均有,誊抄、手抄和成书于不同朝代,有的字迹纤细,有的字迹 模糊,还有字迹粘连、交错、分离,表格、图文混排、点校标点等情况,而且具 有卷轴装、册页装、包背装、线装等不同形制[2]。因此,要根据古籍的具体情 况,有选择性地来决定哪些进行扫描,哪些通过其他途径进行数字化。
(3)谨慎、认真对待扫描过程中善本出现透字的情况。出现透字的情况,是 每一个负责扫描的工作人员最不愿意遇见的。不是因为怕麻烦,而是方法使用不 得当容易对善本造成损坏。有很多善本,正反两面透字严重,已经影响阅读与扫 描。这种情况下一般的处理方法是在书页之间加“衬纸”,把两个半页隔开,从 而杜绝透字。但是加“衬纸”的弊端是衬入的纸张很容易把书口划破,进一步损 坏善本。不过对于破损不严重且纸张质量相对较好的善本,此方法还是可行并常 用的。但是遇到破损严重且纸张松脆的古籍,有的时候就不得不选择拆书。
(4)一定要注意保护古籍实体不受损害,尽量避免拆书,以保持古籍的原貌[4]。拆书的情况在数字化扫描中比较常见,除了透字会需要拆书外,比较容易 出现的就是古籍的书脊距离板框太近,有时甚至重合,在这种情况下,挤压厉害 对古籍有伤害,不挤压又不行,甚至挤压了也不行,所以往往会用拆书来解决。
主要还是为了获得好的扫描效果。但是这对古籍的损伤是巨大的,因此需尽量避 免。
(5)及时还原、修复、保存好扫描后的古籍。如果扫描完成后古籍只是随意 放置或是放在移动式密集书架里,那么古籍将变成一堆废纸,虽然是对其进行了 数字化,可是原件等于是被彻底地丢弃了,那么又谈何保护呢?所以数字化扫描 虽然重要,但是一定要与原生性保护相结合,只有这样才可以在省时、省力的情 况下使古籍得到更好的保护。
(6)加大设备投入力度,解决图片清晰与存储之间的矛盾。由于扫描出的图 片以TIF的格式保存,其图片过大。扫描一页书在电脑上的大小约为45M,一本善 本拟有120页,那么一本善本的扫描后的大小约为4.7G,一套善本往往在10本以 上,那么一套善本扫描后大约需要47G的内存,才可以在电脑中存放,由于图片 过大往往造成电脑的存储空间不足。虽然现在可以更改为JPG的格式,图片大小 刚好合适,可是清晰度又远不如之前的TIF格式了。这也是一个非常需要注意的 问题。
(7)加强古籍数字化扫描人员的业务培训[3]。扫描仪的准确操作并不难掌握, 但需要熟练掌握基本的软件操作知识。因此,需要对扫描人员进行相应的数字化 加工的技能培训,如扫描、拍照、图像处理等,除此以外也要进行相关的古籍知 识培训,以便提升扫描人员的业务能力和综合素质。
四、结语 数字化古籍是古籍保护中的一个非常重要的发展趋势,也是现在古籍保护正 在不断研究、不断开拓创新的一个重要课题。在数字化古籍保护中数字化扫描占 有很重要的地位,对于数字化扫描中需要注意的问题,我们切不可掉以轻心。这 不仅关系到用先进技术向更多的人呈现古籍的原貌,更是以高科技的方式让古籍 这一历史的瑰宝焕发青春,传承中国文化。:
[ 1 ] 周爱莲,王晶静,张毅.国家农业图书馆古籍保护的现状与思考[J]. 农业图书情报学刊,2015(1):10-15. [ 2 ] 任红辉.天一阁古籍数字化实践及思考[J].四川图书馆学报, 2012(1):51-53. [ 3 ] 赵长波.浅谈古籍数字化操作中的问题及对策[J].图书馆学刊, 2016(8):56-58. [ 4 ] 于美娜.论古籍普查数字化过程中的古籍保护问题[J].