从志书文表数据出现错误的主要成因谈责任编辑准确锁定差错位置之方法
摘要:在地方志的专业志中,数字差错现象较为常见,多为反映同一事物的数据文表不一,表格内分项之和与总项不符等现象。其成因有客观因素也有人为因素。面对数字差错,责任编辑应全面分析上述两种致错因素在稿中的不同表现,而后有针对性地纠正改错,然而,如何在一部几十甚至数百万字的稿中准确锁定数字差错所在?运用反查求真、函数曲线、滤波法等方法能取得一定的理想结果。
关键词:地方志、专业分志、数据差错、锁定
在地方志各类专业志书中,反映同一事物的数据在文字记述和表格之间不一、表格内分项之和与总项不符等现象很多。责任编辑在遇上此类问题时,不应鲁莽删改,更忌任性废弃。应跳出责任编辑的常规思维,而后,先对差错问题进行主要成因分析,进而采用反查求真、函数曲线、滤波法等方法,对症下药,尽力挽救历史数据。“磨刀不误砍柴工”,上述方法虽然麻烦些,但却能较为准确地找出错误所在,笔者曾尝试运用上述方法进行责编,均取得一定的理想结果,试述体会如下。
一、数据差错的主要成因分析
(一)资料来源方面的问题
1、人为因素
任何一部专业志,均为众手成志。其编写周期长、人员流动大、涉及部门多的特点,决定了其入志的原始资料来源不一之现实。
出现在出版阶段的责编稿中的问题数据,若排除手误因素,从出处来看,绝大部分数据在其原来的位置,是相符的。之所以会在责编稿中出现疑惑,应视为是由于多次组合的原因而使之然。
来源不同的原始数据,若将其回归各自原来的位置,可发现其表现的值多有不同。例如,某一反映同一事物的数据,不同的撰稿者分别从企业、主管部门和统计部门三处得来,就常会见到三组不同的数值。这有其客观原因,即:企业大都留有一套自用的数据,在上报主管部门时,由于市场范围、经营策略、竞争对手以及利润、税收等原因,会另整理出一套大同小异的数据;而一些主管部门和统计部门公开的数据,又有可能会因为部门形象、地方保护、GDP增长、个人政绩等原因,对上报来的数据做些再调整。如此一来,就形成了自用数据、上报数据和调整后的数据三种模块,甚至更多。每一模块之间,均有不易察觉的项目增减和百分比的变动,当这些由于隐藏着人为因素而发生细微变化的数据,由不同的撰稿者从不同的渠道收集来,并分置于稿中不同的位置时,或是统稿者依据书稿结构和内容的需要,对原始表格进行拼、合、拆、分后,问题就已存在,只是有些统稿者重大轻小,不注意细节,没有发现,或是已有发现却不知如何处理而已。
2、私人收藏、口碑采访与档案记载不同
志书入志资料大多来自档案,同时,不可避免地会采用私人收藏物件和口碑采访所得。从历史和人的因素这两个角度来看,特定时期,私人收藏物件和口碑采访所得资料会较档案资料来得真实。如“大跃进”时期,受“浮夸风”影响,统计数据多有水分,而口碑采访所得资料会较真实。但是从整体来看,私人收藏物件和口碑采访所得又会受到单个人的活动范围,以及记忆碎片所限,因而具有局部性和片面性。例如,在上届《福建公安志》采访口碑时,仅“镇反”起始时间项,五位参加过那场运动的老人,回忆出五种时间。这几种资料若同时汇入一部志稿,有的用于文中,有的用于表中,从数字方面来说,就可能出现出版角度定义的差错。
(二)撰稿人对数据的各自态度问题
1、小数点问题
人的大脑是复杂的,绝无雷同,不同的人对数字有着不同的态度。有人喜欢起始之前先行四舍五入,而后使用整数进行运算;有人喜欢对统计表的各项小计栏四舍五入后再行合计;有人习惯保留小数点的后两位;有人习惯保留小数点的后四位。例如,一届《福建冶金志》中的“石灰石矿产量表”内的1994—1997年的各项数值为:20.6243、27.3306、34.1400、28.9100,均为小数点后四位保留。在同一部志稿中,由另一撰写“人造富铁矿”的作者编制的一份生产情况表内,分项、小计、合计三大板块里中的几百个数据,均为整数,没有一个数据有小数点。这一现象在专业志稿中相当常见,这是因为撰写不同内容的撰稿人来自不同的专业岗位,他们中有工程师、教师、行政人员、财务统计人员等等,长期各自的工作,养成了他们对数字的不同态度,对各自收集来的原始表格进行整理运用时,出手各异。再经总纂者统稿后,送审稿内的数据与原始数据在小数点方面有很多已是不同了。
2、手误问题
对数字不同态度的最大后果,是手误问题。这在粗心、马虎、应付型的撰稿人中,表现最多。常见的数字方面的手误有抄写、录入出错;安放位置出错;小数点位置出错;原稿破损或字迹模糊情况下凭经验或判断抄录出错等。在上述各型撰稿人中,有一种出错现象十分奇特,且不得其解,即:在稿中,将三位数中的百位与个位对调、将两位数或五位以上的数据中的十位与个位颠倒。特别是在接连几页数据众多的大型表格中,这一现象较多。
二、应对方案
(一)切忌简单删改
出版物中,数据文表不符、表格分项总项之间出现矛盾的现象,被定义为差错。从出版角度出发,差错率决定出版物质量,也是衡量责任编辑的业务能力和工作态度的准尺。但是,志书的责任编辑较其它出版物的编辑有着更重的担子,那就是要尽力为后人保存过去和今天的历史。应意识到,志书的数字也是一种历史语言。因而,在遇到上述矛盾现象,特别是遇到能体现事物发展脉络或是起到“一表胜千言”作用的表格时,切不可因其中出现较多的差错而挥刀删繁就简。如在拿捏不准错在分项还是错在总项时,不能简单地删去表格的小计及合计栏列;在文表同时出现反映同一事物的数据却又互不相等时,若是直观无法判断数据错在文字还是表格,亦不能简单地砍去一边。这一手法虽然能快捷消除明显差错,但是,却是一种不负责任的行为,它只是让读者表面上看不出差错,而差错仍可能存在,因为砍去的部份可能是正确的,在一张有差错的表格中,常常总项没错,错在分项中的某一项。
(二)顺藤寻根,反查求真
上述的自用数据、上报数据和调整后的数据三种模块的汇合,在责编稿的表现是数据冲突现象,责任编辑在修正数据之前,要先行确定采用哪种数据为准,一般情况是采用政府口径的统计部门提供的数据为准。锁定这一目标后,根据上述的差错成因分析,按责编稿、审定稿、送审稿、初稿等志书成稿过程,层层反查(如图),即俗话说的寻根问祖。查到初稿时,一般都能发现症结所在。若仍未发现问题,可再向纵深反查,即与作者及承编单位取得联系,讲清道理,向他们借用当初整理的资料和入志的原始表格,定能查到正确的数据。
(三)绘制函数坐标,文表对照,逻辑推理
志书中数字错的位置十分复杂,在表格中,可能错在分项,也可能错在总项,或是两者皆错;在文字记述与表格结合方面,有可能错一边,亦有可能皆错。但志书亦有一大特点,即:文表结合紧密,决无毫无关联的表格突兀出现。就此,在相关部分文字记述详细的前提下,可根据表格内容,自绘简易函数坐标图,用正确的表格中的数据,对照文字记述中的数据;用记述中的文字和数据,参看曲线上相应点的坐标位置,推算表格中的怀疑数据均甚为实用。例如:《福建铁路志》责编稿中,在记述流动资金管理时,文字记述十分详细,点出一组百分比,其中一段的文字为“……1987年每万换算吨公里占用流动资金达4.11,较上年增长36.54%;……”相应此段文字的表格却出现分项之和大于总项的差错。笔者利用文表对照法,自绘函数坐标草图,横为年份,纵为数值,在众多数据中,发现稿中1986年数据为3.10,明显偏离函数曲线,依据“较上年增长”的文字进行逻辑判断,该数据有误,经换算,正确的数据为3.01,稿中此数后两位颠倒了,再行逐项合计,分项之和与总项相符。
(四)应用滤波法判断异常数据
这是一种利用正态分布去确定数据允许变动范围的方法,超出该范围即为异常数据。这一方法较难,但若是掌握了,对待查找10组以上同类统计数据的填写手误,却是十分好用。具体方法如下:
逐项检查原始数据,大于上限值的数据有一个,为1845;没有小于下限值的数据。因此可以判断,1845为异常数据。