图书机读目录MARC简介，ISO格式目录数据生成

原创

SpringSun

修改于 2023-05-30 10:06:04

4.2K0

文章被收录于专栏：技术赋能学术技术赋能学术

一、简介

机读目录（Machine-Readable Catalogue，MARC），是利用计算机读取和处理书目信息，是计算机编目的产品。

它以代码形式和特定的结构将书目信息记录在计算机的存储载体上，能够被计算机识别并编辑输出书目信息。

MARC起源于美国国会图书馆于1965年1月提出的“标准机器可读目录记录款式的建议”。1973年国际标注化

组织将MARC格式作为国际标准正式颁布，即USMARC格式，现改名为MARC21。

1986年，由于USMARC和UNIMARC的问世，中国机读目录的研制工作提到议事日程，我国开始参照UNIMARC编写中国的MARC格式。1992年，北京图书馆自动化发展部编写的《中国机读目录通讯格式》（China MARC format，简称CNMARC）问世。1996年2月6日，中华人民共和国文化行业标准《中国机读目录格式》（China MARC Format）正式发布，1996年7月1日起实施。该标准根据我国文化部科技司于1993年3月向北京图书馆下达的研究任务而制定，目的是推进书目数据的规范与统一、加速我国文献信息网络的建设以及实现国内外书目信息的共建共享。2004年，北京图书馆出版社出版了国家图书馆编的《新版中国机读目录格式使用手册》（New China MARC Format Manual）。

2005年7月，在《新版中国机读目录格式使用手册》基础上修订而成的《中国机读目录格式》（China MARC Format）国家标准通过专家评审，现已上报全国信息与文献工作标准化技术委员会和国家标准化管理委员会（the Standardization Administration of China)。《中国机读目录格式》国家标准虽然是依据UNIMARC编写的，但两者仍有差异。首先，CNMARC不是对UNIMARC的简单照抄照搬，而是中国化的MARC格式。第二，它根据信息资源的发展和用户需求增加或删减了一些字段和附录。第三，在编排格式和体例结构上，它不仅遵循我国国家标准的编写法，而且兼顾了MARC格式的特殊要求。尽管两者存在差异，但CNMARC最大限度地方便了国内外书目信息的交换与共享。

二、中国档案机读目录格式

中国档案机读目录格式标准：GB/T 20163-2006

可在国家标准全文公开系统查看：中文标准名称：中国档案机读目录格式

我们查看文件知道这个标准就像计算机协议一样，只要按照这种标准生成的数据，在支持该标准读取信息的系统中就能很方便的导入导出数据。

我们先看一个MARC21样例数据：

00922nam0 2200205   450 
0010040882936
00520230413133611.0
010  |a978-7-01-025251-3|dCNY68.00
100  |a20230222d2022    em y0chiy0110    ea
1010 |achi
102  |aCN|b110000
105  |ay   z   000yy
106  |ar
2001 |a学习中国化时代化的马克思主义立场观点方法|9xue xi zhong guo hua shi dai hua de ma ke si zhu yi li chang guan dian fang fa|b专著|f本书编辑组[编]
210  |a北京|c人民出版社|d2022
215  |a308页|d24cm
330  |a本书从“不断开辟马克思主义中国化时代化新境界”“充分彰显强大真理力量和实践伟力”“为丰富和发展马克思主义作出原创性贡献”。
6060 |a马克思主义|x思想政治教育|x研究
690  |aD641|v5
801 2|aCN|b58marc.cn|c20230525

这就是一条书名为“学习中国化时代化的马克思主义立场观点方法”的MRAC信息，这主要是显示对应字段值。在标准中实际一本书目信息就是一条数据以ISO文件后缀存储。

00922nam0 2200205 450 001001100000005001700011010003200028100004100060101000800101102001500109105001800124106000600142200014700148210002700295215001600322330030300338606003500641690001200676801002800688004088293620230413133611.0 a978-7-01-025251-3dCNY68.00 a20230222d2022 em y0chiy0110 ea0 achi aCNb110000 ay z 000yy ar1 a学习中国化时代化的马克思主义立场观点方法9xue xi zhong guo hua shi dai hua de ma ke si zhu yi li chang guan dian fang fab专著f本书编辑组[编] a北京c人民出版社d2022 a308页d24cm a本书从“不断开辟马克思主义中国化时代化新境界”“充分彰显强大真理力量和实践伟力”“为丰富和发展马克思主义作出原创性贡献”。0 a马克思主义x思想政治教育x研究 aD641v5 2aCNb58marc.cnc20230525

其中无法显示的框框符号实际是ASCII码的非打印字符，主要是分割符，稍后再讲。

然后我们看CNMARC对数据记录的说明

一条数据就由如上格式组成，头标识24位，
然后记录目次区记录的是数据字段的字段标识号（比如100），然后是数据字段的长度，数据在数据字段区的位置最后,形式=数据+RS。
接着就是数据字段区，记录的就是各字段的数据，以及该字段的子字段数据，有两种形式。 001-009 字段=数据+RS; 其它字段=2位指示符+数据+RS (数据中子字段之间由 US字符+1位子字段标识隔开)
最后是记录结束符GS