Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >图书机读目录MARC简介,ISO格式目录数据生成

图书机读目录MARC简介,ISO格式目录数据生成

原创
作者头像
SpringSun
修改于 2023-05-30 02:06:04
修改于 2023-05-30 02:06:04
2.9K09
代码可运行
举报
文章被收录于专栏:技术赋能学术技术赋能学术
运行总次数:9
代码可运行

一、简介

机读目录(Machine-Readable Catalogue,MARC),是利用计算机读取和处理书目信息,是计算机编目的产品。

它以代码形式和特定的结构将书目信息记录在计算机的存储载体上,能够被计算机识别并编辑输出书目信息。

MARC起源于美国国会图书馆于1965年1月提出的“标准机器可读目录记录款式的建议”。1973年国际标注化

组织将MARC格式作为国际标准正式颁布,即USMARC格式,现改名为MARC21。

1986年,由于USMARC和UNIMARC的问世,中国机读目录的研制工作提到议事日程,我国开始参照UNIMARC编写中国的MARC格式。1992年,北京图书馆自动化发展部编写的《中国机读目录通讯格式》(China MARC format,简称CNMARC)问世。1996年2月6日,中华人民共和国文化行业标准《中国机读目录格式》(China MARC Format)正式发布,1996年7月1日起实施。该标准根据我国文化部科技司于1993年3月向北京图书馆下达的研究任务而制定,目的是推进书目数据的规范与统一、加速我国文献信息网络的建设以及实现国内外书目信息的共建共享。2004年,北京图书馆出版社出版了国家图书馆编的《新版中国机读目录格式使用手册》(New China MARC Format Manual)。

2005年7月,在《新版中国机读目录格式使用手册》基础上修订而成的《中国机读目录格式》(China MARC Format)国家标准通过专家评审,现已上报全国信息与文献工作标准化技术委员会和国家标准化管理委员会(the Standardization Administration of China)。《中国机读目录格式》国家标准虽然是依据UNIMARC编写的,但两者仍有差异。首先,CNMARC不是对UNIMARC的简单照抄照搬,而是中国化的MARC格式。第二,它根据信息资源的发展和用户需求增加或删减了一些字段和附录。第三,在编排格式和体例结构上,它不仅遵循我国国家标准的编写法,而且兼顾了MARC格式的特殊要求。尽管两者存在差异,但CNMARC最大限度地方便了国内外书目信息的交换与共享。

二、中国档案机读目录格式

中国档案机读目录格式标准:GB/T 20163-2006

可在国家标准全文公开系统查看:中文标准名称:中国档案机读目录格式

我们查看文件知道这个标准就像计算机协议一样,只要按照这种标准生成的数据,在支持该标准读取信息的系统中就能很方便的导入导出数据。

我们先看一个MARC21样例数据:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
00922nam0 2200205   450 
0010040882936
00520230413133611.0
010  |a978-7-01-025251-3|dCNY68.00
100  |a20230222d2022    em y0chiy0110    ea
1010 |achi
102  |aCN|b110000
105  |ay   z   000yy
106  |ar
2001 |a学习中国化时代化的马克思主义立场观点方法|9xue xi zhong guo hua shi dai hua de ma ke si zhu yi li chang guan dian fang fa|b专著|f本书编辑组[]
210  |a北京|c人民出版社|d2022
215  |a308页|d24cm
330  |a本书从“不断开辟马克思主义中国化时代化新境界”“充分彰显强大真理力量和实践伟力”“为丰富和发展马克思主义作出原创性贡献”。
6060 |a马克思主义|x思想政治教育|x研究
690  |aD641|v5
801 2|aCN|b58marc.cn|c20230525

这就是一条书名为“学习中国化时代化的马克思主义立场观点方法”的MRAC信息,这主要是显示对应字段值。在标准中实际一本书目信息就是一条数据以ISO文件后缀存储。

00922nam0 2200205 450 001001100000005001700011010003200028100004100060101000800101102001500109105001800124106000600142200014700148210002700295215001600322330030300338606003500641690001200676801002800688004088293620230413133611.0 a978-7-01-025251-3dCNY68.00 a20230222d2022 em y0chiy0110 ea0 achi aCNb110000 ay z 000yy ar1 a学习中国化时代化的马克思主义立场观点方法9xue xi zhong guo hua shi dai hua de ma ke si zhu yi li chang guan dian fang fab专著f本书编辑组[编] a北京c人民出版社d2022 a308页d24cm a本书从“不断开辟马克思主义中国化时代化新境界”“充分彰显强大真理力量和实践伟力”“为丰富和发展马克思主义作出原创性贡献”。0 a马克思主义x思想政治教育x研究 aD641v5 2aCNb58marc.cnc20230525

其中无法显示的框框符号实际是ASCII码的非打印字符,主要是分割符,稍后再讲。

然后我们看CNMARC对数据记录的说明

  • 一条数据就由如上格式组成,头标识24位,
  • 然后记录目次区记录的是数据字段的字段标识号(比如100),然后是数据字段的长度,数据在数据字段区的位置最后,形式=数据+RS。
  • 接着就是数据字段区,记录的就是各字段的数据,以及该字段的子字段数据,有两种形式 。 001-009 字段=数据+RS; 其它字段=2位指示符+数据+RS (数据中子字段之间由 US字符+1位子字段标识隔开)
  • 最后是记录结束符GS

而各个字段和子字段的规范就去看文档吧。

3、制作ISO格式MARC数据

如果把标准研究清楚了可以自己写一个程序,我目前找到一个程序可以从外部导入数据生成ISO,也可以导入ISO转其它格式,也可以编辑ISO文件。

下载连接:marcpro2.rar

解压后里面有三种操作方式的说明,照着来就行了。

我们打开marcpro.exe 从mdb导入数据生成ISO文件。

  • 点工程,新建一个测试工程,然后点测试工程菜单会切换,在工程下新建一个实例。
  • 点实例,然后菜单点配置实例
  • 选择你的mdb,选择表,在配置实例里面配置映射字段
  • 配置完成后保存,在主界面点击工程,然后点击执行生成文件
  • ISO数据

618 夏日盛惠提前享

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
书目和数据库的世界纪录
写过图书馆和书籍的世界纪录以后,今天还有最后一部分。 与信息处理技术有关的世界纪录。 (图片说明:装置艺术,为一本书通电。) 1. 最早的图书分类法 以前,图书馆里的书,都是按照书名的字母顺序摆放。后来,书籍越来越多,迫切需要根据主题进行分类。 1876年,美国一所大学的图书馆员麦尔威·杜威(Melvil Dewey)发明了"杜威十进制分类法"(Dewey Decimal Classification,简称DDC),用3个阿拉伯数字表示书籍的主题,这就是世界上最早的图书分类法。自从发明后,它就一直在被修订,
ruanyf
2018/04/19
1.1K0
公众分类法(Folksonomy)
先从一个具体的问题开始思考:如何给电子书分类?(这个问题可以推广到如何给信息分类。) 传统的方法是使用自上而下的目录分类法(Taxonomy)。在中国是中图分类法(第四版),在美国是国会图书馆分类法。但是,这种分类过于复杂(所有细目厚达几千页),导致实施起来成本很高。而且,它不太符合电子书的实际,一是分得太细,一本书往往在第四层或第五层的子目录;二是分得不均衡,中图分类法下A类是"马克思主义、列宁主义、毛泽东思想、邓小平理论",I类是"文学",显而易见,对于电子书库来说,将A类单独分为一类非常浪费,而I类则
ruanyf
2018/04/12
9830
高效阅读 培养终身受用的阅读力
在一段阅读材料里,真正起决定作用的往往就是关键的几个词和几句话,把这些重点词、重点句子抽离出来,更有针对性地研究这些内容,这种直指重点的阅读方法就叫作精细阅读法,简称“精读”
yeedomliu
2022/12/03
5820
高效阅读  培养终身受用的阅读力
中办、国办印发《“十四五”文化发展规划》76处提到“旅游”
近日,中共中央办公厅、国务院办公厅印发了《“十四五”文化发展规划》(以下简称《规划》)。《规划》由规划背景、总体要求、强化思想理论武装、加强新时代思想道德建设和群众性精神文明创建、巩固壮大主流舆论、繁荣文化文艺创作生产、传承弘扬中华优秀传统文化和革命文化、提高公共文化服务覆盖面和实效性、推动文化产业高质量发展、推动文化和旅游融合发展、促进城乡区域文化协调发展、扩大中华文化国际影响力、深化文化体制改革、建强人才队伍、加强规划实施保障15个章节构成。其中,推动文化和旅游融合发展章节提出,坚持以文塑旅、以旅彰文,
腾讯文旅
2022/08/26
2870
中办、国办印发《“十四五”文化发展规划》76处提到“旅游”
大数据与IP和文学的迷思:风马牛是如何相及的
大概五年前,送小表弟去大学报到——学校是一个三线以下城市的一般学校,办好各项入学手续、安顿好住宿以后,顺道请他们辅导员吃了个便饭。酒酣耳热之际,辅导员询问我在什么单位工作,我说在某某互联网门户打杂。一番恭维之后,对方继续询问那你们这么大影响力的网站得有多少人啊,我说确切数字不掌握,怎么也得七八千吧。对方的筷子旋即将送到嘴边的一块驴肉扔落骨碟,惊问:这么多人?我是不信的。我们学校就很大了,教职工也不过五六百人!你们那么多人,怎么发工资都是个大问题吧?!你们的会计不得忙死啊!肯定有领现金的吧?肯定有不能按时收到
灯塔大数据
2018/04/09
9320
大数据与IP和文学的迷思:风马牛是如何相及的
Python参考文献期刊格式_论文参考文献格式
参考文献的类型(即引文出处)以单字母方式标识在文献名后并以方括号括起,具体类型标识如下:
老虎也淘气
2024/01/30
4540
文化和旅游部2019年文化和旅游发展统计公报
2019年,在党中央、国务院坚强领导下,全国文化和旅游系统坚持以习近平新时代中国特色社会主义思想为指导,全面贯彻党的十九大和十九届二中、三中、四中全会精神,不断增强“四个意识”,坚定“四个自信”,做到“两个维护”,坚持新发展理念,坚持以人民为中心的工作导向,坚持稳中求进的工作总基调,坚持和完善繁荣发展社会主义先进文化的制度,不断推进文化和旅游领域治理体系和治理能力现代化,以高质量发展为目标,以文化和旅游融合发展为主线,以改革创新为动力,着力提供优秀文化产品和优质旅游产品,我国文化建设和旅游发展再上新的
腾讯文旅
2020/06/23
2.6K0
学术初行:了解下期刊
有时候我们看一些论文期刊,经常会发现一些期刊有国家级期刊、省级期刊、核心期刊这样的标志,那国家级期刊、省级期刊、核心期刊有什么区别?”是时候了解一下了 一、什么是期刊? 期刊,是由依法设立的期刊出版单
云时之间
2018/05/31
8682
学习使用Jieba1.Jieba2. 特点3.功能4.安装5.使用6.其他中文分词工具
1.Jieba 相信大多数知道NLP的人都知道什么是Jieba,但对于像我这样的新手而言,也仅限于知道而已,并没有学习过它,使用过它,打算用几天的时间来记录自己学习、使用Jieba的过程。 jieba是一款开源的中文分词工具 github ,“结巴”中文分词:做最好的 Python 中文分词组件 "Jieba" (Chinese for "to stutter") Chinese text segmentation: built to be the best Python Chinese word s
JasonhavenDai
2018/04/11
1.4K0
学习使用Jieba1.Jieba2. 特点3.功能4.安装5.使用6.其他中文分词工具
Mybatis-plus 代码生成器
XxxServiceImpl 继承了 ServiceImpl 类,并且MP为我们注入了 XxxMapper
OY
2022/03/17
7810
Mybatis-plus 代码生成器
这可能是史上最全的常用学术网站
搞科研我们都知道,少不了各个学术网站的助力呢!今天小编特地收集了国内外常用学术网站,对你有用就点个赞吧!欢迎微信后台留言补充。
AI算法与图像处理
2019/08/15
4.2K0
这可能是史上最全的常用学术网站
使用 GPT-4 创作高考作文 2024年
作为一名技术博主,我常常思考如何利用人工智能(AI)来提升内容的质量和SEO效果。今天,我将分享如何使用 GPT-4 创作一篇高考作文,并结合多级标题结构和丰富的内容,优化博客文章的搜索引擎优化(SEO)。在这篇文章中,我们将详细探讨 GPT-4 的应用,并通过代码案例演示其强大功能。希望这篇文章对你有所帮助,并激发你更多的创作灵感。
默 语
2024/11/22
1200
基于Milvus+ERNIE+SimCSE+In-batch Negatives样本策略的学术文献语义检索系统
语义索引(可通俗理解为向量索引)技术是搜索引擎、推荐系统、广告系统在召回阶段的核心技术之一。语义索引模型的目标是:给定输入文本,模型可以从海量候选召回库中快速、准确地召回一批语义相关文本。语义索引模型的效果直接决定了语义相关的物料能否被成功召回进入系统参与上层排序,从基础层面影响整个系统的效果。
汀丶人工智能
2023/08/02
6770
基于Milvus+ERNIE+SimCSE+In-batch Negatives样本策略的学术文献语义检索系统
循序渐进Oracle:数据库的字符集和字符集文件
导读:本文来自『墨天轮』专栏“循序渐进Oralcle”(https://www.modb.pro/topic/6289,复制到浏览器中打开或者点击“阅读原文”),介绍《循序渐进Oracle》第三章的3.1-3.4节:字符集的基本知识、数据库的字符集、字符集文件及字符支持、NLS_LANG的设置与影响、导入导出及字符转换。
数据和云
2019/09/17
1.8K0
循序渐进Oracle:数据库的字符集和字符集文件
兴衰成败三百年:俄罗斯数学的光荣与梦想
讲俄罗斯的数学有个人不得不提一下,那就是欧拉。欧拉,瑞士数学家、自然科学家。欧拉是18世纪数学界最杰出的人物之一,数学史上最多产的数学家,在许多数学的分支中也可经常见到以他的名字命名的重要常数、公式和定理。
新智元
2019/06/19
1.3K0
兴衰成败三百年:俄罗斯数学的光荣与梦想
【学术分享】40个科研学术网站,收藏必备,予取予求!
科研工作者每天日常莫过于看文献、做实验、写论文。人生最郁闷的事情不过于是导师说,那个XX,帮我下载下这个文献,还有这篇文章很好,你把他的引用文献都大概读一下
zenRRan
2019/12/26
7.2K0
【学术分享】40个科研学术网站,收藏必备,予取予求!
剑桥高材生归国创业,15年AI长跑终于迎来IPO
历经半年的沉寂,AI领域终于迎来了一个新高潮——又一家AI企业走向IPO,这次的主角是来自苏州的对话式人工智能平台型企业思必驰。
用户2908108
2022/12/17
3530
剑桥高材生归国创业,15年AI长跑终于迎来IPO
面向程序员的数据挖掘指南(一)
作者:Ron Zacharski 第一章:简介 内容: 寻找事物 本书结构 阅读完本书后你可以做些什么? 为什么数据挖掘很重要?哪些内容可以为我所用? 标题里的“Numerati的古老艺术”是什么意思
小莹莹
2018/04/24
7530
面向程序员的数据挖掘指南(一)
Filecoin的大历史意义
大历史是一种异常巨大的尺度和视角。概括来说,整个宇宙都处于熵的下行电梯中,有生命的物种都需要在下行电梯中努力保持向上攀爬的速度。
用户9624935
2022/04/02
3490
Filecoin的大历史意义
【DQMIS议程】第五届数据质量管理国际峰会议程新鲜出炉!
数据要素,是过去一年以来最热的一个词,2020年3月30号,中共中央,国务院发布了《关于构建更加完善的要素市场化配置体制机制的意见》中明确提出了把数据作为生产要素进入市场化配置,这是在国家层面大力扶持数字经济,作为中国未来发展重要举措之一。从银保监会的数据治理指引及更严格的数据管控,到市场的数据霸权垄断监管;数据交易市场在中国大地如雨后春笋般的迸发,诸如数据标注等依托数据要素的新业态,新商业模式的涌现,经过一年多的实践和沉淀,蓦然回首,我们发现妨碍我们进一步跃升的是数据的质量,以及提升数据质量的难,和无法承
博文视点Broadview
2023/05/06
3570
【DQMIS议程】第五届数据质量管理国际峰会议程新鲜出炉!
推荐阅读
相关推荐
书目和数据库的世界纪录
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验