欢迎您来到 数字平台。 您尚未登录。[登录] [注册新用户]
当前位置: 论坛首页 / 栏目 产品与服务 / 文章 779

点击:907

[顶层访客留言] [回复顶层(需要先登录)] [表状] [详细]
[回复留言] [回复(需要先登录)] [引用(需要先登录)]普通文章跟帖
文章id: 779
MARC文件导入书目库

作者: xietao


为了体验后面的各种业务功能,需要先导入一批MARC数据。

操作步骤如下:

1) 在dp2circulation主菜单上,选“功能/统计窗/ISO2709统计窗”,打开一个ISO2709统计窗。
2) 在“数据来源”属性页,指定一个ISO2709文件名,选定适当的编码方式。编码方式如何选择稍微有点难度,一般来说,老的系统输出的ISO2709文件是GB2312编码方式,也就是国标汉字,新型的系统才可能输出UTF-8编码方式的文件。还可参考后面介绍的一个判断编码方式的小方法。
3) 按“下一步”按钮,进入“选定方案”属性页。点“...”按钮,选定“导入书目”方案。按“下一步”按钮。
4) 在出现的对话框上选择一个目标书目库,也就是要转入进去数据的书目库。指定一个批次号,任意字符串都可以。选择是否“查重”。如果是测试目的,可以选定不查重,而正规业务中导入数据通常会选择要查重。点“继续”按钮,导入数据就开始进行了。

由于使用的是远程网络,导入书目记录的速度通常不是太快。如果再选择了一边导入一边查重,速度还会再慢一些。但这样操作一般是为了小批导入数据之用,如果为了系统首次导入大批数据的目的,可以使用dp2kernel的配套批处理工具dp2batch,请看相关资料的介绍,并且在服务器桌面运行,速度就非常快了。

不过,即便是目前这种导入方式,显然有很大的速度优化余地,我们在后面抽空会优化相关模块。

~~~

查看文本文件编码方式的小方法:
1) 用Windows记事本打开ISO2709文件或者其他文本文件;
2) 使用“文件/另存为”命令,在随后出现的对话框上观察“编码”组合框,这就是该文件的编码方式。ANSI的意思在大陆版中文Windows下,意味着就是GB2312编码方式(在台湾版中文Windows下可能就是BIG-5)。这里所使用的另存命令,不是真要另存文件,而只是用来观察一下编码方式然后就取消执行了。

这个方法大部分情况下是准确的。如果遇到没有文件头部标志的ANSI或者UTF-8编码方式的文件,有可能会误判,但这种情况很少见。



发表时间: 2012-12-19 16:22:43



  • 普通文章 dp2总分馆模式体验 xietao 2012-12-19 14:38:07[点击:16880]
  • 普通文章 安装dp2circulation前端 xietao 2012-12-19 14:44:51 (ID:777) [点击:795]
  • 普通文章 为dp2circulation安装各种统计方案 xietao 2012-12-19 14:54:00 (ID:778) [点击:787]
  • 普通文章 MARC文件导入书目库 xietao 2012-12-19 16:22:43 (ID:779) [点击:907]
  • 普通文章 册登记 xietao 2012-12-19 17:53:35 (ID:780) [点击:1261]
  •  

    在线用户
    访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客
    当前栏目在线用户数 48, 总在线用户数 53