欢迎您来到 数字平台。 您尚未登录。[登录] [注册新用户]
当前位置: 论坛首页 / 栏目 产品与服务 / 文章 513

点击:60310[回复顶层] [树状] [详细]
[回复留言] [回复(需要先登录)] [引用(需要先登录)]精品第 1 楼
文章id: 513
关于dp2catalog的一个回复

作者: xietao


近日得知编目精灵的博克里面一篇博文推荐了我们的dp2catalog,地址在这里:

http://catwizard.blogbus.com/logs/46204517.html

本来想回复其中的一个评注,但是发现必须要注册为那个博客服务商的用户才能进行回复,只好回复在这里,然后再请江汇泉设法留言给他们了。

评注原文如下:

刚好路过,编目精灵又见新帖。
下了一个测试,果然是配置了很多无效z3950地址,总体感觉还是很不错的,毕竟是免费的东东,呵呵。
既然路过就对软件提点小小建议:
z3950服务器留几个好用的就行,配置过程太繁琐,最好直接用一行文本解决,如:[社科院联合目录/cnmarc_books/ssucs.org/210/user/password]。或者可以用不同的标点符号来分别定义,配置界面上放个样式举例帮助,用户就能很快学会。
另外, MARC的编辑修改功能过于简单,特别是固定长字段的编辑比较困难,可以考虑弹出一个带字符位说明的编辑框。
打开文件、保存文件可以记忆上次的路径编码格式等信息,免去每次打开保存都要经过一连串的选择。


发表时间: 2009-09-19 14:19:29
最后修改时间: 2009-09-19 14:27:19



[回复留言] [回复(需要先登录)] [引用(需要先登录)]普通文章第 2 楼
文章id: 517
Z39.50服务器设置问题

作者: (访客)cat wizard



谢谢回复。等着新的可用Z39.50列表。

关于Z39.50服务器设置,我试的时候,软件提示要选择字符集,而且是二个都要设置,否则无法保存。不知道是不是使用上有什么不对的地方。

另:博客巴士“回复”是要注册用户,直接留言则不需要。



发表时间: 2009-09-20 11:38:17
[回复留言] [回复(需要先登录)] [引用(需要先登录)]普通文章第 3 楼
文章id: 518
回复: Z39.50服务器设置问题

作者: xietao


==========

以下是引用 ~cat wizard 于 2009-9-20 11:38:17 发表的文字:

谢谢回复。等着新的可用Z39.50列表。

关于Z39.50服务器设置,我试的时候,软件提示要选择字符集,而且是二个都要设置,否则无法保存。不知道是不是使用上有什么不对的地方。

另:博客巴士“回复”是要注册用户,直接留言则不需要。

==========

谢谢编目精灵。

经过编目精灵这么一提醒,我发现上面所说的“一般情况下,很多事项都有缺省值,并不需要显式地去配置。最低限度,只要有服务器名,服务器IP地址或域名,端口号,数据库名几个事项即可。也就是说,正好是Z39.50服务器属性对话框的左端的一个属性页的内容,其他的可以不管”说法并不准确。下面修正说明一下:

1) 应当是最低限度只需要配置“一般属性”和“数据库”两个属性页的内容即可,漏说了“数据库”属性页。不过,目前版本还有一点问题,这在2)里说明;

2) 目前的版本,在新创建一个Z39.50服务器节点的时候,在Z3.50服务器属性对话框中,缺省的“字符集”属性页中“检索词编码方式”组合框和“缺省编码方式”组合框的内容为空。软件在结束对话框的时候进行了检查,要求这两项必须为非空。这样就造成了要求使用者必须填入值,而这效果不是设计者的初衷。

解决方法有两个:

1) 允许这二个值为空,软件在对话框关闭的时刻自动填入缺省值;

2) 这二个值的缺省值一开始就在属性页中出现。

后面的新版本将尽快兑现这个改进。

那么,所说的缺省值到底是什么编码方式呢?从国内的情况看,大部分服务器都支持(或者只支持)gb2312编码方式,那就是它了。这里说到ZTRANS。ZTRANS当年并没有能力全面支持Unicode(UTF-8),所以ZTRANS在检索词发送上仅支持gb2312编码方式,不过在MARC记录的编码方式方面除了支持gb2312还支持EACC。所以,ZTRANS就不用涉及这些概念,也就显得配置起来“简单”了。dp2Catalog在没有特意指定一个Z39.50服务器的字符集特性的情况下,效果是应当和ZTRANS相仿。

多说一点。为什么不让软件去自动设置,或者自动探测相关的字符集参数呢?本来是有希望做到的,一个是Z39.50本来有Initialize阶段的字符集协商机制,但是国际国内的大部分服务器都没有做到,我曾经查阅过很多资料,几年前也曾在Z39.50邮件列表上询问过,都没有结果。如果这方面今后有进步,我会随时改进软件。另一个,Z39.50协议提供了列出服务器各种属性的机制,但是可惜有这个能力的服务器并不多。所以,dp2Catalog采取了比较直接的办法,就是让用户自己配置。实际上这可能是一个试探的过程,需要有经验的用户综合各种信息来判断和加以配置,并从实际效果来确定是否配置正确。幸好,如果一个用户配置好了,可以公布出来让其他用户照搬这个配置,或者由服务器所在单位明确公布出来,通过加强交流,这些问题就不成为问题了。

~~~

这里也顺便提到,昨天我所说的缺省值,包括两个方面:一个是界面上Z39.50属性对话框中操作者感到的“不必设置”的事项,可称为缺省值;一个是在zserver.xml配置文件中,操作者感到的“不必显式去配置出来”的事项,可称为缺省值。从dp2Catalog的设计目标来看,确实是想尽量压缩必配的事项的数目,让软件使用起来更简单柔韧。



发表时间: 2009-09-20 15:17:00
最后修改时间: 2009-09-20 15:27:57



[回复留言] [回复(需要先登录)] [引用(需要先登录)]普通文章第 4 楼
文章id: 519
回复: Z39.50服务器设置问题

作者: xietao


==========

以下是引用 ~cat wizard 于 2009-9-20 11:38:17 发表的文字:

...

另:博客巴士“回复”是要注册用户,直接留言则不需要。

==========

看来我确属老眼昏花了,在

http://catwizard.blogbus.com/

页面上找了半天,也没有能够找到“留言”的入口。还望有懂行的指点一二。



发表时间: 2009-09-20 15:35:54



[回复留言] [回复(需要先登录)] [引用(需要先登录)]普通文章第 5 楼
文章id: 520
试试匿名评论



进入精灵的博客,

点博文之“阅读全文”或“评论”,在文章下方,会有一个提交评论的窗口:

提交区的“登录后评论”与“匿名评论”可以相互切换,如果没有注册帐户,可用匿名评论方式针对博文留言。

输入“姓名”、“Email”、“地址”(可忽略),即可提交留言。匿名评论无法针对某评论回复。



发表时间: 2009-09-20 17:47:44
[回复留言] [回复(需要先登录)] [引用(需要先登录)]普通文章第 6 楼
文章id: 521
回复: 试试匿名评论

作者: xietao


呵呵,算是开了眼了,居然有用带下划线的锚点文字来作为“无实际动作,仅当作状态切换”功能的。这说明对程序员和产品经理进行界面基本常识培训有多么重要了。

对博客大巴遥遥地提几点意见:常规的做法是用checkbox(或者radiobutton)表示状态;或者在下方设立两种不同用途的提交按钮也是可以的;或者,用几个propertypage表示不同风格的输入和提交界面。

以下是引用 孤舟蓑笠翁 于 2009-9-20 17:47:44 发表的文字:

进入精灵的博客,

点博文之“阅读全文”或“评论”,在文章下方,会有一个提交评论的窗口:

提交区的“登录后评论”与“匿名评论”可以相互切换,如果没有注册帐户,可用匿名评论方式针对博文留言。

输入“姓名”、“Email”、“地址”(可忽略),即可提交留言。匿名评论无法针对某评论回复。



发表时间: 2009-09-20 20:08:43



[回复留言] [回复(需要先登录)] [引用(需要先登录)]普通文章第 7 楼
文章id: 522
软件已更新

作者: xietao


软件已更新

1) 在创建新的Z39.50服务器节点的时候,可以不指定两个字符集参数。软件允许这两个值为空。

2) “连接MARC文件”功能,软件能保留先前使用过的文件名、MARC格式和编码方式信息,在下次使用这个功能的时候出现在对话框中。

~~~
顺便也发现,目前版本,在连接MARC文件时,MARC编辑器内因为没有绑定对应的配置文件,因此Ctrl+M(定长模板)功能不能使用,并且左方字段名提示信息也全部为问号。

将考虑尽快为这里增加适当的功能,允许使用Ctrl+M。

而从Z39.50服务器、dp2libraryws服务器或者DTLP服务器检索后装入MARC记录窗的情形,MARC编辑器中是可以使用Ctrl+M功能的。



发表时间: 2009-09-21 12:36:58



[回复留言] [回复(需要先登录)] [引用(需要先登录)]普通文章第 8 楼
文章id: 523
USMARC配置文件内容有问题

作者: xietao


USMARC配置文件内容有问题

1) USMARC格式的一个值列表的问题:
dp2Catalog安装目录中配置文件marcdef_1_2_840_10003_5_10关于008字段有下列片断:

        <Char name="35/3">
            <Property>
                <Label xml:lang="en">Language</Label>
                <Label xml:lang="zh" />
                <ValueList ref="marcvaluelist#008_35/3" />
            </Property>
        </Char>

在配置文件marcvaluelist_1_2_840_10003_5_10中,找到和值列表“008_35/3”有关的片断如下:

    <ValueList name="008_35/3">
        <Item>
            <Value>|||</Value>
            <Label xml:lang="en">
            </Label>
        </Item>
        <Item>
            <Value>#</Value>
            <Label xml:lang="en">
            </Label>
        </Item>
        <Item>
            <Value>AU</Value>
            <Label xml:lang="en">澳大利亚</Label>
        </Item>
        <Item>
            <Value>CA</Value>
            <Label xml:lang="en">加拿大</Label>
        </Item>

其中第二项有些莫名其妙,从第三项开始,采用了二字符的国家代码,而这个值列表显然是要用3字符的值。

请检查一下相关的数据来源,解决这个问题。

2) USMARC格式的marcdef配置文件,至今没有配置中文下的许多文字标签值,例如,刚才提到的008字段的各字符位的文字标签。这样会造成在MARC编辑器为中文界面语言的情况下,Ctrl+M出现的定长字段模板无法显示出必要的文字标签。

请尽快录入这部分文字标签。



发表时间: 2009-09-21 15:28:42



[回复留言] [回复(需要先登录)] [引用(需要先登录)]普通文章第 9 楼
文章id: 524
核实了一下标准文本,应该是员工录入错误



008字段第35字符位开始,三个字符位置,是语种代码位置,所以应该是三字符的语种代码,不知员工为何录入了两字符的国家代码。

随后将修改完善相关配置文件。



发表时间: 2009-09-21 20:50:33
[回复留言] [回复(需要先登录)] [引用(需要先登录)]普通文章第 10 楼
文章id: 531
回复whz

作者: xietao


以下是whz在

http://catwizard.blogbus.com/logs/46204517.html

里的最新回复:

没找到“回复”,不知是不是在“发表评论”里写。
确实是个好东东,不敢有什么意见的啦,呵呵。既然下载测试了,出点小小建议,免得辜负了谢涛先生的免费美意。
很看好这个多线程下载,不过多线程会带来假死现象,一组服务器个数最好设个上限,感觉20以内速度容易接受,40速度能容忍,超过60个服务器,会有假死卡住现象。
以前没用过,原来有ctrl+M解决固定长字段的编辑,有空下个“应用指南”来看看。
找到zserver.xml,很好用,可以excel替换来批量加服务器。发现文件中有“&”好像会出错,大概是转义字符的缘故吧。
<server>中顺序不是都相同?
Z39.50服务器属性对话框中把必需加的放在一个选项卡,可能会更方便些,默认属性归入其它选项卡
whz | 发表于2009-09-23 11:31:49
 
~~~
以下是我的回复:
 
谢谢whz。
1) 多线程的下载,作为开发者,我还真没有测试过太大量的情况,不过从开发的角度,一般的机器是不能支撑太多线程的,在需要线程太多的情况下,要采用线程池(thread pooling)技术,用一定量的线程轮番把全部任务完成。dp2Catalog目前版本没有采用线程池技术,随后我们会考虑采用(或者采用其他类似的技术策略)。
2) zserver.xml是直接可以被修改的。
注意最好在退出dp2Catalog后修改。为了打开这个文件,可以使用主菜单“帮助/打开数据目录文件夹”功能。因为安装目录一般都很深,很难找。
另外还请注意,备份好自己对zserver.xml的修改。因为有可能dp2Catalog在升级安装过程中,会提示先卸载旧版本,如果不卸载,也启动不了旧版本,这样就有可能把曾修改过的zserver.xml文件丢掉。
3) xml文件中特殊字符是需要用实体的(&符号引导的内容),因此,虽然xml文件是文本文件,但写xml文件最好用类似DOM或XmlTextWriter等的库函数来进行,避免写出不合法的xml文件内容。
4) “<server>中顺序不是都相同?”这句话没有太看懂。是要询问<server>元素中的属性的顺序么?请明示。
5) Z39.50属性对话框中视觉上区分必填和可选的参数,是个好主意。放在一个属性页恐怕不行,那样太拥挤了。可以考虑在特定情况下飞出一个tips窗口提示,或者给属性页一定的标志说明等办法。
 
~~~
 
这里顺便谈到,我很早就有一个想法,由用户大家来维护一个比较权威的Z39.50服务器列表,存储在数字平台的服务器上,所有dp2catalog用户可以随时探知和下载新的服务器节点。这需要为dp2catalog增加一系列的管理功能,有一定的开发量。如果有用户感兴趣这方面的功能,愿意使用,我可以考虑开发它们。
 
其实在非常简陋的条件下,大家也是可以通过论坛帖子来交换信息的,比如由一个热心的人士来收集信息,定期提供一个zserver.xml配置文件。不过,每个用户要把对这个权威列表中的感兴趣的服务器信息挑出来合并到自己本地的zserver.xml文件中,并不是一件容易的事情。
 
所以,我想,如果有了比较方便的正规的功能,是不是大家就真能用起来,实现共享服务器列表信息的目的呢?可能性还是有的。
 
设想中的服务器列表管理功能,能从一个集中的服务器下载信息,允许用户选择感兴趣的服务器,合并到本地的zserver.xml文件中。集中的服务器内有新的信息,或者有信息发生修改,都能提示所有用户。对于有价值的服务器配置信息,可以一个按键提交到集中的服务器,这样所有用户都能共享了。另外,还可以从其他用户那里复制来zserver.xml,进行挑选性的复制。
 
这些功能到底有没有价值,需不需要,很想听听大家的意见。


发表时间: 2009-09-24 17:50:31
最后修改时间: 2009-09-24 17:50:54



页 1 / 2 |< 1 2 > >|
 

在线用户
(无) 
当前栏目在线用户数 0, 总在线用户数 0