欢迎您来到 数字平台。 您尚未登录。[登录] [注册新用户]
当前位置: 论坛首页 / 栏目 产品与服务 / 文章 152

点击:215364[回复顶层] [树状] [详细]
[回复留言] [回复(需要先登录)] [引用(需要先登录)]普通文章第 21 楼
文章id: 150
可以检索从右到左的小文种,。。。。。。



可以检索从右到左的小文种,但是字段中的用到的标点符号,应该按照小文种的习惯,放在标题的左侧,而不是右侧,比如美国国会馆的这条数据,就存在这个问题。880字段:

6245-02/(3/raالديمقراطية والأحزاب السياسية فى مصر الحديثة والمعاصرة، ٥٧٨١-٢٥٩١ :bدراسة تاريخية سياسية تحليلية /cعبدالعزيز رفاعى.



发表时间: 2006-11-23 14:35:50



[回复留言] [回复(需要先登录)] [引用(需要先登录)]普通文章第 22 楼
文章id: 151
回复: 可以检索从右到左的小文种,。。。。。。



==========
以下是引用 الاهرام 于 2006-11-23 14:35:50 发表的文字:

可以检索从右到左的小文种,但是字段中的用到的标点符号,应该按照小文种的习惯,放在标题的左侧,而不是右侧,比如美国国会馆的这条数据,就存在这个问题。880字段:
6245-02/(3/raالديمقراطية والأحزاب السياسية فى مصر الحديثة والمعاصرة، ٥٧٨١-٢٥٩١ :bدراسة تاريخية سياسية تحليلية /cعبدالعزيز رفاعى.

==========
当前程序将美国国会图书馆用EACC处理的阿拉伯文字转换为可读字符截屏图为:

 

我理解你所说的意思是,将每个字段内容后置结束符(标点分隔符号,下图红圈标识部分),按阿拉伯这类从右往左语序小语种的习惯,后置结束符应放在阿拉伯文内容之后,即最左边而非常见从左往右语序的最右边,见下图:

1、现在状态

 

2、你认为的状态

由于我孤陋寡闻,没有见到过阿拉伯语种的MARC效果,不敢妄加评价。仅作如下分析供参考:

国会图书馆Z39.50服务器支持UTF-8,按理说,UTF-8应该能容纳下包括阿拉伯文字在内的所有字符编码。但因为历史遗留的数据,对于阿拉伯文、中、日、韩等数据,采用的是EACC编码,输出交换时放入880字段中。所以,我们发现国会图书馆相关数据,仍在880字段中,以EACC编码保存字符。那么,对于880以外的其它字段,它是采用英文的语序习惯描述信息,880字段如果是中文等内容,由于语序是一致的,不会有冲突。但880中如果是阿拉伯文或希伯莱文,它们从右往左的语序就与英文的从左往右语序冲突了——如果简单设置一个语序方向,非此即彼,是排它的选择,适应阿拉伯文习惯就不适应英文习惯。

所以,当前程序仍默认以左往右为主序,只有遇到阿拉伯文时改变语序。而标点符号,包括阿拉伯数字,因为它们也属常见字符,当然依的是常见左往右序了。

解决方案:增加一个改变默认语序的程序设置,如果设置程序为默认为从右往左语序后,所有的标点符号就都放在前一字符的左边——嘿嘿,这个时候,中国人或美国人看这种数据可能就感到怪怪的。

请有条件的朋友,多看看国外系统如果解决这个问题,尤其是以色列Ex Libris公司的产品Aleph500,因为以色列显然有处理希伯莱文这种从右往左文字的需求,那么,处理阿拉伯文的界面也就一样了——及时得到朋友们的反馈信息,可以帮助我们开发出更友好的数据界面。

在此,先谢谢各位了。

 



发表时间: 2006-11-23 15:55:30
最后修改时间: 2006-11-23 16:02:36
[回复留言] [回复(需要先登录)] [引用(需要先登录)]普通文章第 23 楼
文章id: 152
好消息:又新增获取XML格式书目数据的能力

作者: xietao


1.0.0.19版(2006/11/23)

增加对XML格式数据的支持。在Z39.50服务器“属性”对话框中,(“检索/获取”页)增加了一个“缺省元素集名”的配置列表。为了显示、编辑XML数据记录,新增了一种“XML记录窗”。当检索到的记录格式为XML格式时,双击会自动打开XML记录窗而不是MARC记录窗。

以访问国会图书馆Z39.50服务器为例,目前dp2Catalog可以支持下列XML格式获取数据:

    "dc"  --  Dublin Core (XML records)
    "mods"  -- MODS (XML records)
    "marcxml" -- MARCXML (XML records), default schema for XML
    "opacxml" -- MARCXML with holdings attached

不过,MARCXML格式是一个“双重格式”,它既是XML格式,也是MARC格式。所以,当检索得到的是MARCXML数据时,在浏览框上用右鼠标键单击出现popup menu,使用上面的“装入XML记录窗”或“装入MARC记录窗”命令,可以决定到底装入那种记录窗。

~~~

实战操作指南:

在Z39.50检索窗中,在目标树上,右鼠标键点“国会图书馆”服务器,在popup menu上选择“属性”命令,出现属性对话框;

在“检索/获取”页中,选定“缺省MARC语法”为“1.2.840.10003.5.109.10 -- XML”;选定“缺省元素集名”为“dc --  Dublin Core (XML records)”(选其他几个也可以);

在“字符集”页中,选定“缺省编码方式”为“utf-8”;选定“检索词编码方式”为“utf-8”;

点“确定”按钮关闭属性对话框,回到Z39.50检索窗。

任意检索。

双击浏览窗中的任意行,会打开XML记录窗。如果嫌所显示的XML内容格式乱,可以点“整理XML格式”按钮,或者点“XML只读”页观察。

~~~

一直以来,什么DC,什么MODS,什么MARCXML,好像都仅仅停留在谈论之中,现在,有了dp2Catalog,大家可以方便地从国会图书馆Z39.50服务器中一睹这些格式的面目了。这本来是一个“实践问题”。

不由得感叹dp2系列产品开发应用过程中,几年来一直用MARCXML作为处理MARC数据的内部格式,可是直到今天,才能够直接从外部获取MARCXML数据,感觉颇有些滑稽。当然,闭门所造的“车”,也是标准化的车,没任何问题。



发表时间: 2006-11-23 17:53:20
最后修改时间: 2006-11-23 18:02:45



[回复留言] [回复(需要先登录)] [引用(需要先登录)]普通文章第 24 楼
文章id: 157
以色列的Z39.50服务器信息



发现一个以色列的服务器,对加工希伯莱文和阿拉伯文书目有帮助,详细信息参考:

http://libnet.ac.il/~libnet/z39.htm

服务器信息如下:

Z39.50 access details:

General Details:
Name of Database: ULI02
Host name: libnet.ac.il
IP address: 128.139.225.11
Port: 9991

Z39.50 access details:

General Details:
Name of Database: RMB01
Host name: libnet.ac.il
IP address: 128.139.225.11
Prt: 9991

即在域名"libnet.ac.il"或IP"128.139.225.11"主机下,有"ULI02"和"RMB01"两个数据库,通过端口"9991"提供Z39.50访问。

感兴趣的朋友可以自行在dp2catalog前端中增加相应数据库,也可以下载已配置好的Z39.50服务器配置文件,更新前端相应文件即可(通过程序帮助菜单中的“打开数据目标文件夹”可以方便替换)。

 



发表时间: 2006-11-29 15:39:49
[回复留言] [回复(需要先登录)] [引用(需要先登录)]普通文章第 25 楼
文章id: 158
Windows Install 3.1安装包



客户反馈:

我这些天试装dp2目录搜索器,但没有装成。

一、因为没有安装.NET Framework 2.0,所以我选择直接安装dp2,让dp2catalog安装程序引导.NET安装。因为网速慢,花了一天多才进行到正式安装,但显示错误:

Setup has detected that the file 'C:\DOCUME~1\huxj\LOCALS~1\Temp\VSD2E.tmp\dotnetfx\dotnetfx.exe' has changed since it was initially published.

See the setup log file located at 'C:\DOCUME~1\huxj\LOCALS~1\Temp\VSD2E.tmp\install.log' for more information.

不明白错误所在。

二、采用预先安装.NET Framework 2.0,下载完安装,说机器上没有Windows Installer 3.0,不能启动.NET安装程序。

针对客户反馈,提供以下问题分析和解决方案:

判断可能是下载的.Net 2.0安装文件受损(或许是漫长的下载过程导致文件仅下载了部份。并且,由于浏览器缓存设置中,已有这个下载的受损文件,即使再次下载,也先判断本地缓存中有没有,有且版本没有更新,则不会再次下载)。查看install.log文件,在最后几行有这样的文字“WinVerifyTrust returned -2146762496 File not signed”,就是说Windows系统校验程序发现那个下载后的文件没有签名(文件被改变就会破坏微软的签名),当然安装不了。
解决方案有二:
1、清除IE的缓存,即从浏览器工具菜单的Internat选项进入,删除Internat临时文件(或通过设置按钮,进入文件夹,仅删除那个半截子下载文件),再在上网速度较快的地方,重新安装程序。如果仍担心网速,推荐试试第二个方案。
2、既然已单独下载了.Net 2.0安装文件(应该近23M大小,少了就不正常哟),仅缺少安装.msi这类安装包的新版Windows Installer 3.0,可先到微软下载并安装Windows Installer 3.1,再运行.Net 2.0安装文件。为方便客户,请点击本地下载获取微软的Windows Installer 3.1安装包。



发表时间: 2006-12-05 11:01:52
最后修改时间: 2006-12-05 12:02:56
[回复留言] [回复(需要先登录)] [引用(需要先登录)]普通文章第 26 楼
文章id: 159
更新的Z39.50服务器配置文件



点击此处下载ZServer.xml文件

更新日期:2006/12/07



发表时间: 2006-12-07 13:12:52
最后修改时间: 2006-12-07 13:13:30
[回复留言] [回复(需要先登录)] [引用(需要先登录)]普通文章第 27 楼
文章id: 168
使用dp2catalog过程中发现的问题

作者: njwcy


使用dp2catalog过程中,在缺省方式中为什么不能加入MARC-8.从innopac中下载的数据在缺省编码方式MARC-8和检索词编码方式UTF-8的环境中可以正常显示汉字,但保存后的数据是乱码.不知为什么



发表时间: 2007-05-31 15:39:51
[回复留言] [回复(需要先登录)] [引用(需要先登录)]普通文章第 28 楼
文章id: 169
回复: 使用dp2catalog过程中发现的问题



==========

以下是引用 njwcy 于 2007-5-31 15:39:51 发表的文字:

使用dp2catalog过程中,在缺省方式中为什么不能加入MARC-8.从innopac中下载的数据在缺省编码方式MARC-8和检索词编码方式UTF-8的环境中可以正常显示汉字,但保存后的数据是乱码.不知为什么

==========

我们的系统,已支持多种编码方式的互转。但dp2catalog程序开发初期,由于用户无相应需要,这个另存数据时的转换功能就暂未提供,所以程序界面中能正常显示转换的结果,但保存为数据后仍是乱码。

根据使用过程中的用户反馈意见,看来这个MARC-8另存时转换的需求还是较多的,因而我们随后会在dp2catalog程序中提供这个功能——如果程序升级了,前端会自动检测到新版本并提醒用户升级的。



发表时间: 2007-05-31 20:15:44
[回复留言] [回复(需要先登录)] [引用(需要先登录)]普通文章第 29 楼
文章id: 173
好消息!dp2Catalog功能有显著增强...

作者: xietao


回复: 使用dp2catalog过程中发现的问题

==========

以下是引用 njwcy 于 2007-5-31 15:39:51 发表的文字:

使用dp2catalog过程中,在缺省方式中为什么不能加入MARC-8.从innopac中下载的数据在缺省编码方式MARC-8和检索词编码方式UTF-8的环境中可以正常显示汉字,但保存后的数据是乱码.不知为什么

==========

njwcy你好:

近来dp2Catalog功能有显著增强,您提到的从innopac中下载的数据另存为ISO2709文件功能,增加了选择编码方式的能力。详述如下:

原来的版本中,从innopac这样的采用MARC-8数据编码方式的Z39.50服务器下载的记录,原始的编码方式就是MARC-8,dp2Catalog的保存功能,是原样保存Z39.50服务器响应的iso2709记录,没有提供编码转换的功能。也就是说,服务器发来的是什么,另存的就是什么。

新版本中,增加了选择编码方式的功能。您可以选择GB2312、UTF-8等多种编码方式进行保存。不过,对于USMARC格式的iso2709记录而言,因其头标区第9位(从0开始计数)规定,只有MARC-8和UTF-8才是合法的编码方式。如果另存成编码方式为GB2312的iso2709文件,恐怕只有大陆的编目软件能认这样的文件。

虽然另存记录到iso2709文件的对话框中,编码方式中可以选择MARC-8编码方式,但是这种选择是有一定限制的,那就是:如果记录从Z39.50服务器中原始获取的编码方式就是MARC-8,可以使用MARC-8编码方式,实际上就是原始编码方式保存。而如果记录从Z39.50服务器中获取的原始编码方式是MARC-8以外的其他编码方式,那就不能选为MARC-8编码方式保存。这样限制的原因,一部分是因为这样操作没有什么太大的实际价值,现在的潮流是将MARC-8转为UTF-8,而不是反向;另外一部分是因为目前功能的局限。

如果有用户觉得输出为MARC-8编码方式很有用,请告诉我们,我们可以在适当的时候增加这个功能。

~~~

除了上述增强,这次的新版本还有另外一个增强:对服务器的通讯采用异步方式,通俗说就是停止按钮变得鲜活了,不像旧版本那样(同步、阻塞式的)大部分时候呆滞在那里,中断不了,许多时候还必须通过杀死程序来强行退出。之所以这样,倒不是因为我们刚刚学会开发异步通讯功能,而是因为去年推出dp2Catalog的时候,为了尽快拿出软件的权宜之计。

对服务器采用异步通讯,暗含另外一个意思,就是可以对多个服务器同时发起检索操作了。这次也将这个功能实现了,您可以在目录对象上进行检索,这样等于对下属的所有服务器同时进行检索。要观察多个服务器的命中结果,在目标树上切换即可,浏览窗会自动跟随出现不同服务器的命中结果集内容。

~~~

这次的新版本dp2Catalog,还对应于我们新推出的dp2ZServer(Z39.50服务器)产品,增加了字符集协商能力,可以采用国标或者UTF-8作为编码方式,以支持社科院联合编目项目的实施。

总之,这个dp2Catalog新版本增加的功能,还是可圈可点的。欢迎大家试用,并提出宝贵改进意见。



发表时间: 2007-08-10 17:42:40



[回复留言] [回复(需要先登录)] [引用(需要先登录)]普通文章第 30 楼
文章id: 655
dp2Catalog已经升级到V2

作者: xietao


dp2Catalog已经升级到V2,下载地址为:

http://dp2003.com/dp2catalog/v2/publish.htm

而原来的V1版本除了Z39.50/DTLP协议功能还能继续使用外,其dp2libraryws协议已经不能使用,因为dp2系统V2的对应协议已经变为dp2library协议。



发表时间: 2011-07-04 17:05:39



页 3 / 3 |< < 1 2 3 >|
 

在线用户
(无) 
当前栏目在线用户数 0, 总在线用户数 1