欢迎您来到 数字平台。 您尚未登录。[登录] [注册新用户]
当前位置: 论坛首页 / 栏目 产品与服务 / 文章 655

点击:221053[回复顶层] [树状] [详细]
[回复留言] [回复(需要先登录)] [引用(需要先登录)]普通文章第 21 楼
文章id: 150
可以检索从右到左的小文种,。。。。。。



可以检索从右到左的小文种,但是字段中的用到的标点符号,应该按照小文种的习惯,放在标题的左侧,而不是右侧,比如美国国会馆的这条数据,就存在这个问题。880字段:

6245-02/(3/raالديمقراطية والأحزاب السياسية فى مصر الحديثة والمعاصرة، ٥٧٨١-٢٥٩١ :bدراسة تاريخية سياسية تحليلية /cعبدالعزيز رفاعى.



发表时间: 2006-11-23 14:35:50



[回复留言] [回复(需要先登录)] [引用(需要先登录)]普通文章第 22 楼
文章id: 151
回复: 可以检索从右到左的小文种,。。。。。。



==========
以下是引用 الاهرام 于 2006-11-23 14:35:50 发表的文字:

可以检索从右到左的小文种,但是字段中的用到的标点符号,应该按照小文种的习惯,放在标题的左侧,而不是右侧,比如美国国会馆的这条数据,就存在这个问题。880字段:
6245-02/(3/raالديمقراطية والأحزاب السياسية فى مصر الحديثة والمعاصرة، ٥٧٨١-٢٥٩١ :bدراسة تاريخية سياسية تحليلية /cعبدالعزيز رفاعى.

==========
当前程序将美国国会图书馆用EACC处理的阿拉伯文字转换为可读字符截屏图为:

 

我理解你所说的意思是,将每个字段内容后置结束符(标点分隔符号,下图红圈标识部分),按阿拉伯这类从右往左语序小语种的习惯,后置结束符应放在阿拉伯文内容之后,即最左边而非常见从左往右语序的最右边,见下图:

1、现在状态

 

2、你认为的状态

由于我孤陋寡闻,没有见到过阿拉伯语种的MARC效果,不敢妄加评价。仅作如下分析供参考:

国会图书馆Z39.50服务器支持UTF-8,按理说,UTF-8应该能容纳下包括阿拉伯文字在内的所有字符编码。但因为历史遗留的数据,对于阿拉伯文、中、日、韩等数据,采用的是EACC编码,输出交换时放入880字段中。所以,我们发现国会图书馆相关数据,仍在880字段中,以EACC编码保存字符。那么,对于880以外的其它字段,它是采用英文的语序习惯描述信息,880字段如果是中文等内容,由于语序是一致的,不会有冲突。但880中如果是阿拉伯文或希伯莱文,它们从右往左的语序就与英文的从左往右语序冲突了——如果简单设置一个语序方向,非此即彼,是排它的选择,适应阿拉伯文习惯就不适应英文习惯。

所以,当前程序仍默认以左往右为主序,只有遇到阿拉伯文时改变语序。而标点符号,包括阿拉伯数字,因为它们也属常见字符,当然依的是常见左往右序了。

解决方案:增加一个改变默认语序的程序设置,如果设置程序为默认为从右往左语序后,所有的标点符号就都放在前一字符的左边——嘿嘿,这个时候,中国人或美国人看这种数据可能就感到怪怪的。

请有条件的朋友,多看看国外系统如果解决这个问题,尤其是以色列Ex Libris公司的产品Aleph500,因为以色列显然有处理希伯莱文这种从右往左文字的需求,那么,处理阿拉伯文的界面也就一样了——及时得到朋友们的反馈信息,可以帮助我们开发出更友好的数据界面。

在此,先谢谢各位了。

 



发表时间: 2006-11-23 15:55:30
最后修改时间: 2006-11-23 16:02:36
[回复留言] [回复(需要先登录)] [引用(需要先登录)]普通文章第 23 楼
文章id: 152
好消息:又新增获取XML格式书目数据的能力

作者: xietao


1.0.0.19版(2006/11/23)

增加对XML格式数据的支持。在Z39.50服务器“属性”对话框中,(“检索/获取”页)增加了一个“缺省元素集名”的配置列表。为了显示、编辑XML数据记录,新增了一种“XML记录窗”。当检索到的记录格式为XML格式时,双击会自动打开XML记录窗而不是MARC记录窗。

以访问国会图书馆Z39.50服务器为例,目前dp2Catalog可以支持下列XML格式获取数据:

    "dc"  --  Dublin Core (XML records)
    "mods"  -- MODS (XML records)
    "marcxml" -- MARCXML (XML records), default schema for XML
    "opacxml" -- MARCXML with holdings attached

不过,MARCXML格式是一个“双重格式”,它既是XML格式,也是MARC格式。所以,当检索得到的是MARCXML数据时,在浏览框上用右鼠标键单击出现popup menu,使用上面的“装入XML记录窗”或“装入MARC记录窗”命令,可以决定到底装入那种记录窗。

~~~

实战操作指南:

在Z39.50检索窗中,在目标树上,右鼠标键点“国会图书馆”服务器,在popup menu上选择“属性”命令,出现属性对话框;

在“检索/获取”页中,选定“缺省MARC语法”为“1.2.840.10003.5.109.10 -- XML”;选定“缺省元素集名”为“dc --  Dublin Core (XML records)”(选其他几个也可以);

在“字符集”页中,选定“缺省编码方式”为“utf-8”;选定“检索词编码方式”为“utf-8”;

点“确定”按钮关闭属性对话框,回到Z39.50检索窗。

任意检索。

双击浏览窗中的任意行,会打开XML记录窗。如果嫌所显示的XML内容格式乱,可以点“整理XML格式”按钮,或者点“XML只读”页观察。

~~~

一直以来,什么DC,什么MODS,什么MARCXML,好像都仅仅停留在谈论之中,现在,有了dp2Catalog,大家可以方便地从国会图书馆Z39.50服务器中一睹这些格式的面目了。这本来是一个“实践问题”。

不由得感叹dp2系列产品开发应用过程中,几年来一直用MARCXML作为处理MARC数据的内部格式,可是直到今天,才能够直接从外部获取MARCXML数据,感觉颇有些滑稽。当然,闭门所造的“车”,也是标准化的车,没任何问题。



发表时间: 2006-11-23 17:53:20
最后修改时间: 2006-11-23 18:02:45



[回复留言] [回复(需要先登录)] [引用(需要先登录)]普通文章第 24 楼
文章id: 157
以色列的Z39.50服务器信息



发现一个以色列的服务器,对加工希伯莱文和阿拉伯文书目有帮助,详细信息参考:

http://libnet.ac.il/~libnet/z39.htm

服务器信息如下:

Z39.50 access details:

General Details:
Name of Database: ULI02
Host name: libnet.ac.il
IP address: 128.139.225.11
Port: 9991

Z39.50 access details:

General Details:
Name of Database: RMB01
Host name: libnet.ac.il
IP address: 128.139.225.11
Prt: 9991

即在域名"libnet.ac.il"或IP"128.139.225.11"主机下,有"ULI02"和"RMB01"两个数据库,通过端口"9991"提供Z39.50访问。

感兴趣的朋友可以自行在dp2catalog前端中增加相应数据库,也可以下载已配置好的Z39.50服务器配置文件,更新前端相应文件即可(通过程序帮助菜单中的“打开数据目标文件夹”可以方便替换)。

 



发表时间: 2006-11-29 15:39:49
[回复留言] [回复(需要先登录)] [引用(需要先登录)]普通文章第 25 楼
文章id: 158
Windows Install 3.1安装包



客户反馈:

我这些天试装dp2目录搜索器,但没有装成。

一、因为没有安装.NET Framework 2.0,所以我选择直接安装dp2,让dp2catalog安装程序引导.NET安装。因为网速慢,花了一天多才进行到正式安装,但显示错误:

Setup has detected that the file 'C:\DOCUME~1\huxj\LOCALS~1\Temp\VSD2E.tmp\dotnetfx\dotnetfx.exe' has changed since it was initially published.

See the setup log file located at 'C:\DOCUME~1\huxj\LOCALS~1\Temp\VSD2E.tmp\install.log' for more information.

不明白错误所在。

二、采用预先安装.NET Framework 2.0,下载完安装,说机器上没有Windows Installer 3.0,不能启动.NET安装程序。

针对客户反馈,提供以下问题分析和解决方案:

判断可能是下载的.Net 2.0安装文件受损(或许是漫长的下载过程导致文件仅下载了部份。并且,由于浏览器缓存设置中,已有这个下载的受损文件,即使再次下载,也先判断本地缓存中有没有,有且版本没有更新,则不会再次下载)。查看install.log文件,在最后几行有这样的文字“WinVerifyTrust returned -2146762496 File not signed”,就是说Windows系统校验程序发现那个下载后的文件没有签名(文件被改变就会破坏微软的签名),当然安装不了。
解决方案有二:
1、清除IE的缓存,即从浏览器工具菜单的Internat选项进入,删除Internat临时文件(或通过设置按钮,进入文件夹,仅删除那个半截子下载文件),再在上网速度较快的地方,重新安装程序。如果仍担心网速,推荐试试第二个方案。
2、既然已单独下载了.Net 2.0安装文件(应该近23M大小,少了就不正常哟),仅缺少安装.msi这类安装包的新版Windows Installer 3.0,可先到微软下载并安装Windows Installer 3.1,再运行.Net 2.0安装文件。为方便客户,请点击本地下载获取微软的Windows Installer 3.1安装包。



发表时间: 2006-12-05 11:01:52
最后修改时间: 2006-12-05 12:02:56
[回复留言] [回复(需要先登录)] [引用(需要先登录)]普通文章第 26 楼
文章id: 159
更新的Z39.50服务器配置文件



点击此处下载ZServer.xml文件

更新日期:2006/12/07



发表时间: 2006-12-07 13:12:52
最后修改时间: 2006-12-07 13:13:30
[回复留言] [回复(需要先登录)] [引用(需要先登录)]普通文章第 27 楼
文章id: 168
使用dp2catalog过程中发现的问题

作者: njwcy


使用dp2catalog过程中,在缺省方式中为什么不能加入MARC-8.从innopac中下载的数据在缺省编码方式MARC-8和检索词编码方式UTF-8的环境中可以正常显示汉字,但保存后的数据是乱码.不知为什么



发表时间: 2007-05-31 15:39:51
[回复留言] [回复(需要先登录)] [引用(需要先登录)]普通文章第 28 楼
文章id: 169
回复: 使用dp2catalog过程中发现的问题



==========

以下是引用 njwcy 于 2007-5-31 15:39:51 发表的文字:

使用dp2catalog过程中,在缺省方式中为什么不能加入MARC-8.从innopac中下载的数据在缺省编码方式MARC-8和检索词编码方式UTF-8的环境中可以正常显示汉字,但保存后的数据是乱码.不知为什么

==========

我们的系统,已支持多种编码方式的互转。但dp2catalog程序开发初期,由于用户无相应需要,这个另存数据时的转换功能就暂未提供,所以程序界面中能正常显示转换的结果,但保存为数据后仍是乱码。

根据使用过程中的用户反馈意见,看来这个MARC-8另存时转换的需求还是较多的,因而我们随后会在dp2catalog程序中提供这个功能——如果程序升级了,前端会自动检测到新版本并提醒用户升级的。



发表时间: 2007-05-31 20:15:44
[回复留言] [回复(需要先登录)] [引用(需要先登录)]普通文章第 29 楼
文章id: 173
好消息!dp2Catalog功能有显著增强...

作者: xietao


回复: 使用dp2catalog过程中发现的问题

==========

以下是引用 njwcy 于 2007-5-31 15:39:51 发表的文字:

使用dp2catalog过程中,在缺省方式中为什么不能加入MARC-8.从innopac中下载的数据在缺省编码方式MARC-8和检索词编码方式UTF-8的环境中可以正常显示汉字,但保存后的数据是乱码.不知为什么

==========

njwcy你好:

近来dp2Catalog功能有显著增强,您提到的从innopac中下载的数据另存为ISO2709文件功能,增加了选择编码方式的能力。详述如下:

原来的版本中,从innopac这样的采用MARC-8数据编码方式的Z39.50服务器下载的记录,原始的编码方式就是MARC-8,dp2Catalog的保存功能,是原样保存Z39.50服务器响应的iso2709记录,没有提供编码转换的功能。也就是说,服务器发来的是什么,另存的就是什么。

新版本中,增加了选择编码方式的功能。您可以选择GB2312、UTF-8等多种编码方式进行保存。不过,对于USMARC格式的iso2709记录而言,因其头标区第9位(从0开始计数)规定,只有MARC-8和UTF-8才是合法的编码方式。如果另存成编码方式为GB2312的iso2709文件,恐怕只有大陆的编目软件能认这样的文件。

虽然另存记录到iso2709文件的对话框中,编码方式中可以选择MARC-8编码方式,但是这种选择是有一定限制的,那就是:如果记录从Z39.50服务器中原始获取的编码方式就是MARC-8,可以使用MARC-8编码方式,实际上就是原始编码方式保存。而如果记录从Z39.50服务器中获取的原始编码方式是MARC-8以外的其他编码方式,那就不能选为MARC-8编码方式保存。这样限制的原因,一部分是因为这样操作没有什么太大的实际价值,现在的潮流是将MARC-8转为UTF-8,而不是反向;另外一部分是因为目前功能的局限。

如果有用户觉得输出为MARC-8编码方式很有用,请告诉我们,我们可以在适当的时候增加这个功能。

~~~

除了上述增强,这次的新版本还有另外一个增强:对服务器的通讯采用异步方式,通俗说就是停止按钮变得鲜活了,不像旧版本那样(同步、阻塞式的)大部分时候呆滞在那里,中断不了,许多时候还必须通过杀死程序来强行退出。之所以这样,倒不是因为我们刚刚学会开发异步通讯功能,而是因为去年推出dp2Catalog的时候,为了尽快拿出软件的权宜之计。

对服务器采用异步通讯,暗含另外一个意思,就是可以对多个服务器同时发起检索操作了。这次也将这个功能实现了,您可以在目录对象上进行检索,这样等于对下属的所有服务器同时进行检索。要观察多个服务器的命中结果,在目标树上切换即可,浏览窗会自动跟随出现不同服务器的命中结果集内容。

~~~

这次的新版本dp2Catalog,还对应于我们新推出的dp2ZServer(Z39.50服务器)产品,增加了字符集协商能力,可以采用国标或者UTF-8作为编码方式,以支持社科院联合编目项目的实施。

总之,这个dp2Catalog新版本增加的功能,还是可圈可点的。欢迎大家试用,并提出宝贵改进意见。



发表时间: 2007-08-10 17:42:40



[回复留言] [回复(需要先登录)] [引用(需要先登录)]普通文章第 30 楼
文章id: 655
dp2Catalog已经升级到V2

作者: xietao


dp2Catalog已经升级到V2,下载地址为:

http://dp2003.com/dp2catalog/v2/publish.htm

而原来的V1版本除了Z39.50/DTLP协议功能还能继续使用外,其dp2libraryws协议已经不能使用,因为dp2系统V2的对应协议已经变为dp2library协议。



发表时间: 2011-07-04 17:05:39



页 3 / 3 |< < 1 2 3 >|
 

在线用户
访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客 (我自己)   访客访客   访客访客   访客访客   访客访客   访客访客
当前栏目在线用户数 26, 总在线用户数 27