==========
以下是引用 الاهرام 于 2006-11-23 14:35:50 发表的文字:
可以检索从右到左的小文种,但是字段中的用到的标点符号,应该按照小文种的习惯,放在标题的左侧,而不是右侧,比如美国国会馆的这条数据,就存在这个问题。880字段:
6245-02/(3/raالديمقراطية والأحزاب السياسية فى مصر الحديثة والمعاصرة، ٥٧٨١-٢٥٩١ :bدراسة تاريخية سياسية تحليلية /cعبدالعزيز رفاعى.
==========
当前程序将美国国会图书馆用EACC处理的阿拉伯文字转换为可读字符截屏图为:
我理解你所说的意思是,将每个字段内容后置结束符(标点分隔符号,下图红圈标识部分),按阿拉伯这类从右往左语序小语种的习惯,后置结束符应放在阿拉伯文内容之后,即最左边而非常见从左往右语序的最右边,见下图:
1、现在状态
2、你认为的状态
由于我孤陋寡闻,没有见到过阿拉伯语种的MARC效果,不敢妄加评价。仅作如下分析供参考:
国会图书馆Z39.50服务器支持UTF-8,按理说,UTF-8应该能容纳下包括阿拉伯文字在内的所有字符编码。但因为历史遗留的数据,对于阿拉伯文、中、日、韩等数据,采用的是EACC编码,输出交换时放入880字段中。所以,我们发现国会图书馆相关数据,仍在880字段中,以EACC编码保存字符。那么,对于880以外的其它字段,它是采用英文的语序习惯描述信息,880字段如果是中文等内容,由于语序是一致的,不会有冲突。但880中如果是阿拉伯文或希伯莱文,它们从右往左的语序就与英文的从左往右语序冲突了——如果简单设置一个语序方向,非此即彼,是排它的选择,适应阿拉伯文习惯就不适应英文习惯。
所以,当前程序仍默认以左往右为主序,只有遇到阿拉伯文时改变语序。而标点符号,包括阿拉伯数字,因为它们也属常见字符,当然依的是常见左往右序了。
解决方案:增加一个改变默认语序的程序设置,如果设置程序为默认为从右往左语序后,所有的标点符号就都放在前一字符的左边——嘿嘿,这个时候,中国人或美国人看这种数据可能就感到怪怪的。
请有条件的朋友,多看看国外系统如果解决这个问题,尤其是以色列Ex Libris公司的产品Aleph500,因为以色列显然有处理希伯莱文这种从右往左文字的需求,那么,处理阿拉伯文的界面也就一样了——及时得到朋友们的反馈信息,可以帮助我们开发出更友好的数据界面。
在此,先谢谢各位了。