以下是引用 Harry 于 2009-3-21 10:14:16 发表的文字:
刚才在写有关加拼音的程序,想让每个拼音之间都留一个空格,中文标点要转换为英文标点,标点前面不能有空格,后面要有空格;我先把xml里面中英文标点对照部分加上,然后再在程序里每取一个拼音就在其后加上空格,这样加的拼音标点符号前后都有空格,晕了,我不能在程序条件判断部分穷举标点吧,如果在xml里给每一条加上属性判断其是汉字还是标点似乎也很麻烦...
于是就打开dp2编目前端,看看dp2是如何加拼音的,加了一条拼音,发现拼音中的标点是中文的,前后有一个空格。想来老师在这个地方是这样弄的:每个拼音后都加空格,字符不是汉字的,就取不到拼音,那就保持原字符了,后面依旧加空格,哈哈,这样是不是有点偷工减料了...拼音中有中文标点,前后还都有一个大空格,好长一块...,小小地嘲笑一下。
拼音中为什么不能有中文标点呢?你给我个理由先。或者说,你给我一个这方面的国家标准的编号我看看。
拼音中要多少空格,我还没有琢磨过,记得当时是模仿dt1000的办法作的。而dt1000的做法,是用户认可的,大量的用户...。还有一些专家级的用户。还有认定了一个国家标准,一定要按词连写的...。
拼音中的中文标点,前后为什么不能有空格呢?
所谓大空格,听不明白。
拼音子字段中的内容,是需要编目员检查和加工的,软件只是辅助。
建立检索点的时候,所有标点符号都应被过滤。