欢迎您来到 数字平台。 您尚未登录。[登录] [注册新用户]
当前位置: 论坛首页 / 栏目 产品与服务 / 文章 87

点击:1521

[顶层访客留言] [回复顶层(需要先登录)] [表状] [详细]
[回复留言] [回复(需要先登录)] [引用(需要先登录)]普通文章跟帖
文章id: 87
编目查重

作者: xietao


查重是编目和采购等业务环节的一个重要功能。

dp2编目系统提供了一个查重窗口,专用于进行查重。这个窗口作为一个组件,也可以在数据加工的二次开发C#脚本中调用。

下图是查重的场景: 

dp2编目系统查重的操作原理,是将查重发起的记录,按照该记录所从属的书目库的检索点配置策略,创建检索点,然后利用这些检索点,针对若干查重目标库进行检索。

这里所指的创建检索点,是模拟保存记录到数据库的那种规则,创建检索点,哪怕是尚未保存的新记录,也可以这样运作。

对目标库进行检索后,软件将按照预先配置的权重指标,对命中进行评估,测算出一个权值的和,如果某项命中记录的权值和超过预先配置的“阈值”,界面上就会把这项加亮显示,权值左边也会着重标出一个星号,表示这项就算和发起记录“重”了。

===

下面是服务器全局cfgs/dup配置文件的片断:

...

    <project name="采购查重" comment="示例方案">
        <database name="测试书目库" threshold="60">
            <accessPoint name="著者" weight="50" searchStyle="" />
            <accessPoint name="题名" weight="70" searchStyle="" />
            <accessPoint name="索书类号" weight="10" searchStyle="" />
        </database>
        <database name="编目库" threshold="60">
            <accessPoint name="著者" weight="50" searchStyle="" />
            <accessPoint name="题名" weight="70" searchStyle="" />
            <accessPoint name="索书类号" weight="10" searchStyle="" />
        </database>
    </project>
    <project name="编目查重" comment="这是编目查重示例方案">
        <database name="中文图书" threshold="100">
            <accessPoint name="责任者" weight="50" searchStyle="" />
            <accessPoint name="ISBN" weight="80" searchStyle="" />
            <accessPoint name="题名" weight="20" searchStyle="" />
        </database>
        <database name="图书测试" threshold="100">
            <accessPoint name="责任者" weight="50" searchStyle="" />
            <accessPoint name="ISBN" weight="80" searchStyle="" />
            <accessPoint name="题名" weight="20" searchStyle="" />
        </database>
    </project>
    <default origin="中文图书" project="编目查重" />
    <default origin="图书测试" project="编目查重" />

...

这里定义了两种查重方案(<project>元素),其中一种“编目查重”缺省和“中文图书”和“图书测试”关联了起来。

===

值得一提的是,在dp2batch模块中,某些“批处理方案”通过脚本调用上述查重窗口,实现了外部数据批处理一边转入一边查重的功能。经查重表明重了的记录,就被跳过不会转入了。很典型的例子是,对外部采购数据批处理装入“征订数据库”,就需要有这样的查重能力。



发表时间: 2006-05-30 15:54:04
最后修改时间: 2006-05-31 15:43:21



  • 精品 图解dp2编目系统 xietao 2006-05-30 15:03:14[点击:129555]
  • 普通文章 什么叫dp2 ? xietao 2006-05-30 15:15:07 (ID:76) [点击:1816]
  • 普通文章 框架窗口,检索窗 xietao 2006-05-30 15:20:10 (ID:77) [点击:1530]
  • 普通文章 详细窗 xietao 2006-05-30 15:24:14 (ID:78) [点击:1697]
  • 普通文章 定长模板 xietao 2006-05-30 15:27:00 (ID:79) [点击:1547]
  • 普通文章 值列表 xietao 2006-05-30 15:30:23 (ID:80) [点击:1463]
  • 普通文章 缺省值 xietao 2006-05-30 15:34:05 (ID:81) [点击:1437]
  • 普通文章 一些编辑功能 xietao 2006-05-30 15:36:49 (ID:82) [点击:1591]
  • 普通文章 自动创建数据 xietao 2006-05-30 15:40:48 (ID:83) [点击:1514]
  • 普通文章 种次号 xietao 2006-05-30 15:44:14 (ID:84) [点击:1505]
  • 普通文章 分类主题对照 xietao 2006-05-30 15:47:14 (ID:85) [点击:2073]
  • 普通文章 使用中的一些顾虑 liujp 2006-07-02 21:43:28 (ID:98) [点击:2069]
  • 普通文章 回复: 使用中的一些顾虑 xietao 2006-07-03 10:30:21 (ID:102) [点击:1799]
  • 普通文章 服务器端不能创建根下的cfgs目录 liujp 2006-07-02 21:46:26 (ID:99) [点击:2004]
  • 普通文章 回复: 服务器端不能创建根下的cfgs目录 xietao 2006-07-03 10:37:31 (ID:103) [点击:1537]
  • 普通文章 典藏册登录 xietao 2006-05-30 15:49:50 (ID:86) [点击:1777]
  • 普通文章 编目查重 xietao 2006-05-30 15:54:04 (ID:87) [点击:1521]
  • 普通文章 观察检索点 xietao 2006-05-30 15:56:06 (ID:88) [点击:1852]
  • 普通文章 著者号码 xietao 2006-06-01 15:07:35 (ID:89) [点击:1750]
  • 普通文章 繁简体汉字归一化检索点技术 xietao 2006-06-01 15:36:43 (ID:90) [点击:1609]
  • 普通文章 追记 xietao 2012-04-02 12:02:14 (ID:724) [点击:1371]
  •  

    在线用户
    (无) 
    当前栏目在线用户数 0, 总在线用户数 1