知嘟嘟专利转让网

文档检索设备及文档检索方法专利

知嘟嘟专利转让网 2020-10-16 来源:中国专利局 编辑:知嘟嘟小编
本发明涉及一种用于执行文档检索的设备及其方法,更具体地,涉及一种能检索包含图像的文档的设备。背景技术近年来,数据存储方法越来越先进,并且存储装置的制造成本也降低了。这样,可以容易地存储和管理大量的文档数据。另外,具有先进的功能和高性能的文件服务器和文档管理系统已经广泛使用,并且用于这种服务器设备和系统的群件已经普及。随着具有先进的功能和高性能的信息处理设备的发展,诸如复印机、打印机、图像扫描仪、传真设备、数码相机和具有存储文档并发送和接收图像的功
专利名称:文档检索设备及文档检索方法
技术领域
本发明涉及一种用于执行文档检索的设备及其方法,更具体地, 涉及一种能检索包含图像的文档的设备。
背景技术
近年来,数据存储方法越来越先进,并且存储装置的制造成本也 降低了。这样,可以容易地存储和管理大量的文档数据。另外,具有 先进的功能和高性能的文件服务器和文档管理系统已经广泛使用,并 且用于这种服务器设备和系统的群件已经普及。
随着具有先进的功能和高性能的信息处理设备的发展,诸如复印 机、打印机、图像扫描仪、传真设备、数码相机和具有存储文档并发
送和接收图像的功能的多功能外设(MFP )等各种图像处理设备可以 在网络上相互通信。
在网络连接环境下,在各种信息处理设备和图像形成设备之间经 常发送和接收大量的文档数据。在这方面,用于在办公室积极存储经 网络流动的大量文档的存储基础结构已经投入使用。
日本专利号3486452(美国专利号6,061,150)公开了可以连接至少 两个图像数据输出设备的合成图像形成设备,该合成图像形成设备能 可靠地存储图像的副本,而不需要操作者执行特殊的操作。
为了从大量所存储的文档中有效地检索所需的文档,、除了检索文 本文档以外,提供检索主要包括图像的文档的能力也是重要的。全文 本检索可能不适合于检索主要包括图像而不是文本的文档,例如演示 材料和具有大量图形和图像的文档。当利用基于图像指定的检索关键 检索包括图像的文档时,如果只进行全文本检索,可能就不那么有意 义了。 传统的相似图像检索方法使用图像作为检索关键来检索相似的
图像。传统的相似图像检索方法根据图像的边缘抽取对象(object), 以便确定图像的形状,并使用多个对象的位置、颜色和相对位置来确 定图像是否是相似的图像。另一种传统的相似图像检索方法在直方图 中抽取构成整个图像的主要颜色和颜色模式的组合,并使用该结果确 定图像是否是相似的图像。
曰本专利申请公开号2006 - 065866 (美国专利申请>^开号 2006/0050985 Al)公开了使用用于计算特征量的算术处理(类似于i人 知相似性确定处理)的相似图像检索方法。
使用图像检索方法的文档检索并不旨在检索本身被指定为检索 关键的图像,而是旨在从包括多个图像的文档中适当地找到包括被指 定为检索关键的图像的所需文档。
例如,日本专利申请/>开号2002-149659公开了图书检索服务 方法,在该方法中,用户提交包括图书的部分数据(例如,书的一页 的副本)的检索请求数据,使用所提交的数据检索图书数据库,并将 检索的结果通知给发出请求的用户。
在日本专利申请公开号2006- 065866 (美国专利申请公开号 US2006/0050985 Al)公开的仅使用图像检索方法的方法中,作为检索 结果只找到一个文档的情况是;f艮少的。在大多数情况下,检索结果列 表包括大量的文档,其中包括大量的"噪声"文档(不是所需的文档)。
这是因为在大规模存储基础结构中,在大多数实际情况下,存在 由重新使用或修改相同的图像而创建的大量文档。
由模拟连续量表示图像之间的相似程度。这样,不同的图像某种 程度上也具有相似性。因此,得到根据图像检索执行的文档检索的结 果作为连续命中率,而不是根据文档是否完全被命中而得到的离散结 果。
因此,通过尽可能精确地缩小(narrow)检索结果列表来设定 详细的检索条件,以便只有与所需的文档基本上相似的文档被命中是 重要的。
由日本专利申请>^开号2002 - 149659 /〉开的方法从部分页面图 像数据检索文档(书),与上述传统方法相同。然而,日本专利申请
发明者山本雅仁 申请人:佳能株式会社
0

精彩评论

暂无评论...
验证码 换一张
取 消