| 栏目导航 |
| KMPRO咨询与购买 | |||||||||
热 线:![]() 传 真:010-62971739-8010 Email: web@KMPRO.cn
|
|||||||||
|
基于kmpro知识搜索的升级方案 来源: 时间:2010-03-05 23:04 作者: 搜索引擎作为知识库的重要功能,必须具备快速、准确、符合搜索条件等特点,能够帮助使用者快速定位查找知识。 目前系统所采用的搜索服务,系采用数据库直接查询的方式,严格说只能算是检索系统,与真正的搜索引擎尚存在一定的差距。在实际使用过程中,知识库系统的搜索引擎存在一些问题,主要表现在: 1. 检索多个关键词时,返回结果不够准确。 2. 对所输入关键词,只能进行精确匹配,不支持模糊查询。 3. 不能检索文档附件内容。 二、 引入全文搜索引擎 为解决知识库存在的问题,更好的利用知识库创造业务价值,提升系统的便捷性和准确性,拟对中信银行知识库搜索引擎进行升级。采用深蓝海域知识搜索引擎,进行智能的知识搜索服务,提升坐席人员查找信息的效率和准确度,缩短业务服务的时间。 深蓝海域知识搜索引擎(Kmpro search engine)是一款拥有自主知识产权的搜索引擎产品,并取得了国家颁发的软件著作权,广泛应用于各大银行的知识管理系统中,为客户提供稳定、快速、准确的知识搜索服务,系统基于JAVA内核,解决海量信息检索,不但支持一般的数据库检索,更为彻底的支持word、excel、ppt、pdf、txt等多种文档格式的全文搜索。 在搜索引擎领域,以Google和百度为代表的搜索引擎,已经全面采用了全文搜索技术,相对于数据库检索而言,全文搜索是一个更为可靠、高效的解决方案。 全文搜索引擎和数据库检索的对比 kmpro全文搜索引擎的优势 数据库 索引 将数据源中的数据都通过全文索引一一建立反向索引 对于LIKE查询来说,数据传统的索引是根本用不上的。数据需要逐个便利记录进行GREP式的模糊匹配,比有索引的搜索速度要有多个数量级的下降。 匹配效果 通过词元(term)进行匹配,通过语言分析接口的实现,可以实现对中文等非英语的支持。 使用:like "%net%" 会把netherlands也匹配出来,多个关键词的模糊匹配:使用like "%com%net%":就不能匹配词序颠倒的xxx.net..xxx.com 匹配度 有匹配度算法,将匹配程度(相似度)比较高的结果排在前面。 没有匹配程度的控制:比如有记录中net出现5词和出现1次的,结果是一样的。 结果输出 通过特别的算法,将最匹配度最高的头100条结果输出,结果集是缓冲式的小批量读取的。 返回所有的结果集,在匹配条目非常多的时候(比如上万条)需要大量的内存存放这些临时结果集。 可定制性 通过不同的语言分析接口实现,可以方便的定制出符合应用需要的索引规则(包括对中文的支持) 没有接口或接口复杂,无法定制 结论 高负载的模糊查询应用,需要负责的模糊查询的规则,索引的资料量比较大 使用率低,模糊匹配规则简单或者需要模糊查询的资料量 三、 具体技术升级方案 经过技术分析,我们认为中信客服知识库的搜索体系,可以进行如下技术改进,以提升知识搜索的准确度和效率: (一) 嵌入全文搜索系统。在现有的知识库系统中,通过嵌入的方式把kmpro全文搜索引擎集成,最大程度的保护现有系统的使用习惯。 (二) 构建全文索引体系。以现有数据源为基础,进行全文索引机制的建立,构建起全文索引数据库。 (三) 定制专门的搜索服务。对于有专项搜索要求的项目,如活动、产品与业务等,可以专门定义搜索引擎,只搜索定义范围内的知识,提高命中率。 (四) 知识搜索培训。通过操作教程和现场培训,使应用人员更为熟练的掌握搜索技术,提高搜索技能。 (五) 搜索联想词。记录搜索人员常用的搜索关键词,当用户输入关键词的时候,自动联想提示其他用户常用频率较高的搜索关键词,以供选择。以高频率的关键词引导用户使用,提高命中率。 (六) 搜索自我学习排序。建立知识的重要等级,根据知识的点击率、知识的好评度,通过科学的加权计算,实现搜索结果的自动排序。让常用的、好评度高的知识自动往前排。 (七) 建立并维护专业词表。建立中信银行或银行金融业专业词表,并建立同义、近义、缩写词表,通过这些此表更为准确的去匹配用户的搜索意图,提高命中率。 (八) 增加知识发布的关键词。根据所发布的知识,匹配关键词表,自动提取本文的关键词,并可以人工进行修改,通过关键词选项进行精准搜索。 经过以上功能和模块的提升,搜索功能的准确率应该会达到一个新的高度,以解决目前搜索不够准确的问题。 |
|
关键词:
上一篇:知识管理推进流程图 下一篇:三个层面的知识管理总体解决方案
|
| 相关文章 |