产品简介
中文全文智能检索基础件是海量针对信息处理和多种应用系统的需要,面向软件开发商与系统集成商开发的一套性能卓越、接口标准灵活、便于二次开发的软件包。
全文检索基础件向用户提供了丰富的检索方式,可以满足各种用户的检索要求。同时还提供了数据删除,数据检查,数据修复,数据紧缩功能。确保了数据的安全,简化了系统维护,节约了系统资源。
功能介绍
- 内嵌海量中文分词
- 业界领先的智能分词技术,确保各项信息处理功能快速、准确。
- 全文搜索
- 包括关键词搜索、分类搜索、逻辑搜索、句内搜索、中英文混和搜索、在结果中搜索。
- 联合搜索
- XML中多个字段联合搜索,并按照XML中任意字段指定排序方式。
- 相关文档搜索
- 通过语义识别技术,搜索与用户指定文档意义最相近的信息。
- 描述性搜索
- 通过语义识别技术,搜索与用户输入描述意义最相近的信息。
- 动态摘要
- 在搜索结果页面,显示搜索结果中含有搜索词的句子或段落作为摘要。
- 原文提取
- 直接打开原文档。
- 摘要搜索词反显
- 将搜索结果摘要中出现的搜索词,以区别于其他内容的颜色显示。
- 原文搜索词反显
- 将搜索结果原文中出现的搜索词,以区别于其他内容的颜色显示。
- 多格式文档支持
- 实现对office文档、pdf、html、xml、text等格式文档的支持。
产品特点
- 索引速度快
- 海量全文检索基础件实现了大数据量下的快速索引功能,提高了管理者的工作效率,同时避免了由于索引时间增加引发的数据丢失风险。
- 膨胀率低
- 海量全文检索基础件索引膨胀率最低可达18%。节省了存储空间开销,间接提高了检索速度。
- 检索速度快
- 10亿汉字平均检索时间5MS。
- 数据灾难的保护
- 海量全文检索基础件,在突发情况下,可以妥善的保护已建立部分的索引数据。并可快速地对正建部分受损的索引数据实施修复。从而避免数据灾难。


