全文检索

全文检索系统采用分布式架构,具有很好的扩展性、准确性和实时性,在同义词扩展、高亮查询结果、专业分词、实时索引、高效压缩、机器学习等方面,都有很强技术优势。通过普通检索、精准检索、二次检索等多种专业的检索方式实现更有效的资源筛选,从而提升用户使用体验。

普通检索:基于高效的索引和排序算法,能够实现方便快捷的普通检索,将数据库中所有内容统一检索排序,并可按照分库检索、内容归类筛选排序。

精准检索/扩展检索:我们的系统支持灵活的同义词配置,除了扩展词表的可配置外,是否使用同义词、使用哪些同义词表等均可配置。能够很好地实现精确检索时关闭Query的同义词扩展,扩展查询时则使用同义词库进行扩展检索。

二次检索:为了能够快速、准确的反馈给用户二次查询结果,按照相关度对返回的结果进行排序,系统在用户查询提交索引库之前,先需要进行文本分析,对用户的查询语句进行分词处理。将分词后的多个结果在缓存中进行查询,对于命中缓存的直接返回缓存结果,没有命中的则进行索引查询,然后对查询返回的多个索引结果集暗中布尔逻辑关系合并,并对合并后的结果集进行排序。

 

高级检索:系统支持上百种索引条件的复杂组合,支持自由限定字段检索、不同字段之间布尔逻辑检索、限定分类类型检索、限定出版时间检索等。

图书检索:系统支持图文并茂的搜索结果展示,从数据库中检索书名,检索结果页面样式含有封面、作者、关键词、摘要等要素。

书内检索:用户在系统中浏览某一本书的时候可以进行当前图书内检索,查阅书中出现查询词的句子或片段(关键词有高亮显示),点击对应的搜索结果可以跳到书内对应的部分,进一步提升用户体验。