全域数据一体化构建 ⑤ - 智能检索平台

近年来,数字经济作为全球经济的重要内容,已成为全球经济发展的主线,并在逐步推动产业界和全社会的数字转型。随着移动互联网的发展,数据服务的形式开始增多,业务维度更加复杂,传统的数据库Mysql、Oracle或者非关系型数据库Mongo作为基础存储的企业要想实现业务数据的全文检索,该如何实施呢?在保持基础数据库不变的同时,新增全文检索,更好、更快地从亿万数据中获取检索服务。

01 产品简介

智能检索是基于开源的分布式搜索引擎elasticsearch优化封装形成的一套一站式搜索服务平台。

底层通过扩展elasticsearch分布式分片技术,可以支撑上百个数据计算节点以上的集群规模并提供横向无感扩容。

基于NLP技术的中文分词器,提供强大的语义搜索功能,支持按行业做语义搜索适配以及分词器插件式集成开发。

提供针对海量数据的采集、处理、查询配置、算法调参、性能监控、服务授权等可视化操作,面向用户提供包括文本语义搜索、地理空间搜索、文件内容搜索等丰富的检索服务。

02 产品架构

智能检索是为数据中台提供一个全域数据检索的能力,将存储在数据仓库里的数据同步到全文检索库,为上层应用提供丰富的数据检索能力。
在架构上延用数据中台的数据汇聚能力,在数据汇聚能力中增强一些文本分词的处理,同时利用数据服务平台为上层应用提供强大的数据检索能力。

产品架构图

03 产品功能

1、索引资源管理

索引资源管理的功能主要为用户提供索引统一管理界面,包括如下具体功能:

2、搜索管理

搜索是全文检索的核心功能。用户在搜索的过程中,涉及分词、语义分析、搜索权限校验的过程,搜索管理模块里可以对过程的规则进行管理。

为用户提供模板统一管理界面,从模板列表界面可以查看模板名称、模板匹配名称、优先级、索引别名。

内置多种分词器类型,完成分词器的安装后,可对分词器进行增删改查和测试操作。分词器用户对搜索关键词进行分词。例如,输入“张三的职业是程序员,他热爱编码和户外运动”,使用分词器分词的结果为:张三,的,职业,是,程序员,他,热爱,编码,和,户外运动。

用户可以自定义词典,为语义分析提供依据。例如,添加同义词词典,设置同义词词条,在进行语义分析时,输入词语A,可关联查询其同义词词语B。

在词典管理模块里,可进行词典的增删操作,以及词条管理操作。

当用户需要在词典添加或删除词条时,可通过词条管理进行设置。词典文件为.txt的词典可通过词条管理进行导入、新增或删除;为http链接的词典不可编辑。

系统支持对输入条件进行语义分析。分析器设置包括分词器、分词过滤器、字符过滤器三个部分,配置分析规则。


3、运营统计

运营统计主要用于从不同维度,统计资源、搜索、服务的使用信息。

4、资产管理

索引资产模块,提供业务类型、数据来源类型两种维度归类展示索引信息。

5、应用服务


6、集群监控

集群监控模块用于对ES集群健康状态和集群信息的监控。自动采集集群信息,并可视化显示。


7、智能搜索

智能搜索模块,支持展示热搜排名和行业数据表数量统计。可根据业务分类和关键词进行搜索,支持对结果进行二次搜索。


04 产品优势

05 应用场景

面向政府门户网站群数据的搜索引擎提供下属机构的网站信息,为公众提供全面、完整、及时的当地政府公开政务信息的“一站式检索”服务。

面向企业机构中存在很多文档类数据材料、知识库等数据形式,提供OCR、文档解析等技术将数据归并入库并对外提供文档内容检索;

面向智慧城市领域多元的城市部件、城市事件、城市体征提供统一的智能关联分析搜索服务;

面向公安的海量侦察数据提供准实时的数据存储服务并提供高性能的多元的检索服务。


进入北明数科官网,了解数字化转型更多详细内容,预约免费演示!

北明数科荣获第一届中国大数据大赛“数据治理”赛道优秀奖

全域数据一体化构建 ④ | 物联感知平台

全域数据一体化构建 ③ | 知识图谱

展开阅读全文

页面更新:2024-03-31

标签:分词   数据   语义   词条   集群   词典   索引   次数   模板   业务   智能   平台

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top