全域数据一体化构建 ⑥ - 标签平台

在互联网逐渐步入大数据时代后,不可避免地给企业、组织及用户的行为带来一系列改变与重塑。最大的变化,用户的所有行为在企业/组织面前几乎都是可视的。随着大数据技术的深入研究与应用,企业/组织的专注点日益聚焦于怎样利用大数据来为精准营销服务,进而深入挖掘潜在的商业价值。于是,“标签画像”的概念也就应运而生。

简而言之,实体画像是根据实体社会属性、行为、发展趋势等信息抽象出的一个标签化的模型。构建实体画像的核心工作即是给实体贴“标签”,而标签是通过对实体信息分析而来的高度精炼的特征标识。给实物打标签是常见的一种数据分析归类手段,在移动互联网的时代,各个平台对标签的应用场景无处不在。


01 产品需求背景

随着企业的数字化转型不断发展,从海量的数据中识别并提炼数据价值是一件非常重要的事情。在企业的标签管理中,会面临着数据无法统筹、标签缺乏治理、计算方式单一等问题,同时也对标签平台的能力有了更高的要求,集中体现在以下四点:

1.数据散落无法统筹到统一的数字底板上

用户行为数据,物品信息数据,经营数据、事件数据等各类数据散落在不同的平台,难以完整地描述单实体的完整社会、行为属性。

2.标签缺乏全链路周期治理

目前市面上的标签平台缺乏一个从数据接入、标签计算、标签存储、标签使用等全链路、血缘的监控和可视化展现功能,无法进行标签溯源和方便高效的问题排查。

3.标签需要丰富多样化的计算方式

标签需要丰富多样的计算方式,以支撑标签的权重、时效、预测、分析、关系、实体描述等多种应用场景,因此必须结合实时、离线数据,支持关系型运算、实时离线混合计算、多种AI模型。

4.传统关系型数据库无法满足查询和计算需求

各行业数据积累越来越多,海量数据需要计算和抽取属性、内容来描述现实世界的实体目标,传统的关系型数据库、普通的大数据计算引擎无法满足计算需求和海量数据下的查询需求。


02 标签平台概述

产品架构图

基于用户需求和多种多样的数据来源,标签平台经过标签建模、标签工厂多维分析加工处理,生成标签结果数据,构建丰富的标签服务,实现大数据标签体系的数据赋能,支持多元化应用场景。

产品构建了完整的标签治理体系,囊括从标签运营、全链路血缘、质量管理、权限管控的全生命流程。同时针对标签计算本身添加其时效性参数、标签权重值、AI预测标签、手动自动运维标签功能、标签历史版本和标签数据同步交换功能,最大化实现数据价值变现。

北明数科结合公安、政务、智慧城市、有呼必应事件等多领域深厚的大数据技术积累,为客户提供基于数据的标签体系建设能力,将数据标签化,通过给实体打上标签的方式,让数据的价值密度更高


03 标签平台主要功能

1.标签构建

根据获取到的源数据形成可用的实体属性和实体行为、特征等数据,通过业务建模、引擎计算进行加工生成事实标签、模型标签、以及预测标签。根据业务需要进行用户分群,精准定位用户群体,标签整体随着业务变化、运营策略调整而实时更新。

根据业务对象的属性构建标签类目体系,对标签信息进行结构化描述,清晰的展示标签之间的关联关系。

新建标签分类

分析业务需求、确定业务口径、分析数据规律,进行数据标签的规划和模型构建。

标签建模

通过建模生成的标签,执行业务标签实例,生成相应数据,并给目标打上对应标签,构建对上层提供数据服务的基础。

标签开发

2.全链路任务监控

提供对实体采集任务的监控,以可视化方式展示周期/手动采集任务的执行情况,可对任务周期进行配置。

实体任务监控

针对标签开发中的标签模型、标签日表、聚合等任务以可视化方式展示其执行情况,方便开发人员监控整个从实体到标签的全链路任务执行过程。

标签开发任务监控

3.画像平台

对用户线上和线下行为深度洞察,构建全面、精准、多维的用户画像体系,提供丰富的用户画像数据以及实时的场景识别能力。可针对个体和群体进行画像,并自定义画像展示内容和分析图表,同时可结合历史行为、数据自定义内容进行趋势分析。

画像平台

4.标签分析挖掘
以标签、实体为基本元素,提供自定义可视化拖拽的图形分析功能,支持交并差以及自定义组合功能算子,对标签数据结果进行运算,中心以快速、高效、便捷、实用为设计理念,为线索研判、分析决策、多维组合分析、趋势预测等场景提供有效支撑。分析挖掘结果支持以文件形式下载,或转储到库表,方便进一步分析、使用。

标签分析挖掘

5.标签中心

对整个数据中台的标签以平铺、目录等多种视图直观展现整个标签生态数据,支持对标签多样维度的分析、版本管理、任务监控、权限管理和设置、标签实体管理、标签血缘分析、标签数据预览、标签维护等功能。

6.标签资产

以单个标签为中心,解析标签模型元数据,形成清晰、准确的数据血缘图和数据流向图,以历史事实的方式记录数据的来源、处理过程等。形成整条可数据溯源的标签链路,达成从原始采集端到服务输出端全链路的计算监控、数据溯源、问题排查等。

标签资产

7.标签质量

提供对标签生产结果数据和标签模型定义的质量检测。针对标签模型,提供对模型元数据的命名、定义进行规范化检测。

针对标签数据提供对标签命中数、含义冲突、标签使用运营情况、热度等进行整体的分析研判,形成闭环的正反馈提高标签整体效能

7.标签应用

04 产品优势

1.画像模板

可自由拖拉拽的方式定制多种画像分析模板,根据用户喜好自由组合标签画像的展现方式,生成个体和群体画像。

2.混合计算

支持实时数仓和离线数仓混合计算,生成基于时效性的动态标签和基于客观事实的静态标签,多样化描述实体的主观认知和客观事实属性。

3.全链治理

覆盖标签地图、标签溯源(标签时间轴)、血缘、标签质量、标签热度、标签维护、标签覆盖率、标签评价、手工维护等全链路治理能力。

4.机器学习

利用线性回归、决策树、聚合算法、RNN、TF-IDF、NLP等算法,为标签生成、标签生命周期管理、标签权重、预测等场景提供算法支持


05 应用场景

1.金融风控--客户画像

通过数据模型,如企业评分标签,以及企业标签信息,构建企业画像,根据权重,进行企业评分,通过将多维指标进行规则化运算,让用户更直观掌握企业总体信息。

2.城市大脑--人员标签

依托某省级城市的数智中台底座,通过标签平台建设人口基础库和主题库,进而提供数据分析、画像分析、数据共享、数据查询服务。人口库可以根据不同主题专题的人员相关数据进行横向拓展,不断完善人员的扩展信息,打造全面的人员档案。


进入北明数科官网,了解数字化转型更多详细内容,预约免费演示!

该系列历史文章汇总:

全域数据一体化构建① | 数据治理平台

全域数据一体化构建② | 预警平台

全域数据一体化构建 ③ | 知识图谱

全域数据一体化构建 ④ | 物联感知平台

全域数据一体化构建 ⑤ | 智能检索平台

展开阅读全文

页面更新:2024-03-10

标签:多维   标签   数据   平台   画像   实体   模型   方式   用户   企业

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top