初探游戏风控系统

在我司的部分游戏中,存在着大量刷小号的行为,即玩家通过建立小号,购买一些返利商品或者通过刷签到元宝等方式积攒元宝,然后通过加价购买大号廉价商品的方法,将所获得的元宝转移给大号。刷小号的行为严重影响了游戏内的生态,因此针对游戏内玩家建立风控系统迫在眉睫。

目前游戏中存在刷号行为的玩家主要是以工作室为主,也有一些个人小号。(由于业务敏感性,本文主要谈方法)


我们首先对如下名词进行简单定义:

刷量用户:在未来45天内,90%的元宝流出方式,都是通过加价购买的用户

输入:用户在过去一周内的行为特征。

输出:用户刷量概率值。


数据收集

为了建立有效的风控体系, 首先需要对数据进行收集。


1、 游戏内基础数据:考虑到模型的通用性以及研发部门数据的敏感度,提取了一些敏感度较低的特征:在线时长、活跃度、签到领取元宝等特征。


2、 游戏sdk数据:游戏sdk数据包含激活、登录、选服、创角等,目前主要保存在hive中,通过一些hive sql进行提取。以工作日登录次数、节假日登录次数举例:


特征工程

1、特征衍生

以“充值不同金额数”特征举例,主要考虑到刷量用户大部分都是通过月卡返利的形式获得元宝,因此在理论上刷量账号“充值不同金额数”通常不会很多,通过以下代码获取特征并绘制分布图结果如下:


2、特征交叉

以“工作日/节假日在线时长比”为例,一般正常玩家节假日可能会玩更久,而工作室一般都是在工作日。


3、使用卡方检验对离散特征进行显著性检验

考虑到样本量还是比较大,不需要进行卡方校正。以"上一周是否签到”特征为例,样本空间的联合分布律如下表所示:

假设月卡与刷号没有关系,根据样本空间对总体刷量概率作极大似然估计,设随机变量x为刷量时间,则x (n, p),二项分布通过对数似然函数的一阶导函数求解析解即可得p=(a+b)/(a+b+c+d)。

根据卡方检验定理,

服从自由度为k的卡方分布,通过卡方分布的概率密度函数即可得到显著性p值。




4、使用相关系数对连续型特征进行筛选

处理一下特征与特征之间相关性很强的情况,避免特征矩阵不满秩,再通过与label的相关性去掉相关性较低的特征。


5、当模型欠拟合且鲁棒性差,如何获取更多的数据?

当前特征少,表现力不足且业务方无法提供更多数据的情况下,引入的图数据库,构建用户知识图谱,找到用户与用户之间关联性,这里引入了neo4j作为图数据库。举个例子:以”用户”,”设备”为节点,以”使用了”为边,建立有向图,通过neo4j-import在初始化阶段快速导入亿级数据,在设备、用户节点的属性上建立索引,然后进行快速查询。



Eg:以查询” 设备2”的一度关系内刷量用户举例

match (u:User)-[r:Used]-(d:DEVICE) where d.name="设备2" and u.is_fraud=1 return u,r,d


事实上,我们可以图数据库构建一个复杂的知识图谱,快速找寻一些群体关系特征,这部分特征的表现力,解释性都比较强。

模型建立:RandomForest和GBDT融合,使用树模型的主要目的主要是可解释性并且能够快速有效区分样本空间。

最后给出整个项目流程图如下:


总结与展望

整个项目中最大的挑战在于特征工程和取数,对于封号的处理方式,模型使用的特征要做到可解释,精度要求高,传统特征提取方式难以寻找到表现力强的特征的形势下,知识图谱成为最好的选择。与游戏灰产斗争是一个长期的过程,不断提高其刷号成本是模型迭代的主要目标,在数据可获得的情况下,未来可以加入身份证、付费卡号,游戏内的一些关联性特征等建立更完善的知识图谱,获取更多显著的游戏行为,进一步提高其刷号成本。

最后分享有关如何剔除个人小号的一些方法。

业务方提供的负样本中包含了大量的个人小号,从特征来看,个人小号的特征与正常玩家的特征没有明显区分性,因此在模型学习之前要先剔除负样本中的个人小号,保留工作室小号作为负样本,剔除个人小号的方法比较多。简单介绍如下3种。


累计元宝总额分布

通过累计元宝总额的分布来看,一般来说部分个人小号由于积极性比较低,获得元宝数可能较少,或者由于积极性过高获得大量的元宝,对于工作室而言,获得的元宝太少没有收益,太多又要写很多的外挂脚本,成本高,但是这种区分过于粗糙。

聚类的方法

通过聚类的方法,通过常用的聚类的方法,对特征进行聚类,去掉类别中负样本比例较少的负样本。相对于单特征分布,聚类方法更加细化。

社群发现算法

通过社群发现算法,如果能够找到一个用户所在的群体,通过群体大小作为判断,就能够相对精确得到是个人小号还是工作室小号。


作者:LWB

来源-微信公众号:三七互娱技术团队

出处:https://mp.weixin.qq.com/s/CQzWc2ZbLj1Y0-XqYaQ6Nw

展开阅读全文

页面更新:2024-05-13

标签:游戏   元宝   图谱   小号   样本   模型   特征   方法   数据   用户   系统

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top