阿里研发AI技术0.15秒识别拦截外语脏话图

一年多前,阿里巴巴国际安全内容风控小二小荷(化名)在用户交互场景发现了特殊的为规避平台审查的“脏话”案例。

她的工作是借助技术和规则识别与清扫影响清朗环境的违规内容,刚开始,一些小广告和口吐芬芳的脏话只是以文字形式呈现,后来随着对抗升级,一些脏话嵌入到图片中,甚至会使用多国语言进行伪装。

为解决这个问题,阿里安全进行了多语种识别技术升级。近日,阿里安全算法团队宣布,其研发用于网络脏话的AI(OCR)技术,已能识别近30种语言,包括嵌入图片中的英文、阿拉伯、俄语、法语、西语、日语、韩语、泰语、越南语、波斯语、孟加拉、尼泊尔、僧伽罗、朝鲜、苏丹、德语、荷兰语,以及马来语、塔加洛语、土耳其语、意大利语、印尼语等国语言,甚至还包括三种中国少数民族语言。

在部分国际平台中,“买家”在商品评论中以英语评论图骂人,或者在交互场景中,买卖双方以俄语脏话图片对阵。国际平台风控团队和算法团队复盘了很多案例,发现除了多语种脏话,多语种垃圾广告以及不良信息也会暗藏在图片中,试图对抗风控。

全球有几百种语言,重点的语言也有几十种,一个工作人员最多认识三四种语言,在国际化场景下,靠人工识别风险图片是不现实的,多语言识别的技术需求应运而生。

阿里研发AI技术0.15秒识别拦截外语脏话图

展开阅读全文

页面更新:2024-05-30

标签:阿里   西语   马来语   荷兰语   脏话   孟加拉   俄语   技术   语种   算法   团队   外语   语言   国际   图片   平台

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top