阿里研发AI技术0.15秒识别拦截外语脏话图

一年多前，阿里巴巴国际安全内容风控小二小荷（化名）在用户交互场景发现了特殊的为规避平台审查的“脏话”案例。

她的工作是借助技术和规则识别与清扫影响清朗环境的违规内容，刚开始，一些小广告和口吐芬芳的脏话只是以文字形式呈现，后来随着对抗升级，一些脏话嵌入到图片中，甚至会使用多国语言进行伪装。

为解决这个问题，阿里安全进行了多语种识别技术升级。近日，阿里安全算法团队宣布，其研发用于网络脏话的AI（OCR）技术，已能识别近30种语言，包括嵌入图片中的英文、阿拉伯、俄语、法语、西语、日语、韩语、泰语、越南语、波斯语、孟加拉、尼泊尔、僧伽罗、朝鲜、苏丹、德语、荷兰语，以及马来语、塔加洛语、土耳其语、意大利语、印尼语等国语言，甚至还包括三种中国少数民族语言。

在部分国际平台中，“买家”在商品评论中以英语评论图骂人，或者在交互场景中，买卖双方以俄语脏话图片对阵。国际平台风控团队和算法团队复盘了很多案例，发现除了多语种脏话，多语种垃圾广告以及不良信息也会暗藏在图片中，试图对抗风控。

全球有几百种语言，重点的语言也有几十种，一个工作人员最多认识三四种语言，在国际化场景下，靠人工识别风险图片是不现实的，多语言识别的技术需求应运而生。

展开阅读全文

页面更新：2024-05-30

标签：阿里西语马来语荷兰语脏话孟加拉俄语技术语种算法团队外语语言国际图片平台

1 2 3 4 5

阿里研发AI技术0.15秒识别拦截外语脏话图

“OV真米”新格局逐渐稳固

iQOO Z5将在9月23日正式发布

能播4K、8K节目中国卫通称中星9B卫星测试后将交付公司运营管理

iPhone 13 Pro跑分出炉

史上最好看小米手机

微软发布全新入门级平板Surface GO 3

阿里巴巴上线阿里拍卖App

曝iPhone 13包装贴纸已被破解

哈弗H6国潮版，看本土品牌如何打造潮流单品？

质心下降10mm，搭载前后稳定杆，哈弗H6S为什么要这么做

给机器人装上41个国产“关节”？

华为推出14寸大屏手机？

荣耀MagicBook V 14旗舰本发布

国产全新5G芯片登场

相隔千里共赏明月京东MALL远程连线活动为西安增添中秋氛围

阿里巴巴上线阿里拍卖App

全新Switch被曝光：支持DLSS技术、4K输出

平台风盛行！第三代哈弗H6吃了柠檬之后变强了么？

算法不精，核心技术未掌握，国产工业机器人与国外近10年差

格力500亿进军芯片市场，不让技术受制于人！

揭开CT机的真面目，顶级设备上千万一台，核心技术仍未掌握

0.1毫米的高精度五轴加工，大神级的技术水平！

这家德国公司不止生产工具，还颠覆包装技术，能替代一个工

TDI发动机，四两拨千斤技术！

艺术级的焊接技术，机械的魅力所在