标注员:AI狂飙下的“电子民工”

枯燥、无聊,是数据标注员高频提及的感受。

坐在容纳十几人的机房里,一日日重复已有“肌肉记忆”的机械标注动作,在石家庄干了三个月3D数据标注的小九很自然地联想到了富士康——当初为了逃避成为进厂拧螺丝的“厂妹”才选择进入诱人光鲜的人工智能行业,如今看来,作为AI发展“燃料”的小九们,仍在既定轨道上一头撞进“富士康”式的生活。

“不停点鼠标,我和AI谁更像机器人”

“拉一个框,你熟练的话,大概也就1-2秒。”小九介绍道,“3D的框比2D复杂,得使劲盯着电脑,框不能歪。每天都有固定任务量,不达标得扣钱,累计下来一个月至少得拉26000个框。”

3D数据标注界面 图源网络

小九口中的“拉框”,是数据标注工作最基础的形态,即在包含了众多内容的图像上通过拉出规整的方状框选定物体,并从自动弹出的弹窗中选定其标签名称便大功告。而后这些标签将用于AI识别与学习,并进一步服务于智能零售、物联网、交通等领域。

这一以“打标签”为核心技能的职位谈不上“有门槛”。据人社部发布的《人工智能训练师国家职业技能标准(2021年版)》显示,只要会使用电脑及常用办公软件,即可胜任标注员工作。

从早到晚对着闪烁的电脑屏幕重复数百次拉框动作,小九有时也会恍惚,“坐在这不停点鼠标,真分不清我和AI谁更像个机器人。”她感到心神疲累时也需强打精神,否则提交的数据在审核员处被打回,则意味着更为麻烦的返工。

返工,被标注员们视为“噩梦”。“有一次同事提交的题被打回来,40多帧全是红点,没有一个好的,全是错的,他整个人就一下垮下来了,脸色很难看。”修改错误标注的同时,当日的常规任务量也必须完成,这意味着必然挤占标注员的休息时间,尽管小九已经是每周单休。她自嘲说,“我们都叫自己电子民工或者赛博小工。”

与此强度的工作不太相衬的是标注员的收入。小九称,她每月底薪为3000元,没有五险一金,超出26000框的工作量才会按30%的比例算奖金,“天花板”工资也仅为3500元。据石家庄市统计局公开数据,2022年私营单位平均工资折合每月4145元,标注员的收入在这一统计前显出窘迫。

小九所在的公司为十几人的小团队,今年9月份仓促成立,老板与员工都是“00后”,学历以大专为主。用时2个月完成一个项目后,老板便通知小九暂时休息,团队进入“半解散”状态,等待下一个项目的来临。项目制的模式灵活敏捷,却是以员工的高流动率为代价,“等活儿来很没安全感,随时可能揭不开锅就原地解散了”,小九解释道。

这类为光鲜的人工智能行业提供基础、海量、流水线劳动并且隐匿在公众目光背面的新型职业,也被人类学家玛丽·L·格雷称为“幽灵劳动”。相较于日常被投以关注目光、在城市中醒目穿梭的外卖员、网约车司机等职业,镜头鲜有对焦的小九们的确更像机房里的“幽灵”。

步入2.0版本,更需要创造力

今年11月30日,ChatGPT问世才满周年,但它已使国内互联网行业打响了一场颇为紧张的“军备竞赛”。各大互联网巨头和独角兽企业纷纷下场布局大模型产业。

聊天机器人ChatGPT主导的大模型训练方向,使得标注员也步入2.0版本,工作从围绕图像、语音、视频的打标签,进阶为更复杂的文本标注,即通过对创作性劳动使得AI能理解与使用对话中的逻辑与情感,训练AI迈向更高维的“强人工智能”阶段。

这一发展趋势传导到用工市场,面向大模型的标注工作以“AI训练师”“大模型训练师”等新名头在招聘网站上出现。数据标注行业也从以学历较低的年轻人、“宝妈”群体及乡村女性等为主力的劳动密集型产业,逐渐过渡至多领域高学历人才为主体。

招聘软件上AI数据标注岗位大热

据第三方招聘公司透露,以文心一言为首的大模型项目日前又释放出一批招聘需求,一般以“外包”形式入职,即与第三方公司签订劳务派遣性质的合同。“中文、新闻学、心理学这些专业背景的人才和我们需求比较契合,而且最低也需要是统招一本学历,985、211的学生也不在少数。”招聘方介绍,“之后也会有转正机会,转到运营之类的正式岗位,但不能承诺一个确定的概率。”

AI数据标注职位要求及薪酬

过去对非正式职位不屑一顾的高学历求职者,在年入16万许的高薪引力下,也情愿“放下身段”进入外包岗位。曼曼过去曾是一名新媒体编辑,专职文字表达的她,离职后选择尝试从未听说的“AI角色标注师”一职,并入职了一家服务于国内头部大厂的外包公司。

曼曼认为,相较于用标签搭建起AI基础世界观的“老师”一角,训练师的工作更需要创造力和分析力,“我的工作是为游戏人物编写对话,这个编写需要在人物框架内进行,语气、措辞都需要符合他的性格和特定情境,所以这份工作要求你有很强的想象力和文字功底。”

在头部互联网公司投身于大模型保密开发的露比,也认为她所合作的下游标注师并非“民工”式的工种,“我们的标注有很多'作为人的输出',人和模型会比较谁写的语料更好,从这角度看标注师更像AI的陪练。”露比补充说,“我们内部都叫同学,也不刻意区分正职和外包。”

曼曼并不希望自己的工作被归入传统的数据标注行业,这让她对朋友解释时会稍感尴尬——过去满天飞的标注广告中,“无门槛、在家兼职可做、月入过万”等宣传让公众对这一职业感到好奇又不信任。已经在迭代中的数据标注从业者,渴望得到“正名”。

岗位大热但前景并不明朗

三月份,360创始人周鸿祎在展出首次亮相的360大语言模型产品后,强调无需担忧因AI而引发的失业潮,AI将催生大量新机会,AI训练师就是不错的选项。

与之呼应,量子位智库发布的《中国 AIGC 数据标注产业全景报告》中指出,进入大模型时代,数据标注行业将重新洗牌,人才高学历多领域成硬指标,缺口或达百万。综合来看,业内对这一岗位的需求走高,预期乐观。

然而,真正投身于此的员工却难以全然乐观,仍显出顾虑。标注工作没做多久,曼曼便选择“下车”,跳槽回了老本行,继续做新媒体编辑。对于这段AI角色标注师的经历,她说:“我不会写进简历。职业前景整体来说还不明朗,进机房得上交手机,工作环境缺少互动,创作也只能优先服从特定框架,比较难长期做下去吧。”

招聘方对于晋升路径也模棱两可,“现在大模型还是摸着石头过河”,没人能为这一岗位未来的生命周期作出承诺。但露比不认为服务于AI的标注工作仅是昙花一现,“AI训练师不会是过渡性职业,大模型的基础能力提升还有很长的路要走,模型还一直在迭代,人机合作会是长期的历史过程。”

也有人把数据标注当做进入AI行业的跳板,“先把风口行业的大腿抱紧”,Cula调侃说。环境工程专业出身的Cula尝试过多种职业,他对数据标注的工作鲜有抱怨,反而觉得无需过多与人协作的模式让自己“很少苦恼人际关系,不怎么内耗了”。

并且,在做文本分析时偶然接触Python技术,让他来了兴趣,“我现在下班时间再找计算机博士的朋友一对一教我学Python。在工作过程中不断发现自己感兴趣的东西并且去深入一下,也许有天这些技能就能帮我在AI生态里占个位置。”

无论如何,悲观与乐观派都承认的共识是:变化在加速发生,大模型的潮水滚滚向前;而人,终需在变动里找到自己能够牢牢占据的位置。

来源:大众新闻客户端

展开阅读全文

页面更新:2024-05-27

标签:人工智能   狂飙   外包   民工   模型   岗位   标签   职业   数据   行业   工作   电子   公司

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top