新职业探访丨人工智能训练师离我们并不远!青岛有10万从业者,仍有大量缺口

2024-05-30 21:30 半岛都市报·半岛新闻客户端阅读 (97034) 扫描到手机

半岛全媒体记者 张昌威

AI应用的快速发展,在改变着我们生活的同时,也催生了一批新的职业,如人工智能训练师、提问工程师……尤其是人工智能训练师,现在已成为招聘市场上一个经常出现的新岗位。

在青岛科路培优教育科技有限公司,数据标注员在工作

人工智能训练师究竟如何训练AI,收入咋样,想从事新风口上的职业有什么要求?近日,记者走进专门从事人工智能训练服务的公司,为你一探究竟。

一天标注三四千个物体,细心准确是关键

位于青岛西海岸新区的青岛科路培优教育科技有限公司,是专门从事人工智能训练服务的,推开公司大门,记者看到在格子间里,三四十位工作人员在电脑前忙碌着,为智能驾驶项目标注数据。他们就是人工智能训练师,更准确地说是人工智能训练师中最常见的一种职业——数据标注员。

记者注意到,每个数据标注员的电脑上都显示着停车场场景,标注员将不同停车场场景里的锥桶、墙、柱子、路沿、灌木丛、停车位标线等一一用或实线或虚线等不同方式连成框进行标注,让机器读懂。一张图片标注完,是下一张图片,然后再下一张……反复标注的目的,就是为了让机器能够精准地识别这些物体。

“团队近期的工作是给无人驾驶的车辆做数据标注,给汽车收集道路上的数据,像把路沿、道路交通标线、停车位等标注出来。这些数据标注好后会收集到无人驾驶汽车系统里,无人驾驶汽车怎么走,都是把这些数据作为底层数据的基础上进行提升的。”数据标注组长叶紫茗告诉记者,和出行类应用软件类似,给无人驾驶汽车提供数据更新,都是长年累月的、长期的项目。“同一条道路,以后会再施工建设,我们也会重新标注。”

叶紫茗今年31岁,大专学历,大学读的是韩语专业,毕业后做过进出口贸易工作、食品企业秘书工作,2023年10月起开始从事人工智能训练师工作,具体细分来说就是数据标注员工作,“考虑到AI是新兴行业,觉得发展前景更好,就转到了这份工作。”

“数据标注员首先要理解客户对算法的要求。以标注车道线为例,要对车道线进行定义,什么是实线,什么是虚线。算法中,不同的线用不同的标注类型去连接,标注员需要理解算法的要求,也就是理解规则。通过对规则的理解,把路、车、停车位等,通过画线、画框、画点云的方式,转化成机器能识别的语言,之后再拿这些数据去训练人工智能。简单地说,就是把常规的图片,去转化成机器能理解的语言。”青岛科路培优教育科技有限公司运营总监崔琰介绍。

在青岛科路培优教育科技有限公司,数据标注员在工作

“项目最基本的要求是把线画得贴合。比如,地上一根实线,画的时候要贴着这根实线边走。”叶紫茗介绍,验收严格程度也和客户要求有关,“根据客户提供的图片,做到98%以上的贴合率,就可以了。”

“数据标注员的工作绩效,以画的框来计算。目前,公司做得最慢的同事,一天也能做2000个至2500个框,做得快的,一天可以做三四千个框。”叶紫茗介绍,项目不同,每个框体现在工资绩效里也有不同。

崔琰介绍,他们公司在青岛和日照都有运营基地,全职的数据标注员有200多人,兼职数据标注员有800多人。目前在做的项目多为智能驾驶方向,比如标注车、车道线,此外还有人员标注、动物标注、医学标注等,主要是2D、3D的标注,今年开始也会有4D标注。“基本上所有的方向都做过。医学标注方面,标注眼科手术、人体骨骼。目前,还接了国外的订单,包括语音标注,国外道路标注等。”

在记者走访的几家公司人工智能训练服务公司中,除了数据标注员外,还有内容审核员,后者数量较少。在同样位于西海岸新区的另一家提供人工智能训练服务的标注基地,有200多名人工智能训练师,其中大部分是数据标注员,少部分是内容审核员。今年23岁的小张,专科学历,学的是云计算技术与应用专业,大三下学期实习时就来到基地工作,现在是项目经理。他告诉记者,他目前负责的项目有34人,其中25人为数据标注员,8人为内容审核员。

大多月薪四五千元,招聘时不限制专业

人工智能训练师的收入如何?崔琰介绍,他们公司数据标注员的月薪,普遍能达到4000至5000元,有的员工手速快,就可以达到六七千元。叶紫茗的月平均工资在五六千元,在公司是中游水平。

标注基地的小张告诉记者,在他们团队标注岗位月薪在4000元左右,审核岗位月薪在4000元至5000元。

“公司在招聘人工智能训练师时,不限制专业,都是年轻人,学习接受能力强,项目也不难。首先会看求职者的理解力,其次是要细心。”叶紫茗说。“主要还是看员工的动手能力。年轻人手脑配合得好,学习能力快,反应快,上升空间更大。”

采访中,记者注意到,准确度是受访者多次提及的指标。在叶紫茗看来,提高标线的准确度并不难,“就把线放大到百分之四五百时,描出来边,准确度就在98%以上。”

“目前,招聘求职市场上,与数据标注员岗位专业对口的学生并不多,大学里也没有与人工智能训练师工作完全一致的专业。公司的员工,有不少学的是计算机专业。”崔琰介绍,在招聘数据标注员岗位时,对学历、专业没有要求,更看重的是员工的学习能力,以及对新鲜事物的接受能力、工作态度和认真程度,毕竟这是科研数据,它的准确度也会影响到算法的标准。

在青岛科路培优教育科技有限公司,数据标注员在工作

采访中,记者了解到,数据标注员的专业技能很快习得。“学起来还比较快,不太需要之前有经验,想找到有这样工作经验的人也不容易。主要是公司自己在培训。由组长、项目负责人去教学。”崔琰介绍。

“大量数据类似,学习能力强的,半个月至一个月,就熟练了。其实项目很简单,细心一点就行。”叶紫茗此前没有接触过数据标注工作,上手就很快。“试用培训三天,我一天就学会了,可以自己独立工作了,有师傅带,有视频资料可供学习。学习快的,培训一上午,当天下午就可以独立工作了。只是新手在没有适应时,速度慢。”叶紫茗说。

“公司员工以年轻人为主,多是90后、00后的大学毕业生。公司60%以上的员工拥有本科学历,余下的也多是大专学历。人工智能领域发展较快,每个项目都会有更新、改进,拥有大专以上学历,能保证员工对项目的理解能力,同时学习能力、应变能力也会更快。”崔琰说,组长负责团队的速度和质量,还会有质检人员查看数据质量情况,也就是内容审核。

“这两年,每个项目对质量、速度的要求越来越高了。在质检环节,也需要加强监督,让数据质量更好。公司会使用内网,保证数据安全,让客户放心。”崔琰说。

青岛市人工智能产业协会秘书长姜代楠介绍,人工智能训练师由数据标注员和人工智能算法测试员两种职业构成,是一个辅助作业工种,职业涉猎范围宽泛,门槛较低,具有中专、初中文化水平的学生就可以胜任这个工作。

青岛约有10万从业者,人员需求量仍较大

“数据标注员不是近几年才有的岗位,只是这几年迎来大发展,并有了正规的职业名称,”标贝(青岛)科技有限公司董事长刘博讲到,“随着近几年人工智能行业的快速发展,很多自动驾驶车企、大模型应用等,都需要大量数据去支撑,这样数据标注岗位就有更多缺口。”

除了图像标注,2023年从北京落户到青岛崂山的标贝(青岛)科技有限公司还提供语音、视频标注等更多类型服务。该公司在数据行业里是头部企业,“我们自研的AI数据平台,采用人机协同方式,支持文本、语音、图像、视频、点云等多种类型的采集和标注,服务领域和场景包括智能客服、智能硬件、车载设备等,未来会向工业制造、医疗健康领域进军。”刘博介绍。

2020年,人力资源和社会保障部与国家市场监督管理总局、国家统计局联合将“人工智能训练师”纳入了新职业之列。2021年,人力资源和社会保障部发布了《人工智能训练师国家职业技能标准(2021年版)》。

据姜代楠介绍,目前全球人工智能训练师从业人员预估超过500万人,主要有4个工作方向,分别是数据库、算法、人机交互、人工智能辅助作业系统。在姜代楠看来,人工智能训练师需要具备5种基础能力,分别是学习能力、计算能力、语言能力、空间感、视觉能力。

“目前,在青岛有约10万人从事人工智能训练师职业。”姜代楠说,“人工智能是一个方兴未艾的行业。我们希望更多的职业爱好者加入到人工智能训练师行业中来,在2024年开展的‘人工智能+’行动助力下,为青岛在国家人工智能创新应用先导区发展上,走出一条青岛特色之路。”

“以前会觉得AI离我们很远,其实AI就在身边。未来,无论AI发展到哪一步,都需要数据来支撑程序运转,我们在做的工作,就是给庞大的系统,做锅底下的那把柴火。”叶紫茗说,“有时候感觉挺自豪的,华为、小米等无人驾驶汽车用的数据,也是我们数据标注员给标注出来的。”