搜索

有一种新兴职业,叫做人工智能的老师(上篇)

神译局 · 2019-09-05
人工智能不是自学成才。它们的背后,有一群辛劳付出的老师。

神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。

编者按:毋庸置疑的是,人工智能领域每天都在上演着日新月异的发展和进步。然而,在世界上许多国家(其中包括中国),都存在一种你可能不知道的新兴职业。他们负责教授人工智能系统学习,他们是一群最可爱的人,有人也称他们为数字富士康“一线工人”。这篇翻译自《纽约时报》的文章,原标题是A.I. Is Learning From Humans. Many Humans,作者Cade Metz在文章中介绍了这一行业的相关故事。这是本系列文章的上篇,主要通过一家总部位于印度的公司,介绍人工智能不是自学成长、它们背后有一群辛劳付出的“老师”的事实。

iMerit公司位于印度加尔各答的办公室。图片来源:Rebecca Conway for The New York Times

印度奥里萨邦的首府布巴内斯瓦尔,离孟加拉湾大约40英里(合约65公里)的距离。在布巴内斯瓦尔的市中心,纳米塔·普拉旦(Namita Pradhan)正坐在自己的工作台前,眼睛注视着面前屏幕中的一段视频录像。这段视频,录制于地球彼端的某个医院。

而这段视频的内容,则是某个病人结肠内部的画面。普拉旦做的工作,是通过视频去发现息肉。息肉是大肠中向肠腔突出的赘生物,它可能会引发癌症的出现,它看起来有点像似一个小脓包。

当普拉旦在视频中找到息肉过后,她会立马通过鼠标和键盘,在这个小脓包周围画一个数字“边界线”,从而将它标注出来。

普拉旦并不是医学专业出身,但她做的工作,却是在教人工智能系统的“老师”,直到人工智能系统顺利毕业并且可以完成医生的工作职责为止。

普拉旦的“教室”,位于一栋低矮建筑的四楼。在这个“教室”里,除了普拉旦,还有其他几十位在做同样工作的印度青年。而在他们正式上岗之前的培训中,他们学习了如何去标注各种数字图片的方法,并且能够精准地标注出图片上的任意内容,比如现实街景中的交通标志和行人,以及卫星地图中的工厂和油罐车等。

许多科技行业的人士可能会告诉你,人工智能必然是这个行业的未来。得益于机器学习的应用于发展,如今的人工智能也是在经历日新月异的变化。

然而,在科技领域掌握着话语权的人士,却很少提及这些快速发展背后的劳动密集型过程。实际上,人工智能它不是自学成才的,他们都是有人教的,而且教它们的人,甚至多到可以用不计其数来形容。

在人工智能系统开始学习之前,首先必须要向其输入通过人工标注而成的数据,正如前文提到的通过人工来圈定结肠息肉的例子。这项工作至关重要,无论是无人驾驶领域,监控系统领域还是自动化医疗健康领域,人工智能的发展都离不开这项工作。

基本上所有的科技公司都对这项工作避而不谈。然而,由于他们储存了大量的个人隐私信息,甚至还会和外界第三方分享这些数据信息,因此也有越来越多的关注隐私的活跃人士纷纷站了出来。

今年上半年,通过努力,我争取到了一次瞥见这个故事背后的机会。这样的难得机会,在硅谷也通常都是欲求而不得的。

从最开始的印度奥里萨邦的布巴内斯瓦尔,到最后的美国路易斯安那州的新奥尔良市,我一共实地到访过五个这样的办公室。这些办公室里,所有的工作人员都在做着无休无止的重复工作——教人工智能系统学习各种标注数据。而他们的“教学”系统,都来自于一家名叫iMerit的公司。

这些办公室里,有许多像普拉旦一样的结肠检查员。当然,其中也有负责其它“教学”任务的“老师”,比如真实街景识别员,或者语言及符号专员等。

这是不是一位行人呢?这到底是双黄线还是点状白实线呢?将来有一天,无人驾驶汽车必须要知道这些区别。

iMerit公司的员工必须掌握数据标注技能才能上岗。图片来源:Rebecca Conway for The New York Times

我在这些办公室中亲眼所见的,并没有一种看见未来的超前感觉。这些办公室所在的建筑,原本都是一些话务呼叫中心或支付处理中心。

其中一间办公室,位于印度西孟加拉邦首府加尔各答城市西端的低收入群体居民区,而办公室所在的那栋建筑,是一栋破旧的曾经用作公寓的楼房。而这栋建筑的周边,则是熙熙攘攘的行人、临街叫卖的商贩以及穿梭自如的突突车。

印度的其它城市,也有和布巴内斯瓦尔一样的办公室。此外,在中国、尼泊尔、菲律宾、美国以及非洲东部几个国家等地,也存在这些办公室。这些办公室里,坐着成千上万的“老师”。他们打卡上班,唯一的工作职责就是教人工智能系统学习。

此外,还有成千上万名远程办公的“老师”,他们在家完成“教学”工作,同样也是完成图片数据标注工作。大多数情况下,他们都是借助于亚马逊劳务众包平台Amazon Mechanical Turk(AMT)提供的服务。在AMT平台上,任何人都可以发起数字任务。无论是来自哪个国家的”老师“,都可以独自认领并完成相应工作。然而,标注数据信息这份工作的报酬并不是很高。

总部位于印度的iMerit公司,服务于科技及汽车行业的众多巨头客户。起初的时候,因为履行保密协议的原因,他们曾经婉言拒绝了公开其客户信息的请求。但最近,据iMerit公司透露,他们全球九个分公司共计约2000多名员工都在奋力为亚马逊的一项名叫SageMaker Ground Truth的在线数据标注服务而做贡献。而在这之前,他们也曾公开地透露称,微软公司也是他们的客户。

在iMerit公司,办公室墙上粘贴着员工艺术作品以及激励文字。图片来源:Rebecca Conway for The New York Times

将来有一天,但我们还不知道到底是哪一天,人工智能肯定会挖空整个人才市场。但就现在而言,它却带来了相对薪资较低的工作机会。

2018年,整个数据标注市场的规模超过了5亿美元。据市场研究机构Cognilytica预测,到2023年时,这个市场的规模将超过12亿美元。单就数据标注而言,这项工作占据了发展人工智能技术所耗费时间的80%。

那么,这项工作带有剥削性质吗?对于这个问题的答案,它取决于你所在的地区和城市,以及你所做的工作。在印度,这份工作可以让你步入中等水平的生活;在新奥尔良市,它可以算作一份足够体面的工作。而对于“个体承包商”而言,它更像是一条死胡同。

图片来源:iMerit

要胜任这份工作,还必须提前学习有关必备的技能。比如,通过视频或医学扫描影像识别某种疾病的标志,或者在针对图片某个元素勾画数字圆圈的时候保持持续稳定的手部力量等。在某些情况下,还可能会涉及医学手术视频以及色情或暴露图像等内容,而这些内容可能就会令人不适了。

“当你首次看到这些内容的时候,你会觉得非常不安。你甚至会有放弃这份工作的想法。”在亚马逊AMT平台参与数据标注工作长达数年的克莉丝蒂·米兰(Kristy Milland)表示。

“但有些人如果放弃了这份工作,可能就会失去收入来源。所以又只好默默地忍受着。”米兰补充说。

在动身前往印度之前,我试着通过某众包服务平台去标注图片。我尝试过在耐克logo周围勾画数字边界线,也尝试过识别“不适合工作场所(Not Safe for Work,简称NSFW)”的图片。我发现,我可能真的很难胜任这份工作。

在开始工作之前,我必须要通过一项测试。单单就这项测试,都差点让人崩溃,而且我连续失败了三次。整个体验过程都让人非常沮丧,我全程都需要在不同的图片中标注各种信息,以便人们可以立即上网搜索相关零售商品。此外,在这个过程中,我还耗费了大量时间去辨别图片中的裸体女性和性玩具等冒犯内容,并将他们标注为“NSFW”。

对人工智能研究人员而言,他们希望能够建立一套可以从少量数据中学习的系统。但从目前可以预见的未来来看,人力劳动仍然是不可获取的因素。

“这是一个急剧扩张的世界,一个隐藏在科技背后的世界。”供职于微软公司的人类学家、著有《幽灵工作》(Ghost Work)一书的玛丽·格雷(Mary Gray)说,“如果要将人类排除在外,则是不太现实的事情。”

译者:井岛俊一

+1
12

好文章,需要你的鼓励

参与评论
登录后才能参与讨论哦...
后参与讨论
提交评论0/1000

请回复有价值的信息,无意义的评论将很快被删除,账号将被禁止发言。

下一篇

2019年上半年,金茂在城市运营项目拓展继续发力。

2019-09-05

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

为你推送和解读最前沿、最有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚集全球最优秀的创业者,项目融资率接近97%,领跑行业