最近,人工智能ChatGPT卷入了“血汗工厂”风波,被指利用非洲、东南亚等大量廉价劳动力去训练他们的人工智能程序。
这时,可能就有奇怪了,人工智能不是高科技吗?是由电脑控制的,怎么还和血汗工厂扯上关系了?
其实,人工智能在刚开始的时候一点都不智能,甚至就是智障。它所表现出的智能,全都是大量廉价劳动力在背后训练出来的,妥妥的劳动密集型行业。
而训练人工智能的这个职位,有个高大上的名词,叫“人工智能训练师”或者叫“数据标注师”之类的。
其工作内容也极其简单机械,就是在电脑出现一张图片或者一段文字的时候,标注或者告诉“电脑”这张图片或者这段文字是什么。
比如,以下哪张图片是猫,哪张是狗?
我们人类一眼就能分辨出,哪张是猫,哪张是狗!但人工智能不行,在人工智能看来,这些图片都只是不同的像素组合而已。
这时候,就需要一个真人在电脑前面去点击图片,告诉人工智能哪张是猫,哪张是狗。人工智能就会用程序标记出该图片的特征,并记住有这种特征的是猫,有那种特征的是狗。
但是,只标记一两张图片,人工智能以后就都能认出这是猫那是狗吗?并不能!猫狗的长相千千万,下次换个其他品种的猫,甚至毛色稍微不一样,人工智能可能就又不认识了。
怎么办呢?没其他太好的办法,也就只能继续让真实的人类去标注。
于是,最终可能需要标注几百万上千万张猫和狗的图片,才能让人工智能积累足够的信息,认识到有这种特征的是猫,那种特征的是狗。
同样,除了图像标记,语言标记也是训练人工智能的重要途径。当你告诉人工智能一句话的时候,是需要背后无数的语义标记师机械地标记出这句话具体的指的是什么,相似地两句话,会有哪些不同。慢慢地,人工智能才能正确认识到一句话的正确含义,该给出怎样的回答,等等。只不过,语义训练比图片训练好的一点是,现实的互联网中,有大量的文字和语音素材可以喂给人工智能,让人工智能自己去训练,而标记师大量的工作都是在纠错。
于是,通过千千万的标记师的人工劳动,“人工智障”就慢慢变成“人工智能”了。人工智能训练之所以很贵,就贵在这一点了,因为需要大量的钱付给真人去标记训练。据说单次训练的费用就高达几百万。目前,ChatGPT—3模型,被通过这种方法喂进去的数据参数量高达1750亿,而且每时每刻还在几何级地增长。
而人工智能ChatGPT,之所以会卷入“血汗工厂”风波,是因为这些标记师的薪水非常之低。比如人工标注一张图片或一句话可能就一两分钱,每天要完成成千上万张图片或者语言的标记,才能完成工作任务。
美国《时代周刊》爆出,为了训练ChatGPT,OpenAI雇佣了时薪不到2美元的肯尼亚外包劳工,最低时薪甚至仅1.32美元,折合月薪仅不到200美元。且工作量非常大,被要求每天至少工作9小时,至多标注数万个单词,有员工遭受持久心理创伤。
说到这里未免有点心酸,大量的廉价劳动力训练了人工智能,而人工智能一旦训练完成净化完毕,最受冲击的也正是这些廉价劳动力。也就是说,他们忍受极低的薪水所创造出来的东西,未来会取代他们自己,未免有点悲哀~
其实,我们国内也有大量的人工标注师职位需求,大量的从业人员都是学生或者兼职人员。偶尔做个兼职赚点零用钱还行,但这行业不能当作主业,做久了会让人感觉失去人生的意义。
而且,真想做这工作的话,首先要注意防骗。有些专门就是以数据采集为由骗你资料的,有些甚至让你交押金目的就是想骗你钱的,数据标注单价越高猫腻越大,人脸识别类的数据也不要做,等等。所以,想找这类兼职的朋友要小心。
注:文章及图片转载自网络,如有侵权请联系删除