查看原文
其他

国际劳工组织:生成人工智能和工作

图灵财经
2024-09-16

点击蓝字 关注我们


报告信息


生成人工智能和工作:对工作数量和质量的潜在影响的全球分析

报告来源:国际劳工组织

发布时间:2023年8月21日


1

摘要

本研究在全球范围内分析了各种职业和任务可能面临的生成式人工智能风险,特别是生成式预训练转换器(GPT)风险,以及这种风险对工作数量和质量可能产生的影响。它使用 GPT-4 模型来估算潜在暴露的任务级评分,然后估算全球以及各国收入组别的潜在就业影响。尽管这只是对潜在风险的上限估算,但我们发现,只有文秘工作这一广泛职业对该技术的暴露程度较高,其中 24% 的文秘工作被认为暴露程度较高,另外 58% 的文秘工作被认为暴露程度中等。在其他职业类别中,高接触率任务的最大比例在 1% 到 4% 之间徘徊,中等接触率任务不超过 25%。因此,该技术最重要的影响可能是增强工作—使某一职业中的某些任务自动化,同时留出时间从事其他工作—而不是使职业完全自动化。

由于职业结构不同,潜在的就业效应,无论是增强效应还是自动化效应,在不同国家收入组别中差别很大。在低收入国家,只有 0.4%的总就业率可能受到自动化的影响,而在高收入国家,这一比例上升到 5.5%。这种影响是高度性别化的,受自动化潜在影响的女性比例是男性的两倍多。增员效应的影响更大,可能影响低收入国家 10.4% 的就业和高收入国家 13.4% 的就业。然而,这些影响并没有考虑到基础设施的限制,这将阻碍低收入国家使用自动化的可能性,并可能加大生产力差距。

这种分析可以鼓励政府和社会合作伙伴积极制定支持有序、公平和协商过渡的政策,而不是以被动的方式应对变化。此外,对工作质量可能产生的影响可能比量化影响更大,这既包括因技术而创造的新工作岗位,也包括技术融入工作场所后对工作强度和自主性的潜在影响。因此,我们还强调需要进行社会对话和监管,以支持高质量的就业。

2

方法和数据

计算职业分数通常涉及制定一个评分标准,该评分标准根据预先制定的标准定义评分方法,以捕获感兴趣的技术可能产生的影响。然后将该评分标准应用于职业或职业任务,以生成特定于任务或职业的分数。在本研究中,我们专门关注与最新 GPT 模型具有类似功能的LLMs。我们以 Eloundou 等人 (2023) 最近演示并由 Eisfeldt 等人 (2023) 复制的方法为基础,该方法依赖于使用对 GPT-4 模型的顺序 API 调用来估计任务和职业级别的自动化有关该特定技术的分数。

ISCO 职业和任务数据

当前的 ISCO-08 依赖于分层结构,反映在数字系统中,最高的 1 位数字级别涵盖 10 个不同类型的职业组,这些职业组可以进一步细分为较低级别的子组,每次都用递增的数字位数表示,最详细的 4 位数级别包含 436 种职业。

及时设计和顺序

第一步,我们使用 GPT-4 模型为每个 ISCO中的4位代码生成国际定义,并根据 ISCO-08 中使用的相同分类来标记每个工作所需的技能水平(1为低级技能,4为最高级技能)。第二步,我们将测试转移到任务级别。GPT4 的训练数据很可能包括来自 O*NET 职业及其相应任务的公开信息,以及 4 位数级别的欧洲技能、能力和职业 (ESCO) 和 ISCO 职业分类,因为模型展示了对这些不同系统细节的熟悉程度。此外,GPT-4 似乎还能够参与更复杂的交换,并在不同类型的职业分类和任务之间建立逻辑联系。因此,我们调整提示并要求 GPT-4 为436个 ISCO-08中的4位职业中的每一个生成一组 10 个典型任务,我们将其与官方 ISCO-08 任务和定义一起附加到主数据框架中。第三步,我们在各个任务级别运行另一组顺序 API 调用。我们要求 GPT-4 生成0到1之间的分数,代表 ISCO 任务集合和 GPT 生成的任务集中的每项任务使用基于 GPT 的技术的潜在自动化。我们提供该职业的 ISCO中的4位代码,指定该工作是位于高收入国家还是低收入国家,并要求模型证明其决定的合理性。

3

预测评估、稳健性测试和分析界限

我们对预测的任务级别分数持怀疑态度。然而,经过人工审查,在所有 ISCO-08 职业的 3123 项任务中,我们没有发现任何一个方向存在偏见的证据:高度自动化的任务(例如打字)始终获得高分(高于 0.7),而需要手动灵巧度始终得分较低。此外,GPT-4 对相似类别的分数差异提供了合理的书面解释。

我们对任务之间的评分一致性进行了额外的测试(模型是否根据相同的输入,在多次运行中预测不同类型任务的相似水平的分数)和任务级别的分数变异性(为同一任务预测的分数范围)跨多次运行,基于相同的输入),对从 ISCO-08 列表上的所有任务中随机选择的5个任务进行100次预测。然后,我们计算每个任务的平均分数和标准差(SD),如下表所示。不同类型任务的分数高度一致,SD 不超过0.05。这可能是因为评分中的随机因素低于人类受访者评分的情况,人类受访者通常会面临分数的不确定性(例如,0.2的分数是否比 0.15 或 0.25 更合适),并且倾向于意见的可变性较大。

作为并行稳健性测试,我们使用稍作修改的提示来生成 7,500 多个职位的职业水平分数,这些职位可以在不同的国家劳动力调查中找到,并且总计为 436 个 ISCO中的4位数职业。这些工作没有详细的任务,但将职业水平分数与根据详细任务生成的平均职业分数进行比较,显示出全面的接近性。换句话说,无论我们是依靠聚合为职业的单个任务还是依靠更大的职位名称来生成预测,GPT-4 在对自动化潜力进行评分的方式上都是一致的。

4

结果

考虑到估计指数的范围(0-1),我们认为低于 0.25 的分数代表暴露程度非常低,而介于 0.25 和 0.5 之间的分数代表低暴露程度。中等暴露的分数范围为 0.5-0.75,而分数高于 0.75 的任务被视为高度暴露。相同的截止点适用于职业级别分数,计算为属于每个职业的任务的平均分数。基于 ISCO-08 和 GPT 生成的任务的评分之间是一致的,文员支持人员的暴露程度最高,其次是技术人员和助理专业人员,最后是专业人员。

此外,大部分管理人员的类别大部分都低于 0.5 的界限,但仍然接近中等风险暴露线。服务和销售人员的结果更为复杂,一些职业超过了门槛,但大多数其他职业都低于门槛。工厂和机器操作员和装配工、初级职业、手工艺和相关行业工人以及熟练的农业、林业和渔业工人的接触机会更为有限。

我们计算每个ISCO中1位分组中具有高和中暴露度的任务的份额。其中约 24% 的任务属于高度暴露类别。如果我们还考虑到中等暴露水平的任务(占所有任务的 58%),则 82% 的文书工作任务的暴露水平高于平均水平。这与其他职业群体形成鲜明对比,在其他职业群体中,高度暴露的任务的最高比例在 1% 到 4% 之间波动,而中等暴露的任务不超过 25%。

自动化与增强:跨任务和职业的分数分布

我们将分析接触类似 GPT 的技术可能如何影响职业。我们分析了每个 4 位 ISCO-08 职业的任务分布。结果表明,对于管理者类别,大多数职业的任务级别得分分布在0.5的中等暴露线两侧,更多任务属于低级别暴露。相比之下,对于文员支持人员来说,许多职业的整个任务分布都落在中等暴露阈值 0.5 的右侧。

为了确定该技术是否在所有 ISCO-08中的4位职业中具有更大的自动化或增强潜力,我们使用了类似于 Carbonero 等人 (2023) 的方法。将职业视为不同程度接触特定技术的任务的集合,我们关注任务分数分布的两个主要参数:(i) 给定职业的平均分数,以及 (ii) 其标准差 (SD) )。平均分高、标准差低的工作属于高自动化潜力类别,因为该职业的大多数任务都具有高暴露分数。具有高增强潜力的工作则处于另一个极端,因为它们的职业水平平均分数较低,但任务分数的标准差较高。这些工作由一些难以自动化的任务和其他可以更容易自动化的任务组成。在这种情况下,技术可能会产生增强效应,带走一些暴露程度较高的任务,但仍需要人为因素来提高工作的整体绩效。

5

暴露职业占就业的比例

增强与自动化:ILO 微观数据

我们使用国际劳工组织协调微观数据集合,该集合能够提取详细的国家级就业信息。我们使用以 ISCO-08 格式报告 4 位数微观数据的 59 个国家的微观数据:8 个低收入国家 (LIC)、24 个中低收入国家 (LMIC)、19 个中高收入国家 (UMIC) 和 8 个高收入国家。我们采用每个国家/地区的最新年份,计算属于我们的自动化和增强类别的每种职业在该国家/地区总就业人数中所占的份额,并按性别进一步分类。随后,我们通过计算每个收入组内自动化和增强份额的加权平均值来构建收入组概况。

在这次比较中,有几个因素很突出。首先,与具有高自动化潜力的工作相比,具有高增强潜力的职业在每个收入组的总就业中所占的比例要大得多。在中低收入国家,此类工作在就业分布中所占比例最高,占总就业人数的 14.4%。其次,与增强相关的工作具有相当平等的性别分布,仅在中低收入国家,男性担任此类工作的比例明显较高。与此相反,具有高自动化潜力的职业在不同收入群体之间表现出显着差异,并且明显的趋势是它们在总体就业中的份额随着国家收入水平的提高而增加。在低收入国家,只有约 0.4% 的总就业属于这一类别,而在高收入国家,此类职业的比例则上升至 5.5%。此外,女性参与这些职业的比例也随着国家收入水平的提高而增长,在高收入国家,女性在总就业中所占比例是男性的两倍多。如果我们将具有高度自动化和增强潜力的工作作为每种性别总就业的比例来呈现,这种效应就会变得更加明显。此外,在所有收入群体中,女性从事高增值潜力工作的比例明显高于男性。

增强与自动化:全球估计

全球估计证实了增强类别中的工作数量明显高于具有高自动化潜力的工作数量。计算全球数据导致收入群体在增强类别中的排名发生调整,中低收入国家和高收入国家拥有高增强潜力的就业比例最大(分别为 13.5% 和 13.4%),而低收入国家的比例最低(10.4%)。这意味着,一旦在估计中考虑到各个国家的规模和就业分布方面,在全球范围内,随着当前的 GPT 技术随着收入的增长,可能面临具有类似属性的生成式人工智能自动化的工作岗位比例也会随之增长,但这一比例也会随着收入的增长而增长。很有可能产生增强效应的工作。换句话说,较富裕的国家可能会面临技术转型中更大的破坏性影响,以及这一过程中更高的净收益。

全球估计也证实了微观数据中观察到的强烈性别效应。当我们将女性和男性就业比例的估计进行分解时,我们发现全球女性就业人数中有 3.7% 从事的是可通过生成人工智能技术实现自动化的工作,而男性这一比例仅为 1.4%就业。在高收入国家,可能受影响的女性工作比例为 7.8%,是该收入群体中男性工作比例 2.9% 的两倍多。

另外,总体趋势是文书职业的比例随着收入的增长而增长,这解释了较富裕经济体中不成比例地较高的潜在自动化效应。例如,秘书、会计和簿记员、银行出纳员和出纳员等职位的国家收入与其所占就业比例之间几乎呈线性关系。这清楚地反映了过去十年的总体趋势,即许多呼叫中心和客户服务工作外包到高收入国家以外的地点。

6

解决日益扩大的数字鸿沟的政策

减轻自动化的负面影响

由于文职和辅助专业工作在职业分布中占有重要份额,高收入国家将受到自动化的最大影响,中低收入国家受到的影响较小。在保险制度欠发达、缺乏职业培训和就业安置服务或失业率较高的国家,遭受此类影响的工人更容易受到伤害。

雇主和工人之间的协商和谈判对于管理过渡过程至关重要,因为它鼓励重新部署和培训而不是失业。社会对话对于设计和实施社会保护和技能发展计划也很有用,有助于减轻自动化的负面影响。

需要特别关注的一个问题是自动化对性别的影响。女性主导职业的集中失业可能会威胁到过去几十年在提高女性劳动力市场参与度方面取得的进展。传统上,包括医疗保健和教育在内的护理经济雇用了较多女性,但这些部门也面临着投资不足的问题。满足该部门对工人的需求并提高他们的工作质量,使他们成为体面的就业来源,不仅可以为失业工人提供潜在的体面工作来源,而且还有助于满足社会对劳动力的需求。多做护理工作。要抓住这些机会,除了过渡期间的培训和收入支持外,还需要对这些行业进行更多投资。

许多微任务工作都是在数字劳动力平台上进行的,要么通过众包网站,要么通过直接雇用工人的企业处理公司。通过众包平台介导的微任务工作,按任务付费并受民事合同监管,这意味着工人没有雇佣关系带来的劳动保护或社会保障福利。

确保增强下的工作质量

技术对工作条件的影响是积极的还是消极的,在很大程度上取决于工人在技术的设计、实施和使用中的发言权。拥有这样的声音又取决于工人参与和对话的机会。这可以通过正式的环境进行,例如劳资委员会或集体谈判协议中提供的指导,也可以通过非正式的方式在员工高度参与的工作场所进行。

还需要有法律规范人工智能在职场的应用。此类法规的设计和应用最好通过三方体系来制定,其中工人、雇主和政府代表拥有平等的发言权。谈判应以现有的三方协商机制和结构为基础,以现有的劳工权利和规范为出发点。鉴于人工智能快速发展的性质及其迭代学习过程,需要在监管中建立事后评估和三方治理机制。

解决数字鸿沟

更广泛地采用生成式人工智能产品的一个潜在更重要的后果可能是高收入国家和低收入国家之间的生产力差距扩大。不久的将来,类似于 GPT 的生成式人工智能系统更有可能成为生产力工具,支持和加速某些职业中某些任务的执行。数字鸿沟将影响这些生产力工具的好处如何在社会和国家之间分配,高收入国家和特权群体可能获得最大的回报。

低收入国家尤其面临落后的风险。虽然这些国家高达 13% 的就业属于潜在增强类别,但实际上 GPT 技术的潜在好处可能有限,因为缺乏可靠的基础设施将限制其应用。另一方面,在适当的条件下,新技术浪潮可以推动增长机会。过去,技术进步刺激了许多发展中国家成功的新兴产业。

在发展中国家之间,还需要进一步区分。虽然中等收入国家更容易受到 GPT 技术的自动化影响,但它们的数字基础设施和熟练劳动力也可以成为促进互补产业增长的资产。

7

结论

我们认为在工作领域,生成式人工智能本质上既不好也不坏,其社会经济影响将在很大程度上取决于其传播的管理方式。权力平衡问题、受劳动力市场调整影响的工人的声音、尊重现有规范和权利以及充分利用国家社会保护和技能培训系统将是管理人工智能在工作场所部署的关键要素。如果没有适当的政策,则存在这样的风险:只有一些处于有利地位的国家和市场参与者才能利用转型的好处,而受影响的工人可能会付出惨重的代价。因此,对于政策制定者来说,我们的研究不应被解读为平静的声音,而应被视为利用政策来应对我们面临的技术变革的呼吁。


如何获取报告?

关注本公众号:图灵财经


来源:国际劳工组织

时间:2023年8月


精彩推荐


研究速递|机器人应用的岗位转换效应及就业敏感性群体特征—来自微观个体层面的经验证据

麦肯锡:生成式AI与美国就业的未来

麦肯锡最新调查:拥有创新文化的企业在生成式人工智能(gen AI)方面有巨大优势

世界银行:新兴技术策展系列5-生成式人工智能

2023年的人工智能:生成式人工智能的爆发之年


更多精彩内容


继续滑动看下一个
图灵财经
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存