人工智能算法训练视域下劳动者数据权益保护

　　□ 王倩（上海政法学院教授）

　　随着生成式人工智能、AI智能体等科技飞速发展，相关应用已经深度嵌入劳动用工全过程。近日有报道称，有用人单位大量收集员工的履职数据用于训练优化本地化部署的人工智能工具，甚至直接用离职员工的信息、邮件等提炼出方便AI智能体调用的技能模块。如何在现行法框架下判断此类行为的合法性，又怎样着眼制度完善在技术创新和权益保障之间找到平衡点，是促进人工智能领域立法与加强劳动者权益保障必须回答的课题。
数据利用失序导致的劳资利益失衡
　　随着劳动用工场景智能化加速，用人单位采集、利用劳动者数据日趋常态化。实践中，部分用人单位为训练兼具行业深度和单位特性的专属人工智能工具，构建难以被竞争对手复制的“数据护城河”，将项目资料、会议记录、技术文档、操作日志等内部数据“喂养”给本地化部署的人工智能工具，其中包含大量劳动者数据。AI智能体普及后，有用人单位打着“记录工作流程、进行知识管理”的旗号，提炼员工的工作经验、决策思路、沟通话术等，从而形成标准化、可复用的技能模块，达到将员工头脑中的隐性经验显性化、数字化的目的。此举给用人单位带来丰厚收益：一是实现知识技能的留存，避免关键经验随人员流失；二是推动生产效率提升，实现标准化高效作业；三是降低对个体劳动者的依赖，减少人力和管理成本；四是形成专属数字资产与竞争壁垒，实现稳定运营与决策优化。
　　然而，在此过程中劳资双方的利益失衡表现得尤为突出。首先，劳动者对数据如何被处理往往不知情，用人单位大多通过劳动合同中的概括性条款获取授权，抑或以“履行劳动合同所必需”“实施人力资源管理所必需”作为数据处理行为的合法性基础，劳动者很难约束用人单位行为，只能被动接受。其次，劳动者的工作经验技能被不断抽取提炼，转化为用人单位可以独立支配的数据资源，劳动者却未因此获得任何补偿或收益。因为劳动报酬是劳动给付本身的对价，而经济补偿金是劳动者非自愿失业的过渡保障，都与其数据贡献无关。最后，数据资源不会因劳动者离职而失效，而是可以长期重复使用、持续产生效益，甚至部分用人单位的目的是最终实现“AI换人”，导致劳动者越努力工作，越可能加速自己被取代的进程，加剧了出现大规模失业的风险。
　　现行法框架下用人单位行为的合法性审视
　　在现行法律体系下，用人单位对劳动者数据的处理行为需要接受双重视角的审视。
　　从个人信息保护法的角度来看，处理个人信息应当遵循合法、正当、必要和诚信原则，劳动关系中个人信息处理的合法性基础主要包括取得个人同意、为订立履行劳动合同所必需、为实施人力资源管理所必需。劳动合同的履行以提供劳动给付与支付劳动报酬为核心内容，并不要求劳动者将自身技能经验无偿转化为用人单位数据资产，用人单位采集劳动者履职数据用于算法训练或技能提炼，已超出“履行劳动合同所必需”的合理范畴。该类行为难以落入“人力资源管理所必需”的范围，人力资源管理通常限于招聘、薪酬、绩效、考勤等常规事项，以营利和资产增值为目的的算法训练与数据挖掘，已偏离了正常人力资源管理的目的。在缺乏合法豁免事由的前提下，用人单位必须获得劳动者的同意，若信息涉及生物识别信息、行为轨迹等敏感个人信息，还需满足单独同意等更严格条件，然而现实中概括授权、捆绑同意、默认同意等方式均不符合“充分知情、明确同意”的要求，在资强劳弱和从属性的背景下劳动者的同意往往并非自愿。
　　从劳动法的角度来看，劳动关系具有强烈的人身属性和信赖属性，用人单位对劳动者负有保护、照顾等附随义务，用人单位过度采集、不当利用劳动者数据，既可能违背诚信原则，侵犯人格尊严，也会削弱其职业竞争力，威胁就业安全。更重要的是，劳动者数据已成为创造价值的关键生产要素，劳动者在工作中通过智力与体力劳动产生的交互数据和决策思路等，构成了其劳动的增值性副产品，用人单位利用高精度的劳动者数据来训练算法、提炼技能，最终将数据势能转化为资本增值与经营利润。然而，传统的薪酬体系只覆盖了劳动者的体力与脑力付出，尚未将劳动者作为数据贡献者的价值纳入分配考量。用人单位无偿占有劳动者数据所产生的“剩余价值”，虽不违反现行规定，却是对按劳分配原则与公平对价原则的背离。上升到社会治理层面，劳动者数据的滥用将加剧劳资权力鸿沟、动摇和谐劳动关系根基，数据要素收益分配的严重失衡也会背离共同富裕的发展目标，“AI换人”可能导致大规模失业、冲击社会稳定。
　　用人单位无法通过职务作品的相关规定合法化技能“蒸馏”的行为，因为大多数经验、技能、思路等无法构成著作权法上的“作品”，而且即使相关素材构成职务作品，对其进行转化性加工、提取隐藏技能也超出了对作品的正常使用范畴。
劳动者数据权益保障的相关机制构建
　　针对用人单位利用劳动者数据训练算法及提炼技能模块的行为，不宜因噎废食、直接禁止数据利用，而应秉持“人格权益优先、财产权益匹配”的原则构建一套双重规制体系。
　　一方面，筑牢以劳动者“充分知情+单独同意”为核心的前置防线。首先，严禁在劳动合同中设置“一揽子”的概括授权条款，用人单位必须与劳动者签署单独的书面协议，就劳动者数据的采集范围、处理目的、存储期限、潜在风险以及收益分享等事项进行告知说明，并获得劳动者明确、具体的同意。其次，同意后应根据数据处理阶段分层设置劳动者对数据的控制权限：训练前，劳动者可撤回同意并要求删除、复制原始数据；训练中，可要求停止后续训练并移除数据，但已形成的模型参数不得删除或回滚；训练后，已匿名化的模型参数不再适用删除权等规定。最后，应严格禁止将同意数据使用作为建立或维持劳动关系的前提，明确规定，用人单位不得因劳动者拒绝不合理的数据采集要求，对其作出不予录用、暂缓晋升、降薪调待、解除或终止劳动合同等惩戒行为。
　　另一方面，针对劳动者数据贡献与收益分配失衡的痛点，应构建分层分类的贡献量化标准与权益补偿机制。在可明确归因的场景下，如劳动者提供了有价值的核心业务方法或操作流程经验并被提炼为技能模块的，可直接以成果归属为依据确定个人贡献权重，实行“一次性奖励+持续性分红”的复合补偿模式：一次性奖励在技能模块上线时发放，金额可参照该技能创造的市场价值评估；持续性分红则按用人单位因使用该技能所获经济效益的一定比例定期支付。在难以精确归因的场景下，如海量劳动者数据共同参与大模型的训练或优化，则应采用“类型化推定+集体协商”的路径：一是依据不同岗位对数据的依赖程度划分贡献等级并设定法定最低补偿标准；二是建立群体数据补偿基金制度，用人单位按照算法优化或技能模块产生的经济效益的一定比例计提专项基金，通过集体协商确定基金在同类岗位劳动者内部的公平分配规则，从而有效破解群体数据贡献难以量化拆分的操作痛点。为保障劳动者数据权益的连续性，需明确劳动者应获得的持续性分红权益不受劳动关系解除或终止的影响。
　　人工智能技术的突飞猛进既是对生产效能的革命性重塑，也是对既有权益分配格局的深刻冲击，用人单位利用劳动者数据训练算法、提炼技能，是数据要素参与分配的崭新课题。将来立法者应通过明确的权利边界与完善的补偿机制，确保劳动者在贡献数据价值过程中的人格尊严与财产回报，从而实现保障用人单位创新发展与劳动者合法权益的双赢局面，使人工智能技术真正服务于社会进步与民生福祉。