查看原文
其他

《面向人工智能的数据治理实践指南(DG4AI)1.0》发布

图灵财经 图灵财经
2024-09-16

点击蓝字 关注我们


报告信息


《面向人工智能的数据治理实践指南(DG4AI)1.0》

报告来源:CCSA TC601 大数据技术标准推进委员会

发布时间:2024年6月19日




《面向人工智能的数据治理实践指南(1.0)》(以下简称《指南》),由CCSA TC601大数据技术标准推进委员会编写。《指南》以数据治理为抓手,通过对面向人工智能的数据治理(DG4AI)产生背景、风险挑战进行分析,提出了面向人工智能全生命周期的治理实践方法,旨在推动DG4AI理念的广泛应用。


1

《指南》亮点

NEWS



1、概念定义及解析

《指南》从“数据治理”发展历程切入,指明当前大模型时代数据治理所遇问题,随后对“面向人工智能的数据治理”等概念进行分析定义,从不同维度明确面向人工智能的数据治理与传统的数据治理的差异。


NEWS



2、治理阶段及对象

《指南》将面向人工智能的数据治理划分为“数据收集”、“数据预处理”、“模型推理”等9个阶段,提出包括“原始多模态数据集”、“标签数据集”、“训练数据集”等4类治理对象,随后明确每个阶段对应的治理目标与方法。


NEWS



3、实践路径及方式指引

《指南》明确面向人工智能数据治理的三项主要工作,即 “数据质量”、“数据安全与隐私”和“数据伦理”,并为企业提供“治理方法”及“技术手段”的实践指导。此外,《指南》对企业在整个治理过程中应遵循的治理步骤进行了详细梳理,覆盖从“明确应用目标与需求”到“持续数据集运营与优化”的五个阶段,为企业实践提供方法论的指引。


NEWS



4、未来预测与展望

结合当前人工智能产业技术发展趋势,《指南》提出数据治理对于企业竞争力提升的重要性。未来,随着技术的快速发展与实践的进一步落地,数据治理将推动人工智能应用的高质量发展,人工智能数据产业的分工也将更加明确。



2

关键概念

人工智能:人工智能(AI,Artificial Intelligence)是一个与认知科学/心理学、哲学、语言学和数学等学科进行了知识融合的计算机科学,当前由于对于智能的定义存在困难,在学界并未有一个统一的定义,但是从商业的角度来看,AI意味着使计算机能够执行各种高级功能(包括查看、理解和翻译口语和书面语言、分析数据、提出建议等能力),达到帮助替代或超越人类的工作的能力。

数据治理:根据IBM、标准要求、数据治理协会等研究(见附录二)综合来看,数据治理主要是从组织层面对数据进行管理。其目的在于确保数据的质量安全性。可指代为企业数据价值化开展的一系列具体性工作,也可指代一系列数据管理活动的集合。

面向人工智能的数据治理(DG4AI,Data Governance for Artificial Intelligence)是指在人工智能应用中管理和控制数据的过程与实践,以确保数据的质量、可靠性、安全性与合规性,使得数据能够被准确地用于训练和部署AI模型,同时保护数据的隐私和安全。




3

DG4AI四阶段


顶层设计阶段 - 确立数据治理的总体框架和战略目标,确保数据治理与组织的整体战略相匹配。

数据治理组织保障体系搭建阶段 - 确保面向AI 的数据治理得到必要的支持和资源,包括人力、算力、算法、数据、技术和管理等支持。

数据治理工程建设阶段 - 基于数据战略目标,结合AI 数据治理的特点,制定并执行数据治理实施计划,确保数据治理能够按照既定目标和流程进行。

数据治理运营优化与AI应用融合阶段 - 提升AI 应用的规模化落地效果,实现数据治理与AI 应用的良性互动。进一步,形成数据治理与AI 应用相互促进的闭环,实现数据价值的最大化。



4

DG4AI重点工作


数据质量治理 - 推进面向人工智能的数据质量治理是保障人工智能应用高质量、准确、持续可用的重要基础。包括制定管理制度流程、明确环节责任要求、建立质量评估与监控系统等环节,以确保数据质量符合要求。

数据安全与隐私治理 - 推进面向人工智能的数据安全与隐私治理是保障人工智能被安全、可靠使用的基础。包括建立数据全生命周期安全监督机制、制定数据集安全风险分类管理体系、数据加密、风险评估、教育培训等环节,全面而有效地应对人工智能数据安全与隐私治理的复杂挑战。

数据伦理治理 - 在科技高速发展的背景下,对人工智能中伦理道德的关注程度及应对方法仍未完全跟上技术的发展步伐。应当通过制定数据伦理相关政策、提升透明度与可解释性、规范数据收集和标注、开展风险评估和缓解措施等方式加强数据伦理治理。



如何获取报告?

关注本公众号:图灵财经

点击文末“阅读全文”获取


来源:大数据技术标准推进委员会

编辑:卢思锦


精彩推荐

数据要素流通标准化白皮书(2024版)发布

工业和信息化部:工业领域数据安全能力提升实施方案(2024-2026年)

联合国:《以人为本的人工智能治理》

美国发布一项历史性综合数据隐私立法草案

中法关于人工智能和全球治理的联合说明


更多精彩内容



继续滑动看下一个
图灵财经
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存