查看原文
其他

中心研究 | 关于数据伦理国内外研究评述与发展动态分析

信通院互联网法律研究中心 CAICT互联网法律研究中心 2023-01-22


全文共计约7100字,细读时间约20分钟

文| 杨婕 信通院互联网法律研究中心高级研究员

摘要:数据伦理是信息技术发展过程中出现的一个新问题,产生的根源是由于个人、企业和国家在信息技术的冲击下不断地被数字化和虚拟化,个人生活、生产和意识形态更易被渗透和重塑。随着大数据、区块链、云计算等技术的竞相发展和各类智慧样板的涌现,万物互联、万物重构、万象互算的数字化社会扑面而来。全球数据量呈现出爆发式的增长,数据的流动属性和资源属性不断增强。通过大规模地数据收集、处理和分析挖掘,可以为企业创造巨大的财富价值,但是也可能对国家安全和个人隐私造成巨大的冲击,引发规则失范的问题。[1]但是由于法律的滞后性,而伦理规制又具有一定的弹性和灵活性,数据伦理的相关研究就变成了十分重要的基础性工作。本文从数据伦理的内涵解析、产生原因以及问题表现方面进行了综述,指出大多数研究存在片面性、局部性的特点,对有关数据伦理的研究缺乏理论的沉淀和研究深度的拓展。

关键词:大数据;数据伦理;研究综述

一、问题起源

近年来,科技创新快速发展,越来越多的前沿领域闯入“无人区”,引发的伦理挑战也日益增多。2022年3月,中共中央办公厅、国务院办公厅印发《关于加强科技伦理治理的意见》,作为我国国家层面科技伦理治理的第一个指导性文件,从伦理原则、构建体制、制度顶层设计以及监管措施等方面作出系统部署,填补了我国科技伦理治理的制度空白,也引发了社会各界对于伦理问题的广泛讨论。而大数据技术一直都是推动科技发展的重要驱动力,因而数据伦理问题也可以说是科技伦理中的重要组成部分。如尼葛洛庞帝在 《数字化生存》中所言,“每一种技术或科学的馈赠都有其黑暗面。数字化生存也不例外”。[2]特别是当前,数据具有基础性战略资源和关键性生产要素的双重角色,[3]正在成为重构要素资源、改变竞争格局、重塑经济结构的关键力量。因此,结合当前的技术发展背景,对数据伦理问题的研究十分有必要,这不仅关系到如何充分释放数据要素价值、解放发展生产力,更关系到运用数据来认识和改造世界方法是否正确。


二、研究视角及进展

在问题导向的研究中,研究视角取决于所需研究问题的一般逻辑。当前数据伦理问题研究主要从内涵解析、产生原因以及问题表现等研究视角展开。

(一)数据伦理的内涵解析

数据伦理并非无源之水,主要从属于应用伦理学的范畴,而且大数据源于信息技术,其产生过程基本上是沿着遵循信息伦理到网络伦理再到数据伦理的路径。可以说,“数据伦理”一词最初来自于“信息伦理”。1988年罗伯特·豪普特曼 (R. Hauptman)首次提出“信息伦理”一词,他认为“所有对与信息生产、信息储存、信息访问和信息发布伦理问题相关的研究都统称为信息伦理。[4]我国学者吕耀怀则认为信息伦理是指“涉及信息开发、信息传播、信息的管理和利用等方面的伦理要求、伦理准则、伦理规约,以及在此基础上形成的新型的伦理关系”[5]。随着网络的普及,社会交互行为逐渐加剧,网络伦理的研究开始兴起。“网络伦理就是人们通过电子信息网络进行社会交往时而表现出来的道德关系”[6]。其可具体化为网络的开发、设计与应用中应当具备的道德意识和应当遵守的道德行为准则。网络的广泛关联性使得网络伦理的研究范畴更具社会属性。随后,随着大数据技术的发展,社会各界的研究视角开始聚焦到数据伦理。国际上第一部关于数据伦理问题的学术专著是《大数据伦理学》,作者详细讨论了大数据技术的兴起,人类将面临着伦理挑战,指出所有企业都应针对数据确立自身适用的道德规范,明确数据对自身的价值,重视数据中所涉及的身份、隐私、归属以及名誉,在技术创新与风险之间保持必要的平衡。[7]库克耶在《大数据时代》中将数据伦理界定为隐私问题、数据安全问题、虚假数据问题。[8]国内较早研究大数据伦理问题的是邱仁宗教授,他在《大数据技术的伦理问题》一文中以数字身份为核心,总结了大数据技术在创新、研发和应用中的伦理问题,探讨了与大数据技术有关的“如何保护互联网上个人的数字身份问题”、“个人隐私不被泄露的问题”、“如何确保使用者信息可及以及如何防止不当可及问题”、“如何使每个人平等获得数字资源”等伦理问题。[9]随后也有一些学者对于数据伦理问题进行概括,包括“数字身份暴露”、“被监控”、“隐私泄露”、“预测性骚扰”、“获取路径被限”、“数字鸿沟”、“数据崇拜”。[10]概言之,数据伦理是随着信息技术不断发展而产生的关于数据的善、恶议题与价值规范,可以看作为信息伦理、网络伦理的延伸,一脉相承的议题。

(二)数据伦理的产生原因

一是主观原因:个人的有限理性。人们置身于大数据环境中,可以享受大数据所带来的前所未有的“自由”,在虚拟的世界中利用自己的数字身份肆意发泄自己压抑的情绪,享受数据空间中的快感,科技巨头正是利用个人对数字平台的依赖性,将用户信息转化为实际的资本而从中获利。此外,当个人权益遭到侵犯时,往往不懂得如何保护自己的合法权益,自我隐私保护意识不足,这样的意识和行为会催生更多的数据伦理问题。

二是客观原因:数据权力的形成。大数据的发展应用使数字网络平台成为网络社会时代社会权力积聚的新场域,网络空间中的私权力正在崛起,网络服务提供者成为权力主体,这种私权力的获得在于某些私主体对于其他私主体在技术、平台和信息等方面的优势。[11]技术和数据优势共同建构了数据权力,大数据时代谁掌握了大数据与算法谁就获得了支配他人的隐性权力,然而掌控着海量数据和技术的却只有少数的资本或组织,产生了“资本利用数据推动霸权的情形”[12]。数据权力呈现了资本为了追逐利润利用大数据通过占有数据和滥用权力制造社会伦理危机的内在机理,也是数据伦理危机生成的根本动因。

三是制度原因:规约机制的滞后。法律制度、机制的滞后和不健全是产生新的伦理问题的主要原因。正如唐凯麟所指出的,目前大数据行为处于“失范”状态,“道德原则的不完善……使大数据行为处于一种无规范可依据的失范状态”[13]。王欢、李景春指出,大数据作为互联网技术发展到一定阶段的新兴产物,目前属于发展蓬勃期,之前适用于互联网技术的法律体系和伦理规范已不能完全适应大数据时代。由于大数据独特的功能和特性,法律无法解决大数据应用所产生的新的伦理问题,且又缺少相关法律对大数据伦理问题的规约。同时,法律与伦理边界模糊,暂无法明确数据出现问题后的责任方,从而引发境遇难题,并且法律制度的缺位会造成行为主体的无所忌惮,进而破坏社会公平、公正的道德规范。[14]

(三)数据伦理的问题表现

一是数据滥用侵犯用户隐私。“大数据发展的核心动力来源于人类测量、记录和分析世界的渴望”[15]。数据是记录的结果,大数据是众多记录结果的集合,这其中就必然包含对个人隐私的记录。数据存在于更多维度,数据收集方式更为隐秘、持续和智能,用户隐私内容更为多元。具体来看,随着人脸识别、虹膜识别等应用的普及,人工智能正在大规模、不间断地收集、使用敏感个人信息,个人隐私泄露风险加大。例如,变脸应用“ZAO”因用户协议过度攫取用户授权、存在数据泄漏问题而被监管机构约谈要求自查整改。杭州一动物园因启用人脸识别技术,强制收集游客敏感个人信息而被诉至法院,成为我国“人脸识别第一案”。

二是数字身份陷入伦理困境。学界关于数据伦理的议题研究中,对数字身份引发的伦理探究极少。随着接入互联网的终端数量呈几何级增长,数字身份的概念内涵亦在不断变化。Clare Sullivan对个人数字身份的产生、应用做过相应论述,她认为数字身份由一大一小两大信息集构成。小的信息集有明确的目的,是有限的信息集,决定了完成交易所必需的身份信息,被定义为“交易身份”;大的信息集提供更详细的信息,由上传信息系统的个人基本信息组成,被定义为“其他身份信息”。[16]国内,董军、程昊指出,在大数据时代,由于个人数字身份主体对身份的数据化风险感知不足以及网络言行缺乏法律和道德约束等原因,伦理问题频发。刘千仞等认为,用户在互联网活动的基础是数字身份,这之间的所有联系、交易和数据的完整性及隐私性都必须得到最佳的保护和管理。[17]葛秋萍、王珏绕认为,多样性和流变性导致数字身份认定难,个人数字身份推算危及国家安全和社会稳定。[18]

三是数据霸权催生数据垄断。Ezrachi, A.和Stucke, E. M.指出,数据的经济学性质,使其有利于市场集中和支配地位。以数据为主要驱动力的平台经济模式天生带有“垄断基因”,获得数据垄断地位的大型平台企业在市场竞争中不仅可以限制用户使用服务、侵害用户权益,而且会对其他中小型企业的发展形成挤压。翟云、蒋敏娟、王伟玲认为,企业利用“谁收集谁拥有”“谁投资谁拥有”“谁控制谁拥有”的丛林规则形成了数据垄断和“跑马圈地”格局。[19]不过,也有学者对数据垄断持否认观点。一种批评的观点是,数据本身并不稀缺,单纯依赖数据,很难形成明显的竞争优势。[20]另一种批评的观点则认为,数据是一种生产要素,这种生产要素本身具有由所有者垄断使用的特征。[21]

四是数据叠加算法支配个人。张以哲认为,在这个万物互联而又深度依靠数据进行记忆的时代,资本与大数据、算法联姻把大数据技术变成了引导、支配、控制他人的思维和行为的绝佳工具。通过对海量信息数据的深度分析可以精准地为数字化生存中的每个人进行“画像”,并基于技术手段掌握每个人的不同偏好,如果有利可图,掌握着数据和算法的私权力主体可以根据需要向目标对象推送特定信息,引导目标对象的思维和行为,形成隐形支配他人的权力。[22]“信息茧房”是凯斯·桑斯坦在《信息乌托邦》一书中提出的概念。一方面,长期困于信息茧房、屏蔽异己信息,不利于个人思想塑造和观点养成;另一方面,信息茧房容易激化矛盾、加剧社会焦虑情绪,如医患关系等问题,甚至导致群体极化。

五是数字鸿沟加剧社会不公。胡鞍钢,周绍杰指出,数字鸿沟是由于不同新兴的信息与通信技术在不同国家之间、国家内部的不同群体之间技术应用方面的不平衡而产生的不平等现象。[23]邱仁宗、黄雯、翟晓梅认为,数字鸿沟实质上是“技术鸿沟”,技术发展与使用的不平等进一步加剧了收入的不平等,导致使用群体的两极分化,也让弱势群体,特别是老年人陷入困境之中。[24]王欢、李景春认为数字鸿沟主要体现在拥有数据、分析数据和数据思维三个层面。政府出于社会稳定性考量并不会选择完全的信息公开;企业则为了实现数据资产的积累将数据视为商业秘密;个人作为普通用户,即便数字平台公布了相关算法政策,也很难读懂并进一步了解算法的底层运算规则。[25]

六是数据作假引发信任危机。真假问题是一个影响深远的伦理议题,数据的价值根源于其表意的真实性。对于数据作假的研宄,目前学界的界说较少。数据得以产生和连接的背后是人们彼此间的信任,没有信任机制,数据流不会产生,连接也不会建立。信任机制是社会网络得以构成的基础,没有彼此间的信任,就不会有沟通、协作、交换等社会行为的持续。数据作假将会逐渐摧毁这一基础,使数据背后流动的信任基因消失。此外,数据作假还会对人们固有的常识进行干扰和误导,使人们不仅不能以数据作为依据来做出判断及预测未来,甚至连基于数据认识世界都无法做到。


三、研究评述

通过大数据伦理问题相关文献资料的梳理可发现,学界已有的大多数研究存在分散性、局部性的特点,对有关数据伦理的研究缺乏理论的沉淀和研究深度的拓展。

(一)尚未从实践角度对数据伦理的发展脉络进行梳理

正如上文所言,数据伦理的发展是脉络化的,并非无水之源。20世纪70年代,计算机的出现,带来了新的技术问题,为了应对这些问题,学者们展开了信息伦理的相关研究,其核心是为了促使对计算机技术在道德范围内的正确使用。20世纪90年代,互联网的出现带来了新的网络问题,为了正确地使用互联网,学者们将与之相符的道德标准称之为网络伦理,网络伦理顾名思义就是人们对于在互联网网络中所出现的伦理问题所共同遵循的道德观念及准则。在大数据发展的今天,数据伦理进入人们的视野。从本质上来讲,数据伦理是建立在计算机伦理、网络伦理和信息伦理的基础上的。数据伦理是大数据时代出现的一种新型伦理关系,绝非对传统伦理的否定,而是对传统伦理的继承和拓展,具有一般道德的性质和功能。可以说,由信息伦理到数据伦理有其发展的继承性,他们之间有很大的相似之处,也有一些不同。但是,当前学界缺乏通过发展脉络的视角去审视数据伦理问题,没有关注新技术背景下数据伦理议题的嬗变,导致无法体现技术发展变化带来的伦理新需求。

(二)数据伦理研究集中于问题形式的浅层分析

当前学界对数据伦理的研究集中于隐私保护、算法不正义等方面,对数据伦理观念体系的建构、数据伦理的学理内涵及通识性表达、数据伦理的规范体系及实践路径等问题的探讨较少。传统的伦理结构核心在于协调人与人、人与社会之间的关系,大数据时代给伦理学带来新的命题“人机关系”,因此相关研究还需要完善数据伦理结构,实现科技与人文的统一,根本上就是要注重技术伦理与行政伦理并重的格局。特别是,需要加强对于数据伦理机制建设的研究,提供机制保障。伦理规则仅仅靠自主地去遵守是远远不够的,应该将伦理原则上升到机制层面,通过良好的机制建设,解决数据伦理问题。

(三)数据伦理问题缺乏从价值维度构建技术与伦理的纽带

当前,学界对于数据伦理问题的研究,缺乏从伦理价值角度进行探讨,没有构建起技术问题与伦理价值之间的纽带因此,需要进一步分析数据技术会对哪些伦理价值产生影响:第一平等。平等是人文主义倡导的三大理念之一,也是现当代最为重要的人类价值观和伦理要求。因此,数据技术的发展应遵循平等原则,将大数据公正实践化。数据鸿沟和数据霸权是大数据应用引发的平等问题的典型代表,数据本身具有中立性,但数据鸿沟和数据霸权的存在使数据成为具有偏向性的、意识形态性的工具,社会中的弱势群体、博弈中的弱势国家等不同主体难以平等地接入、使用、享用大数据。第二,自由。自由亦是人文主义倡导的三大理念之一。对于自由的含义,维纳指出:“每个人的自由即是在自由中去发展他身上的最大程度的可能性”。而由于大型公司的市场垄断与自律机制的缺乏,公众通常会自愿选择放弃部分数据控制权以换取更好的服务。因此,在此种受制于人的情况下,个人不再是自由的行动者,而是处在一种限制之中,这种限制不能为个人所左右,由此个人不能自主地决定做或不做某事。第三,诚信。诚信是人类社会建构的基础。人们彼此间的沟通、合作乃至更深入的社会建构活动的进行都是建立在诚信的基础上。大数据应用过程中的数据作假是典型的违反诚信的伦理问题,诚信原则的缺失正在逐步消解公众对互联网行业与政府数据处理活动的信任。


四、研究总结与展望

数据这一新兴生产要素正在改变全球经济发展模式和重塑企业商业模式,数据已经深入到生活的方方面面,与此相伴的伦理风险问题也更为凸显。因此对于数据伦理问题的研究需要逐渐走进深水区,深入分析数据带来的伦理风险并探讨问题产生的根源,有助于我们对大数据技术形成理性认知—不盲目乐观也不消极悲观。一般来说,制度伦理包含两个理论维度,即“为制度本身的正当性、合法性提供伦理支援或道德辩护,为社会公民实现个体权利和自由提供公正的制度安排、制度调整和制度保护”。下一步,可以尝试建立一套伦理规范来指导大数据的应用和实践,有效化解伦理冲突并走出伦理困境,发挥规范各主体行为、平衡多方主体利益关系、传承以人为本伦理理念的效果,以实现大数据生态系统的良性发展。



[1] 付伟,于长钺:《数据权属国内外研究述评与发展动态分析》,载《现代情报》2017年第7期,第159-165页.

[2] 尼葛洛庞帝: 《数字化生存》,胡泳、范海燕译,电子工业出版社2017 年版,第229页.

[3] 2015年8月印发的《促进大数据发展行动纲要》(国发[2015]50号)明确提出‚数据已成为国家基础性战略资源。2020年4月,中共中央、国务院发布《关于构建更加完善的要素市场化配置体制机制的意见》将“数据”与土地、劳动力、资本、技术并列,作为新的生产要素,并提出“加快培育数据要素市场”.

[4] 杨晶晶,谷立红,田红:《信息伦理研究概述》,载《电子政务》2011年第7期,第61-67页.

[5] 吕耀怀:《数字化生存的道德空间—信息伦理学的理论与实践》[M].北京:中国人民大学出版社,2018:2.

[6] 严耕,陆俊,孙伟平:《网络伦理》[M].北京:北京出版社,1998.

[7] K Davis, Doug Patterson, Ethics of Big Data, O'Reilly Media,2012(9).

[8] [英]库克耶著.大数据时代[M].盛杨燕,译.浙江人民出版社,2013:194- 215.

[9] 邱仁宗:大数据技术的伦理问题[J].科学与社会,2014(1):36.

[10] 袁雪:大数据技术的伦理“七宗罪”[J].科技传播.2016(4):89- 90.

[11] 周辉:《技术、平台与信息: 网络空间中私权力的崛起》,载《网络信息法学研究》2017年第2期,第68—99页.

[12] 陈鹏:《算法的权力: 应用与规制》,第55页.

[13] 唐凯麟、李诗悦:《大数据隐私伦理问题研究》,载《伦理学研究》2016年第6期.

[14] 王欢,李景春.大数据时代“楚门效应”的伦理困境与治理方略[J].观察与思考,2021(11):81-88.

[15] [英]维克托·迈尔-舍恩伯格,肯尼斯·库克耶.大数据时代[M].盛杨燕,周涛译.浙江人民出版社,2013.

[16] Sullivan C.Digital Identity. Privacy and the Right to Identity in the United States of America.Computer Law & Security Review,2013,29(5),pp.348-358.

[17] 刘千仞、薛淼、任梦璇、王光全: 《基于区块链的数字身份应用与研究》,《邮电设计技术》2019年第4期.

[18] 葛秋萍,王珏.大数据技术应用中个人数字身份的伦理规制[J].中州学刊,2020(10):95-101.

[19] 翟云,蒋敏娟,王伟玲:中国数字化转型的理论阐释与运行机制[J].电子政务,2021(06):67-84.

[20] Lambrecht, A. and Tucker, C., The Negative Effect of Tensile Promotions in Digital Marketing Communications , Social Science Electronic Publishing, 2016.

[21] 曲创:《数据垄断的伪命题和真问题》,《科技日报》,2019年8月21日,第8版.

[22]  张以哲.经济权力:大数据伦理危机的社会关系根源[J].华侨大学学报(哲学社会科学版),2021(02):5-15..

[23] 胡鞍钢,周绍杰:《新的全球贫富差距:日益扩大的“数字鸿沟”》[J].中国社会科学,2002(3):34 ~ 48.

[24] 邱仁宗,黄雯,翟晓梅:《大数据技术的伦理问题》,《科学与社会》,2014 年第 4 期。

[25] 王欢,李景春:大数据时代“楚门效应”的伦理困境与治理方略[J].观察与思考,2021(11):81-88.

END

往期精彩回顾



(滑动浏览)
域外观察 | 为什么2022年只是人工智能规制的开始?
中心研究|元宇宙中的潜在法律问题研究中心研究 | 美国私营部门隐私保护成文法框架概述中心研究 | 欧洲议会表决通过《数字服务法》草案修正案,九大变化强化平台监管治理拜登政府执政一周年观察(一):美国数字经济领域反托拉斯工作要点分析及趋势判断中心研究 | 简评美国伊利诺伊州Cothron诉White Castle指纹识别信息侵权案
中心会议 | 算法治理研讨会暨《算法治理蓝皮书》发布会在北京顺利召开(后附蓝皮书原文与解读)新书推荐 |《个人信息保护立法研究》
年度观察 | 2021年网络法治盘点与回顾(一):平台治理篇
年度观察 | 2021年网络法治盘点与回顾(二):个人信息保护篇
域外观察 | 韩国率先发布全球首部《数据基本法》,大力发展数据产业

域外观察 | 韩国迎来《个人信息保护法》颁布以来的首次全面修订

域外观察 | 聚焦四大问题,日本更新《个人信息保护法》指南问答中心会议| 第六届“网络法治三十人论坛”成功举办中心解读|《个人信息保护法》正式出台——中国走出第三条路(后附历次审议稿修改对照表)中心解读 | 《个人信息保护法》以闭环管理机制,规制个人信息泄露问题
中心解读|《个人信息保护法》与GDPR的个人信息权利对比
中心研究|十问十答看懂我国个人信息去标识化规则中心研究 | 透视“数字守门人”制度:对大型平台的事前监管机制
中心研究|美国打压我国科技公司的政策工具梳理
中心研究|关于APP与关联方共享个人信息问题研究
中心会议|《个人信息保护法(草案二次审议稿)》研讨会顺利召开中心研究|商务部《阻断办法》解读与“国际阻断立法”比较研究
中心研究|数据治理 |数据价值演变下的个人信息保护:反思与重构
域外观察|数字市场秩序 | 欧盟公布《数字服务法案》和《数字市场法案》,单一数字市场促进举措大力推进
中心研究|数据跨境流动 |RCEP迈出全球数据跨境流动规则体系构建重要一步
中心研究|未成年网络保护 | 《未成年人保护法》修订:十大制度亮点推动未成年人网络保护进入新阶段
域外观察|欧洲议会发表了《欧洲数字主权》报告
中心研究|关于美国实体清单制裁事件有关情况的梳理
全文翻译|新加坡发布《个人数据保护法(修订)》草案
全球跨境数据流动国际规则及立法趋势观察和思考
域外观察│美国制裁华为相关法律问题梳理中心研究│个人信息保护中的“用户同意”规则:问题与解决

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存