近日,“世界可穿戴设备之父”、美国麻省理工大学教授阿莱克斯·彭特兰教授及团队受首都科技发展战略研究院邀请访华,在北京、成都两地开展多场学术交流活动,并发布译著《信任与数据——身份与数据共享的创新框架》。首都科技发展战略研究院对他进行了独家深度专访,主题为:“可穿戴设备之父”眼中的“个人数据”新资产。
阿莱克斯·彭特兰
教授
在您的新书译著《信任与数据——身份与数据共享的创新框架》中提到,“个人数据”是社会经济发展的未来机遇,请问该如何理解?
如今的数字化社会所产生的数据量与日俱增。据估计,到2020年,全球数字型数据量将增长40多倍。这些规模庞大的数据正在成为一种与资本和劳动力旗鼓相当的新型“原材料”。随着数据革命时代的开启,数据对商业、科学、政府、娱乐等各个方面将产生深远的影响。
对于政府而言,个人数据可被用于公共事业发展,很多国家政府推出电子政务措施,可提高公共机构之间、政府与公民之间的沟通效率和效果。我们的一项研究通过收集手机通话次数、汽车通勤、移动支付等动态连接数据,来分析人的行为偏好,可更精准地预测城市犯罪率、婴儿死亡率、GDP增长率等。例如,分析美国一个城市区域与其他区域间的连接度,可提前三年预测出该区域的GDP增长率。再如,去年我们在北京开展“城市智慧创新国际联合项目”,分析北京城区的大数据发现,若将北京金融区和IT核心区通过交通直达的方式连接起来,那么它们GDP会增加三分之一。
对于企业而言,google、facebook和twitter等一些大型互联网公司的发展史已十分清楚地证明了个人数据收集、汇总、分析和货币化的重要性。这些企业的快速发展就是建立在个人数据经济的基础上。
但是,更为重要的是,理解个人如何创建、分享和使用个人数据。全球用户平均每天发送大约470亿封(非垃圾邮件)电子邮件,在推特上提交9,500万篇“推文”。平均每月在脸书上共享约300亿篇内容。这种“授权个体”(empowered individual)的影响,才刚刚被人们注意到。
为什么说“个人数据”是一种新出现的资产类别?
个人数据被誉为“互联网的新石油和数字世界的新货币”,是后工业社会的发展机遇。它不仅隐含商业价值,也在社会问题研究、政府规划决策等方面拥有潜在巨大的多重价值。数据即是财富,因此需用一种新的思维方式看待个人数据。这些个人数据将被记录在如同银行账户一样的个人“账户”中,被控制、管理、交换和记账,正如银行为储户提供的服务。
因此,对于个人而言,应当拥有其自身数据的所有权、使用权和处置权。
第一,你有权占有你自己的数据。无论什么样的组织或个人收集你的数据,这些数据都属于你,你可以随时访问自己的数据。数据收集者扮演类似于银行的角色,代表他们的“客户”管理数据。
第二,你有权控制自己数据的使用。数据使用条款必须具有可选性,而且必须以明确的语言加以解释。如果你对公司使用你的数据的方式不满意,你可以把数据删除,就像你关闭银行账户一样,因为该银行没有提供令人满意的服务。
第三,你有权处置或发布你的数据。你也可以销毁自己的数据或将其重新部署到别处。
人们在日常活动中生产出大量数据的同时,也是在创造财富和价值。只有意识到个人数据是一种“权利”,并加以足够重视,才能维护属于个人的数据资产。
如何解读“数据新政”?
我们留下的个体分散的数据像“面包屑”一样,提供了一系列行为线索。根据这些线索,可以追溯到我们是谁、从事什么职业、想要什么。这无论对于公共利益部门还是私营公司,都具有巨大价值。从个人数据中可观察到大量的行为交互细节,这种能力是非常巨大的。既其可用于善意的目的,也可用于罪恶的用途。因此,保护个人隐私和个人自由对未来社会的成功至关重要。我们需要更多的数据共享服务于公众利益,同时充分地保护个人隐私。
成功的数据驱动型社会必须能够保障数据不被滥用,尤其是政府不滥用权力访问这些细粒度数据。现今,数据滥用的现象非常普遍:从根据个人购物历史,征收更高的保险费到通过限制用户选择、把用户封闭在信息泡沫中为整个社会制造问题。为解决这些问题,我们需要建立“数据新政”(the New Deal on Data)机制,在更高效、便利地获得服务于公益事业所需的数据的同时,保护公民的个人隐私。
不幸的是,如今大多数个人数据仅掌握在私营公司手中,外界基本上很难获取这些数据。私人机构收集了绝大多数个人数据,主要涉及个人的行为模式、金融交易、电话和互联网通信等数据。这些数据不应被私营公司独揽,因为私有公司不大可能自愿地贡献数据为公共利益服务。但同时私人机构必应是数据新政的核心参与者。同样,这些数据也不应被政府所独揽。有权分享数据并做出数据使用决策的只有数据所有者自己,即用户、参与者和公民。我们需要运用专家和大众的智慧共同推动社会进步。
在日益数字化的经济和社会中,加强网络安全尤为重要。可否通过技术手段,在全面保护隐私安全的基础上,实现关键数据的高效访问、交换和共享?
目前,解决上述问题的新的通用技术和潜在解决方案正取得积极进展,主要包括:
第一,身份(无论是个人身份,还是组织身份),以及拥有和声明身份的能力。这些是非常关键的问题,需要有一种“身份互联网(Internet of identity)”技术,以真正实现共享功能。
第二,区块链网络可以在机构之间提供真实的、可追溯的单一数据来源,并在一定程度上实现数据处理的自动化。然而,机构之间也必须选择分布式的信任源,以确保这种网络的适度性。身份对于促进区块链技术的广泛应用起着至关重要的作用。
第三。在个人数据存储和安全多方计算等研究开发的基础上,例如麻省理工学院研发的OpenPDS和ENIGMA,我们可以开发一个安全的、可信任的和可授权的新数字生态系统。
可否请您描绘一下上述“个人数字生态系统”是怎样的一幅场景?
应具备以下四个方面特征:
第一,透明度,人们自然期望有权利查看,并了解正在被捕获的关于自己的数据。如果这项权利得不到尊重,他们就会觉得受到了欺骗和剥削。当人们通过自己的个人数据看到自己的所作所为,就会开始感觉到一种人际关系和所有权,并萌生对控制的渴望。然而,人们努力形成的是一种在本质上支离破碎的抽象精神模式。
第二,控制。人们自然希望控制与自己有关的数据,而且这些数据通常由他们自己创建的。可以通过三种方式进行控制:一是直接通过显式选择;二是间接通过定义规则;三是委托代理。人们对某一特定情况的感知将决定他们是否选择行使控制权。经验中更加微妙的品质(如反馈、便利性和理解)将决定他们如何选择行使这种控制。
第三,信任。在建立信任方面,怎样的投资会帮助用户感到舒适,允许他人访问其数据?个人数据很难不被共享。一旦分享,个人数据就获得了自己的生命。考虑到意外后果的风险,人们严重依赖信任来指导他们的决策。但是信任是如何形成的呢?对于不同类型的数据存在不同的信任阈值。虽然大多数人接受一定程度的风险,把它看作是获得某种东西的机会成本,但好处往往与焦虑和恐惧相结合。这种焦虑和恐惧会继续限制个人数据的潜在价值,直到大规模采用能够建立和证明信任关系的可理解模式。
第四,价值。消费者愈发意识到自己所生成数据的价值,即使是在普通的交互中(比如在谷歌搜索中),其数据也具有价值。虽然直接个人数据具有固有价值,但通常可以挖掘和解释次要推断数据,来创造具有相同或更大价值的新信息。这种信息汇总和未经检查就进行传播的长期影响是未知的。今天的数字行为可能短期内在整个数据生态系统中会产生积极的分布价值,但将来可能对最终用户产生有害的后果。
*本文根据首都科技发展战略研究院成员张橦对阿莱克斯·彭特兰教授在中国开展“城市智慧创新国际联合实验室”工作期间的专访整理。
编辑:于悦
首都科技发展战略研究院成立于2011年8月,由国家科学技术部、中国科学院、中国工程院和北京市人民政府发起,北京师范大学、北京市科学技术委员会和北京市科学技术研究院共同承建,是立足首都、服务全国的新型智库。
Capital Institute of Science and Technology Development Strategy (CISTDS) was founded in August 2011, sponsored by Ministry of Science and Technology, Chinese Academy of Engineering, Chinese Academy of Sciences and People's Government of Beijing Municipality, co-founded by Beijing Normal University, Beijing Municipal Science & Technology Commission and Beijing Academy of Science & Technology, it is a new think tank that based on the capital and serves the nation.
领取专属 10元无门槛券
私享最新 技术干货