大数据与个人隐私

受邀参加江苏省淮阴中学开明分校的校本课程,给孩子们做一次《大数据与个人隐私》的分享。在这里,先要感谢江苏省淮阴中学开明分校教务处领导和老师们的辛勤付出,精心安排了各项工作。接下来,进入正题:

分享的主题:大数据与个人隐私

随着大数据技术的不断发展,渗透到各行各业,对我们的生活产生了深刻的影响。然而,大数据又可以将一个人或组织的全貌暴露在互联网上,数据一旦被窃取盗用,个人隐私权极易受到侵犯,我们更应该学会保护个人隐私。

给大家分享的内容主要包括:

1、什么是大数据

2、哪里用到了大数据

3、哪些是个人隐私

4、个人隐私怎么保护

5、个人数据的商业用途

第一部分:什么是大数据

大数据 更懂你

大数据“更懂你”的概念,是指利用大量的个人数据来分析和了解用户的行为、需求和偏好。随着互联网、物联网等技术的发展,我们在日常生活中产生了大量的数字足迹,这些数据可以被用于分析和预测我们的行为和决策。

例如,在电商平台上购买商品时我们留下了购买记录、收货地址、支付方式等信息,平台可以通过分析这些信息来推荐更符合我们需求和偏好的产品。又如,在社交网络上发布内容、点赞、评论等行为也能够被分析,从而推测出我们的兴趣和喜好,平台可以根据此来推送更加个性化的广告和内容,提高用户体验和满意度。

大数据和他的朋友们

大数据、云计算、人工智能、物联网和5G之间有着密切的关系。它们通常被认为是数字化转型的核心技术,可以相互支持和增强。

首先,大数据和物联网可以相互交织。物联网设备可以收集各种数据并将其传输到云端进行存储和分析,从而形成大数据环境。通过人工智能的技术和方法,可以在大数据中发现模式和趋势,并作出预测和决策。

其次,云计算和人工智能也有着千丝万缕的联系。云计算提供了强大的计算和存储能力,使得人工智能可以更加高效地运行和优化。同时,人工智能的模型和算法也可以通过云计算平台进行部署和管理,以实现更好的可扩展性和安全性。

最后,5G则是连接这些技术的纽带。5G提供了更快、更稳定和更广泛的连接能力,可以让物联网设备和云计算平台之间的数据传输更加快捷和实时。同时,5G还可以支持更多的设备和更大的数据流量,从而推动人工智能的应用范围和深度。

大数据基本结构

大数据原理主要包括数据采集、存储、处理和分析。

数据采集:数据采集是大数据处理的第一步,它涉及到如何从多种来源获取数据。常见的数据来源包括传感器、社交网络、移动设备、互联网搜索引擎等。对于采集到的数据,需要进行初步的清洗和处理,以保证数据的准确性和完整性。

数据存储:数据存储是指将采集到的数据保存到合适的位置,以便后续处理和分析。在大数据环境中,数据量非常大,因此需要使用分布式文件系统(如Hadoop)等技术来进行高效的数据存储和检索。此外,由于数据不仅来自结构化数据源,也来自非结构化数据源,所以还需要采用NoSQL数据库等技术来应对这些不同类型的数据。

数据处理:数据处理是指如何快速地处理大量的数据。在大数据环境中,数据通常分散在多台计算机上,需要使用分布式计算框架(如Spark)等技术来进行高效的数据处理。此外,针对不同的业务需求,需要采用不同的数据挖掘和机器学习技术,提取有价值的信息和模式。

数据分析:数据分析是指从大量数据中发现有价值的信息和规律,为业务决策提供支持。在大数据环境中,需要使用数据可视化、机器学习等技术来对数据进行分析和解释。

使用大数据遵循原则

大数据技术的发展和广泛应用给个人隐私保护带来了新的挑战。大数据往往需要收集、处理和分析大量的个人信息,如个人身份、行为习惯、健康状况等,这些信息在未经个人同意的情况下被搜集、利用和传播,势必会对个人隐私造成侵害。

为了保护个人隐私,在使用大数据技术时,应该遵循以下原则:

合法性:个人信息的采集、使用和处理必须遵守相关法律法规,并获得明确的合法授权。

透明性:数据处理方要公开说明数据的来源、用途、范围和方式等信息,并告知被采集数据的个人知情权。

自主权:个人应当有选择是否参与数据采集和使用的自由,并且可以自主访问、更正、删除自己的个人信息。

安全性:数据处理方应采取合理的安全措施,防止个人信息被非法访问、泄露、损坏或滥用。

最小化原则:数据处理方应该尽可能地减少个人信息的采集和使用,只收集必要的信息,并在达到目的后及时删除不必要的信息。

第二部分:哪里用到了大数据

大数据公司有哪些

Google:作为全球最大的搜索引擎和互联网技术公司之一,Google拥有强大的大数据处理和分析能力,并且在机器学习、人工智能等领域有很深入的研究。

Amazon:作为世界最大的电商平台之一,Amazon利用大数据技术来分析用户行为和偏好,推荐个性化的产品和服务,提高用户体验和忠诚度。

Microsoft:作为全球最大的软件公司之一,Microsoft在大数据处理和人工智能等技术方面也非常活跃,推出了Azure云计算平台等产品。

IBM:作为全球知名的信息技术和咨询服务公司,IBM已经投入了大量资源来研究和应用大数据技术。IBM Watson等产品已经成为业界知名的大数据处理和分析技术。

Facebook:作为全球最大的社交网络之一,Facebook拥有海量的用户数据和社交关系数据,可以利用这些数据来提供更好的社交体验和个性化的广告服务。

Alibaba:作为中国最大的电子商务平台,阿里巴巴集团旗下有淘宝、天猫等多个电商平台,在大数据处理和分析方面拥有深入的研究和应用。

Baidu:作为中国最大的搜索引擎之一,百度在大数据处理和机器学习等领域也非常活跃,并且推出了多个人工智能产品和服务。

大数据对生活的影响

商业和零售:企业可以利用大数据分析客户行为、需求和偏好,制定更精准的产品策略、定价和促销计划,提升市场竞争力。消费者也可以通过在线购物等方式来获得更多的产品选择和优惠。

健康和医疗保健:医院和临床机构可以利用大数据分析患者病历、药物反应和疾病趋势,制定更有效的治疗方案和预防措施,提高医疗水平和服务质量。

城市管理:政府机构可以利用大数据分析城市交通、环境和公共服务等方面的数据,优化城市规划和运营,提高城市居民的生活质量和幸福感。

交通运输:利用大数据可以实现智能交通系统,提高路况监测、路线规划和交通安全的效率,为城市交通发展提供支持和启示。

社交和媒体:社交网络和媒体公司可以利用大数据分析用户行为、话题和趋势,推荐个性化的内容和服务,提升用户体验和忠诚度。

教育和科研:学校和研究机构可以利用大数据分析学生和研究者的学术成果、兴趣和需求,制定更精确的教育和科研计划,提高学习和研究效率和质量。

大数据泄露案例

1. 领英

日期: 2012 年 6 月

影响: 1.65 亿用户

第二次出现在这个名单上的是 LinkedIn,这一次是指它在 2012 年遭受的破坏,当时它宣布攻击者窃取了 650 万个未关联的密码(未加盐的 SHA-1 哈希)并将其发布到俄罗斯黑客论坛上。然而,直到 2016 年,事件的全部范围才被揭露出来。发现出售 MySpace 数据的同一黑客仅以 5 个比特币(当时约为 2,000 美元)提供了大约 1.65 亿 LinkedIn 用户的电子邮件地址和密码。LinkedIn承认已获悉该违规行为,并表示已重置受影响帐户的密码。

2. 雅虎

日期: 2013 年 8 月

影响: 30 亿个账户

确保第一名的位置——在最初的泄露事件发生后将近七年,以及在暴露的真实记录数量被揭露后四年——是对雅虎的攻击。

该公司于 2016 年 12 月首次公开宣布这起事件,据称该事件发生在 2013 年。

当时,该公司正处于被 Verizon 收购的过程中,估计其超过 10 亿客户的账户信息已被访问由黑客组织。

不到一年后,雅虎宣布用户账户被曝光的实际数字为 30 亿。

雅虎表示,修订后的估计并不代表新的“安全问题”,它正在向所有“其他受影响的用户帐户”发送电子邮件。

经调查发现,虽然攻击者访问的安全问题和答案、明文密码、支付卡和银行数据等账户信息并未被窃取。

3. 雅虎

日期: 2014 年

影响: 5 亿个账户

第二次出现在这份名单中的是雅虎,它在 2014 年遭受了一次攻击,与上述 2013 年的攻击不同。

在这种情况下,国家资助的演员从 5 亿个帐户中窃取了数据,包括姓名、电子邮件地址、电话号码、散列密码和出生日期。该公司在 2014 年采取了初步补救措施,但直到 2016 年,雅虎才在被盗数据库在黑市上出售后公开了详细信息。

4.网易

日期: 2015 年 10 月

影响: 2.35 亿用户帐户

据报道,网易是一家通过 http://163.com 和 http://126.com 等网站提供邮箱服务的提供商,据报道,该公司在 2015 年 10 月遭受了一次攻击,当时暗网市场供应商 DoubleFlag 出售了与 2.35 亿个帐户相关的电子邮件地址和明文密码。

网易坚称没有发生数据泄露事件,直到今天 HIBP 表示:“虽然有证据表明数据本身是合法的(多个 HIBP 订阅者确认他们使用的密码在数据中),但由于难以强调验证中文违规行为已被标记为“未经验证”。

5. 我的健身伙伴

日期: 2018 年 2 月

影响: 1.5 亿用户帐户

2018 年 2 月,饮食和锻炼应用 MyFitnessPal(由 Under Armour 拥有)暴露了大约 1.5 亿个唯一的电子邮件地址、IP 地址和登录凭据,例如存储为 SHA-1 和 bcrypt 哈希值的用户名和密码。第二年,这些数据出现在暗网上和更广泛的范围内出售。该公司承认了违规行为,并表示已采取行动通知用户这一事件。

6.万豪国际(喜达屋)

日期: 2018 年 9 月

影响: 5 亿客户

万豪国际酒店在 2018 年 9 月其系统遭到攻击后,宣布暴露了50 万喜达屋客人的敏感信息。

在同年 11 月发布的一份声明中,这家酒店巨头表示:“2018 年 9 月 8 日,万豪收到了来自内部安全工具的关于试图访问喜达屋客人预订数据库的警报。万豪迅速聘请了领先的安全专家来帮助确定发生了什么。”

万豪在调查中获悉,自 2014 年以来,喜达屋网络一直遭到未经授权的访问。“万豪最近发现,未经授权的一方复制并加密了信息,并采取措施将其删除。2018 年 11 月 19 日,万豪能够解密信息并确定内容来自喜达屋客人预订数据库,”声明补充道。

复制的数据包括客人的姓名、邮寄地址、电话号码、电子邮件地址、护照号码、喜达屋优先客户帐户信息、出生日期、性别、到达和离开信息、预订日期和通信偏好。对于一些人来说,这些信息还包括支付卡号和到期日期,尽管这些显然是加密的。

7.脸书

日期: 2019 年 4 月

影响: 5.33 亿用户

2019 年 4 月,据透露,来自 Facebook 应用程序的两个数据集已暴露在公共互联网上。这些信息涉及超过 5.3 亿 Facebook 用户,包括电话号码、帐户名称和 Facebook ID。然而,两年后(2021 年 4 月),这些数据被免费发布,表明围绕这些数据的新的和真实的犯罪意图。

8.阿里巴巴

日期: 2019年11月

影响: 11亿条用户数据

在八个月的时间里,一名为联属营销商工作的开发人员使用他创建的爬虫软件从阿里巴巴中国购物网站淘宝上抓取了客户数据,包括用户名和手机号码。

看来开发商和他的雇主正在收集信息供自己使用,并没有在黑市上出售,尽管两人都被判处三年徒刑。

9. 新浪微博

日期: 2020 年 3 月

影响: 5.38 亿个账户

新浪微博拥有超过 6 亿用户,是中国最大的社交媒体平台之一。

2020 年 3 月,该公司宣布攻击者获得了其部分数据库,影响了 5.38 亿微博用户及其个人详细信息,包括真实姓名、网站用户名、性别、位置和电话号码。据报道,攻击者随后在暗网上以 250 美元的价格出售了该数据库。

10. 领英

日期: 2021 年 6 月

影响: 7 亿用户

2021 年 6 月,专业网络巨头 LinkedIn 在一个暗网论坛上发布了与 7 亿用户相关的数据,影响了其 90% 以上的用户群。

一个被称为“上帝用户”的黑客在倾倒大约 5 亿客户的第一个信息数据集之前,通过利用该网站(和其他人)的 API 来使用数据抓取技术。

然后他们吹嘘说他们正在销售完整的 7 亿客户数据库。

虽然 LinkedIn 辩称,由于没有泄露敏感的私人个人数据,该事件违反了其服务条款而不是数据泄露,但 God User 发布的数据样本包含的信息包括电子邮件地址、电话号码、地理位置记录、性别和其他社交媒体详细信息,这将为恶意行为者提供大量数据以使其具有说服力,受到英国 NCSC 的警告。

https://zhuanlan.zhihu.com/p/517496963

第三部分:哪些是个人隐私

哪些属于个人隐私

姓名

出生日期

地址

电话号码

电子邮件地址

社交媒体账号

身份证号码

驾照号码

护照号码

医疗记录

家庭情况

金融信息(如信用卡号码、银行账户信息等)

政治立场

私人通讯(如聊天记录、邮件、短信等)

东西方个人隐私的差异

由于文化和价值体系的不同,中西方之间产生诸如隐私观之类的观念不同是不可避免的。在历史的发展过程中,每一个国家都有自己世代相传文化纽带。中国文化历来以集体主义、农业文明为特征,西方文化的标志则是个人主义、工业文明。

(一)集体主义和个人主义。集体―个人主义常被用来解释跨文化交际中的异同。中国传统文化属于集体主义。集体主义就意味着国家、社会和家庭是第一位的,必要的时候,个人利益可以被完全忽略。在处理个人和集体的关系时,人们被要求和集体利益保持一致。集体主义更关注群体和社会的共性问题,集体的目标要远远大于个人的目标。受此观念影响,在隐私观这一问题上,中国人也更注重人与人之间的相互依赖关系,即集体主义隐私观。群体隐私远在个人隐私之上,这样的传统使得中国人的个人隐私观比西方人弱得多。

而作为西方文化核心的个人主义崇尚独立自主和鲜明的个人特征。他们总是追求个性解放,有时候为了创新甚至不惜打破旧有的定律。单纯的物质丰腴并不能使他们得到满足,他们特别关心个人意志以及自我价值的实现。即便有来自国家、社会或者其他群体的压力,个人目标总是被放在第一位。严格地保护个人隐私就是西方个人主义的集中体现。在西方,隐私被列为所有公民神圣的不可侵犯的权利。年龄、养老金、工资、个人信仰、私人信件、家庭关系等等都属于个人隐私。同时,西方对于隐私也有严格的立法。所以在跨文化交际中,为了避免冲突,人们应该特别注意关注西方人的隐私。

(二)农业文明和工业文明。古老的中华文明起源于黄河中下游,肥沃的土地和良好的灌溉条件造就了灿烂的农业文明。农业的决定性地位使得人们的日常生活都是以单个的家庭或者几个相关的家庭为单位。个人只是集体的一部分,成员们需要尊重集体的利益。在成员内部之间,是没有绝对的隐私和秘密的,这也是汉语中没有完全对等英文privacy的原因。在这样的农业文明中,只存在集体隐私而没有严格的个人隐私。农业的生产方式决定了中国整体的集体主义价值观。

相对而言,西方文明则是高度工业化的。起源于南欧的地中海地区,特殊的自然条件抑制了西方农业经济的发展,水运的发达促进了工业和商业的发展。商业中等价交换的基本原则激发了人们个人意识的苏醒,并逐渐发展成为高度的个人主义。在西方文化中,血缘亲属关系显得不那么重要,人们更多的是关注自我独立和个人的努力。因此,在西方价值体系中,诸多的个人信息都被划归为隐私,并且加以最大程度的保护。

https://www.wenmi.com/article/py324v034zxt.html

泄漏个人隐私的行为(一)

1、谨防钓鱼网站

网警提醒∶谨慎对待手机上收到的中奖信息,切勿轻易点击短信中的不明网址,否则极易误入钓鱼网站!

2、清楚旧手机的数据信息

网警提醒∶在处置不用的旧手机时,很多用户仅只是简单地删除资料。但这些被删除的信息完全可以通过数据恢复工具还原,因此要妥善清除旧手机中的数据信息。

3、不要随意蹭WIFI

网警提醒∶公共场合要谨慎连接WiFi,没有密码的公共WiFi或免费WiFi慎用,尽可能使用手机移动数据流量。

4、不轻易授权“免密支付”功能

网警提醒∶尽量不开通"免密支付",如必须要开通,应设定月度限额或单次支付限额,一旦出现意外可避免损失扩大。

5、谨慎授权使用协议

网警提醒∶APP使用授权要谨慎从正规官方渠道下载安装APP,认真阅读服务协议,用户隐私政策说明尤其不能轻易授权免密支付功能,不使用的APP,及时注销,清除数据

6、警惕来路不明链接

网警提醒∶来路不明链接不要点,不轻易打开来历不明电子邮件及附件,不随意填写个人资料,不轻易点开社交软件中来历不明链接,不扫描没有安全保障的二维码,网络安全防护从个人信息保护做起

7、不使用杂牌路由器

网警提醒∶一些杂牌路由器生产厂商可能会定向监听用户来往某个网站的数据,获取用户在特定平台的账号控制权;选购无线路由器时,尽可能选择正规厂家生产的品牌产品;安装设置路由器时,要尽可能使用复杂密码来提高网络安全性。

https://baijiahao.baidu.com/s?id=1729899739764634676

泄漏个人隐私的行为(二)

泄漏个人隐私的行为是非常危险和违法的,以下是一些常见的泄露个人隐私的行为:

黑客攻击:黑客使用各种技术手段,如网络钓鱼、恶意软件等攻击个人设备或机构,并获取用户的信息。

数据泄露:企业或政府机构在处理数据时,由于安全漏洞、内部失误等原因,导致用户的信息被泄露。

社交网络:用户在社交网络上发布自己的个人信息,如生日、地址、电话号码等,这些信息可能会被不适当地使用或分享给其他人。

手机应用:一些手机应用程序可能会收集用户的个人信息,如通讯录、位置信息等,并将这些信息与其他公司共享或出售。

网络诈骗:网络诈骗者通过欺骗用户提供个人信息,例如银行卡号码、社保号码等,然后利用这些信息进行欺诈活动。

以上行为都有可能导致用户的个人隐私被泄露,带来不良后果。因此,需要用户关注自己的个人信息安全,避免在公共场合暴露个人信息,同时,对于公共机构和企业,也应该加强数据安全保护和隐私政策的制定。任何人泄露个人隐私都会面临法律责任和道德谴责。

第四部分:个人隐私怎么保护

个人隐私保护

设置强密码:设置一个复杂的密码,并定期更换密码,可以避免密码被猜测或攻击。

多因素认证:使用多种安全验证措施,如短信验证码、指纹识别等,可以增加账户的安全性。

避免公开个人信息:尽量不要在社交网络或其他公开平台上公开个人信息,如生日、电话号码、家庭住址等。

检查应用权限:检查应用程序的权限并仅授权必要的权限,以避免应用获取过多的个人信息。

定期清理浏览器缓存和Cookie:定期清理缓存和Cookie,避免敏感信息被泄露。

使用虚拟专用网络(VPN):使用VPN可以加密网络流量,隐藏个人IP地址,保护个人隐私。

关注产品隐私政策:在使用应用程序或服务之前,需要仔细阅读其隐私政策,了解它们如何收集、使用和分享个人数据。

加强安全防护:使用杀毒软件和防火墙来保护设备和网络免受攻击。

第五部分:个人数据的商业用途

回答最前面的问题(一)

客户标签是多维度组合,是个持续性过程一个完善的用户标签体系不是一蹴而就的,而给用户打标签也是一个持续性的过程。每个客户都会有多个不同维度的标签,而且客户标签都是在不断变化和完善的,运营人员要根据不同场景、不同营销时间节点来完善和更迭用户标签。

https://zhuanlan.zhihu.com/p/402693358

回答最前面的问题(二)

用户在产品上的交互行为为用户留下了标记,我们可以利用“物以类聚,人以群分”的朴素思想来为用户提供个性化推荐。

具体来说,“人以群分”就是找到与用户兴趣相同的用户 (有过类似的行为),将这些兴趣相同的用户浏览过物品推荐给用户,这就是基于用户的协同过滤算法。“物以类聚”就是如果有很多用户都对某两个物品有相似的偏好, 说明这两个物品是“相似”的,我们可以通过推荐用户喜欢过的物品相似的物品这种方式为用户提供个性化推荐, 这就是基于物品的协同过滤推荐算法。

https://blog.csdn.net/kl28978113/article/details/89675959

大数据发展机遇

商业机遇:通过大数据分析,企业可以更好地了解消费者的需求和偏好,为其提供更加个性化的产品和服务。同时,企业也可以通过大数据技术优化营销策略,提高广告效果和销售额。

创新机遇:大数据技术的发展为许多创新提供了契机。例如,基于大数据分析的人工智能、区块链等新兴技术,正在不断涌现,并引领着未来的科技发展方向。

社会机遇:大数据技术可以为政府部门提供更加精准的公共管理和服务。例如,通过大数据分析,政府可以更好地了解市民的需求和意愿,制定出更加符合实际情况的政策和规划。

就业机遇:随着大数据技术的发展,相关行业的就业机会也不断增多。例如,数据分析师、大数据工程师、人工智能专家等职业,都受到了越来越多的关注和需求。

分享给亲爱的孩子们,你们get到了吗?

参考资源:

[1]GDCA.21世纪10大数据泄露事件[EB/OL].https://zhuanlan.zhihu.com/p/517496963,2022-05-20

[2]文秘帮.中西隐私观对比研究[EB/OL].https://www.wenmi.com/article/py324v034zxt.html,2022-09-19

[3]贵阳网警巡查执法.大数据时代,如何保护个人隐私安全? [EB/OL].https://baijiahao.baidu.com/s?id=1729899739764634676,2022-04-12

[4]乐语私域流量运营系统.为什么给客户打标签,会大幅提升转化率?[EB/OL].https://zhuanlan.zhihu.com/p/402693358,2021-08-23

[5]冰阔落.打造工业级推荐系统(二):无处不在的推荐系统[EB/OL].https://blog.csdn.net/kl28978113/article/details/89675959,2019-04-29

展开阅读全文

页面更新:2024-04-14

标签:数据   大数   人工智能   数据处理   社交   隐私   密码   用户   技术   信息

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top