|
无加密模式下对云数据的隐私保密密码学的研究进展是令人鼓舞的,但对云计算中的数据进行加密操作还没有切实可行的解决方案。 密码学的研究进展是令人鼓舞的,但对云计算中的数据进行加密操作还没有切实可行的解决方案。由罗纳德L.李维斯特(Ronald L.Rivest)提供的“选种和筛选系统(Chaffing and Winnowing)”即技术保密而不加密算法将成为一种可行的解决方案,能从云计算中受益,该技术的提出是基于分组通信系统,其不适用所有云服务模式,如:SaaS,PaaS或IaaS。 1.简介 1.1 可提供外包的计算密集型任务 计算密集型任务可以利用云服务的可扩展性,低成本等优势,外包给远程的云服务提供商(CSP)。在互联网广告业务中,无论是在线购物网站,社交网站或一个简单的房地产搜索网站,都是通过事件日志来了解客户的行为模式的,如他们的会话持续时间,频率和数量,用户在不同的关键点上花费的时间不同将产生不同的数据日志和搜索关键词。 许多数字广告和营销公司会细分用户和客户的数据日志,并在此基础上收集和分析这些日志,往往这些日志中会包含敏感的信息和客户数据。因此云服务消费者(SCS)将这样的任务外包到远程的CSP是非常危险的,无论是黑客的外部入侵还是内部人员恶意盗用,一旦这些数据落入他人之手,将会给SCS带来不小的损失。 1.2 MapReduce类似于IaaS MapReduce是一种编程模型,用于大规模数据集的并行运算。概念“Map(映射)”和“Reduce(化简)”以及它们的主要思想,都是从函数式编程语言里借来的,还有从矢量编程语言里借来的特性。它极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上。当前的软件实现是一个Map(映射)函数,用来把一组键值对映射成一组新的键值对,指定并发的Reduce(函数),用来保证所有映射的键值对中的每一个共享相同的键组。这样一个典型的编程模型,尤其是对于网络日志解析,将有几个主要部分: (1)数据收集。 如Apache Flume,Facebook's Scribe chukwa等一系列分布式,可靠性和可利用率高的服务,通常有三层:代理层,是负责收集各种来源的数据;采集层,是负责总汇这些数据;流层,是负责简化数据并以流的形式发送至CSP。 (2)数据解析。 Hadoop和MapReduce服务一样,两者都采用WebLog数据解析模式概述了一种典型的CSC架构(如图1)。Hadoop是一种能够运行在廉价硬件之上的分布式文件系统,而且它提供高传输率来访问应用程序的数据,适合那些有着超大数据集的应用程序。Hadoop放宽了POSIX接口的要求,这样可以以流的形式访问文件系统中的数据。 责编:王雅京 微信扫一扫实时了解行业动态 微信扫一扫分享本文给好友 著作权声明:kaiyun体育官方人口
文章著作权分属kaiyun体育官方人口
、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。 |
最新专题 推荐圈子 |
|