张浩：云平台和大数据平台的安全云服务

【天极网信息化频道6月5日消息】以“大数据大宽带推动云计算应用与创新”为主题的第五届云计算大会今日在国家会议中心拉开帷幕。本届云计算以全新的国际视野，洞悉全球云计算发展趋势;并从应用出发，探讨云计算与大数据、云计算与移动互联网、云安全及云计算行业应用等焦点话题。

来自中国电子学会云计算专家委员会、中国工程院、中国科学院、中国移动、华为、中兴、百度、阿里云、微软、IBM以及SAP等知名It企业的领军人物和知名学者参与了此次大会，并带来了精彩的演讲报告。

会上，广州杰赛科技股份有限公司云计算CTO张浩发表了题为“Vebula云平台和大数据平台的安全云服务”的演讲。

广州杰赛科技股份有限公司云计算CTO张浩

张浩表示，在企业云计算建设的设想里，会有一套基于可信第三方的云安全防护平台。它的目的第一是管理身份，会把企业里面每个用户的身份管理起来。同时，企业里面要采用的云服务，我们也要把它管理起来。这样用户可以有一个单一的身份去面向众多的云服务，为企业的云服务构成比较安全的主线。第二，它必须是基于可信的第三方服务，这个安全防护平台也构成云服务的时候，如果不被可信的话是引入了另外一个不安全的因素。

以下是现场速记：

云计算还有大数据，不管你同不同意，它都来了。但是，来了以后，我们发现有一个很重要的问题，就是安全问题。大家都很关心安全问题，我们可不可以把安全问题做好。还有就是在我们还没有完整的关于云计算和大数据的安全方案的时候，我们用传统的安全解决办法，或者说现在能够想到的安全解决办法，能够怎么解决安全问题，或者部分解决安全问题，为将来更好的云计算环境和大数据处理环境服务。这就是我今天主题报告的总体内容。我们这个Vebula商标是因为Nebula的缘故。
首先介绍一下Vebula在云计算和大数据方面的工作。第二是我们对云安全问题和大数据安全问题进行分析。最后介绍一下我们在云计算和大数据方面的考虑。
Vebula从2009年开始涉及与云计算相关的研究和开发，现在有一系列的产品，从云操作系统、云存储到云安全的产品，另外还有云终端，我们还提供一些Saas层的服务。
威邦操作系统提供资源池化、统一管理、弹性、共享的部署，也可以在多个数据中心之间进行互联，帮助整体统一的管理。
这是我们整个平台的架构。在平台上面定制了Linux的版本，主要使用的虚拟化技术是KVM，做每个节点的管理、集群的管理和整个云控制的管理。重要的是我们进行了安全方面的控制，另外是用了压缩算法，保证带宽的速度更低，但质量更好。
这是我们现在发布的云平台产品的视图，可以完整地管理一个数据中心。
传统的数据中心是这样，企业和机构买大量的服务器，有了服务器之后还会买存储设备。但是，在云计算的环境里面，数据中心会变成什么样子呢？我们把软件灌注在这样一个数据中心里面，它可以虚拟出很多的桌面，给用户办公，也可以从服务器端虚拟出一些其他的虚拟服务器进行内部的数据交换。同时，我们还会构建一个虚拟的网络。这个虚拟的交换网络会连接虚拟的服务器、虚拟的桌面。同时，也可以让这些虚拟的服务器直接连在主干网络上对外进行服务。这中间有一些桌面传输的问题要进行解决，所以有一个比较优化的桌面传输协议。它要达到和传统服务器能力接近的程度，有很多技术问题需要处理。统一的软件、硬件结合在一起，构成了将来的数据中心的模式。
面向企业或者机构，我们会推出这样一个完整的设备，企业要购买的不是一个服务器或者是存储，它是一个完整的柜子。这里面不但有提供桌面的，同时还有提供服务器的，它对内、对外的网络和VPN这样的设备全部集中在这个设备里面。企业再进行信息化建设就变得容易得多，而且很多与云计算相关的东西全部集中在这么一个柜子里面，用户的使用门槛降低很多。
大数据处理这个方面有一个大数据处理平台，很多公司都做过这个平台。我们重点关注的是流式数据处理。数据流是不断的，我们是否可以实时的非常快地处理数据，看看现在流过来的数据是符合哪种规律的。在某些使用模式下，流式的大数据处理也可以获得很好的效果。
大数据处理有一个基本点，我们不希望数据到处移动，因为数据量很大。我们是希望配合数据进行计算。在我们的开发过程中会通过某一种算法将计算的算子合并起来，配合数据。
接下来是云安全问题的考虑。云安全问题一直阻碍云计算的发展。我们跟很多客户讨论的时候，马上被提出的问题就是安全怎么做。并不是说做安全的科学家没有很好的办法，而是说没有很好的方法可以真正融入到云计算和大数据的过程中。
在云计算的每一个层次，都有一些安全故障，我们会用一台虚拟机攻击另一台虚拟机。
另外就是数据会泄露。用户可以使用云平台进行一些安全的攻击，我用一些计算来破解一个密码，这在以前，个人和组织是没有办法做到的，但现在通过一个云服务是可以做到的。
在今年的大数据大会上也有一些专家对重点问题进行了讨论。安全问题应该是得票数第三，是9票。
这个例子是关于一个超市为什么会比女孩的父亲更早知道这个女孩怀孕了。站在超市的角度来讲，大家会把这个作为大数据的优势，因为大数据可以发现更多的商机，投放更精准的广告。但是，反过来想，这个女孩的父亲会怎么想，还有这个女孩，她觉得自己的隐私被泄露。
在做大数据分析的时候也面临另外一个问题，就是可能没有能力处理大数据，于是我要把这些数据给别人去处理，我的数据可能出现在各个地方，在一家公司的大数据处理机构或者是公司的另外一个部门，在数据管理员还不是特别清楚的时候，这些数据已经出现在了其他的系统里面。
下面我会讲三个故事，都是跟云计算和大数据安全相关的。
第一个是关于安全云服务。我们想象一下未来我们会怎样使用云计算。虽然现在公有云发展的如火如荼，专有云也在不断发展，我们想象在未来一个企业里面，一定是让企业的某一部分使用公有云服务，而且它确实比较好用，可以给企业解决很多问题。
第二，会有越来越多的云服务提供商，他们有某方面的特长，可以把这方面特长变成一种服务提供给用户。
第三就是企业内部的云，做企业内部的管理或者是桌面服务。这些云混合到一起构成我们常常说的混合云的模式。企业里的用户怎么办？面对这么多的云，都要设立一个账号吗？这个怎么管理？
在我们的设想里面，会有一套基于可信第三方的云安全防护平台。它的目的第一是管理身份，会把企业里面每个用户的身份管理起来。同时，企业里面要采用的云服务，我们也要把它管理起来。这样用户可以有一个单一的身份去面向众多的云服务，为企业的云服务构成比较安全的主线。第二，它必须是基于可信的第三方服务，这个安全防护平台也构成云服务的时候，如果不被可信的话是引入了另外一个不安全的因素。
这是服务的两种模式。第一种模式比较容易想到，企业用户要访问各种各样的云服务，就必须让所有的服务都通过代理模式。只要每个服务的通道都通过我这个地方，我一定可以知道你干了什么或者你该不该去干，我也可以代理你访问一些服务。这种代理模式并不适合每一种情况，并且没有一家云服务提供商可以提供面向所有服务的代理。所以这里有第二种模式，就是主动模式。
这种模式里面，服务商和用户需要在这个安全平台里面获得一个身份。在这个身份的管理之下，服务和用户之间进行票据的传输。这个图上是一个示意图，千万不能按照这种模式去实现服务，这是不完整的。你要访问一个服务的时候，服务和云平台之间是构成安全协商的，发一张票。用户拿着这个票就可以访问服务，服务把数据返回给用户的时候，需要在这个安全服务中心拿到数据的解密密钥，每次用户的使用流程和服务返回的流程都会在安全云服务平台里面构成一个引子，访问的过程保留下来了，为整个服务提供证据。有了这个证据以后，服务就可追溯，可以保障很多的安全。
这个是在服务建设过程中涉及到的安全算法。
在访问控制这一块，因为涉及到多种访问控制的模型，我们也基于PERMIS做了软件可定义的访问过程。
这么一种认证和授权的服务，对于用户而言，它会代理你访问云的服务。对于服务提供商而言，会监控用户的访问，对双方是非常公平的安全防护。
我们在中间也做了一个关于步进式加密的服务，云平台的服务管理员是拿不到密码铭文的。
这是我们在安全服务过程中涉及到的完整审计过程。整个安全平台的监控也是这个服务的重要组成部分。
我要讲的第二个故事是关于信任的问题。关于我们的平台被信任和我们的终端被信任的问题。我们已经看到了很多趋势。第一，我们会在企业内部构建一个数据中心，威邦云平台可以帮助用户构建这个中心，用户可以用手机或者是另外一台电脑访问他的资料。企业用很大的力气构建企业内部的安全防护，在这个时候好像忽然失效了。因为当我可以拿着终端满世界跑的时候，这个终端上的软件可以直接看到我们的数据中心里面的内容，他可以在屏幕上面截一张图，偷偷发出去。我们有一个客户让我们为他开发一个终端的软件，就是截图的，把终端的屏幕截下来。当我们的终端显示数据中心桌面的时候，截图的工作虽然在技术上可以实现，但在管理上造成了新的不安全因素。
所谓云计算，会把资源集中起来，在电信、联通、移动的机房里面，会有很多家公司的机器。你怎么保证云平台是相信某一台机器的。任何一个穿着制服的人都可以搬一台机器放到云数据中心，你怎么可以随便信任一台机器呢？也许他在服务器里面安装了某些软件，它就不小心变成了你的云资源管理的一部分，你可能把虚拟机的安全运行放在了这台不熟悉的平台上。
我们会让服务器之间，通过群签名的方式构建一种信任关系。当然这些信任关系现在只能通过软件来做到，慢慢的我们会通过硬件来建立这种信任关系。
用户对于云的访问会将相应的安全策略交给一个群的管理员，由他把安全策略发放到每一台可以被信任的服务器上。
这是我们构建可信集群的架构，包括群的管理员、群的成员、申请加入这个数据中心的服务器。
我们在每台服务器上做的安全架构是期望基于可信计算的模式来实现的。
传统的终端或者是传统使用PC的时候，用户的角色、应用程序和操作系统是被有效的通过一个物理的壳隔离起来。现在我们用了桌面，这些角色和应用程序、操作系统变到另外一个环境里面，通过人映射到不同的设备里面，这就是第二个故事里面终端是否可信的问题。
我们在终端内部建立一些安全措施，保证这个终端是可以信任的。好像有一个误解认为云终端是没有操作系统的，没有CPU，没有内存，没有存储的。其实不可能是这样的，每一个终端都是一个计算机，它与我们使用的物理计算机没有实质性的变化，只是能力上面的变化，或者可以删掉一些不需要的设备，这就带来了终端的安全问题。我会结合威邦的安全云平台提供完全安全可信的方案。
大数据隐私的解决方案，这是我刚刚已经提到的一个故事。为什么超市的管理员会比女孩的父亲更早地知道这个女孩怀孕的事情。
有一个姚氏百万富翁问题，两个富翁想比较谁更有钱，但又不想让对方知道自己有多少钱。这个问题的解决涉及到多方计算的模式。有很多个用户，他想把数据放到一个地方进行处理，但他不希望自己数据的输入可以被别人知道。要解决这个问题，发展到后来就是所谓的外包计算。现在很多研究者都知道一个方案叫做全同态，加密的数据同样可以被处理，这个方案我们实践过，速度太慢了，没有办法解决问题。目前可能使用的方法就是多方计算。
采用的主要安全策略就是TN门限密码体制。原理就是任意T个人掌握的秘密，我们的计算不要被所有的T个人知道。
它比较好的是对数据的处理速度比全同态要快很多。但是它有一个缺点，就是没有办法控制。大数据的处理平台在我们的平台里面会变成另外一种模式，就是将用户需要处理的数据，在用户那一端分成N块，再把它外包出去给别人计算。我们保证的是在外面计算的T个计算模块不可以相互勾结，这样的话就不会知道彼此的秘密。
大家可能有一些疑问，传统的密钥体制，我有一个秘密要和你共享，通常我跟你单个人共享就可以。现在的密码学还在继续发展，在一些人的关系之内是可以分享秘密，但又可以保证相互之间有不知道的内容，不会完整的构成一个密钥。这与云计算很像，以前是一台一台的PC，现在把这个东西放在资源池里共享，好像是技术发展的轮回。
这是我们的解决方案的示意图，将用户的数据拿到云平台里计算，把它发给T个不同的人那里，保证任何服务商之间没有办法勾结。或者是我放一部分服务计算在用户这边，导致外面的人没有办法勾结，就算勾结，也一定要勾结用户这边的计算单元。这种情况就可以比较好地解决安全问题。
这是我们构建平台的数据流转。MapReduce是大数据中经常被谈到的一个方法。我们的这个平台也会在上面进行完整的实现，先对数据进行分包，然后发到平台上去，最后是Web服务。
谢谢各位！

张浩：云平台和大数据平台的安全云服务

热门标签