戴尔 -EMC 公司正在着手打造一套 2 TIERS 软件抽象层,旨在借此解决闪存之上一级存储数据与对象阵列中大规模之间愈发严重的分裂问题。
其起步解决方案是将 SAN 磁盘或者混合型闪存 / 磁盘阵列进一步拆分为多台阵列,这主要是考虑到一级数据速度需求不断提升、而二级数据存储容量快速增长的现实压力。
根据戴尔 -EMC 公司的设计规划,其中一台阵列专门负责实现一级数据闪存存储,并被定名为热边缘或者快速层。
另一台阵列则面向存证地磁盘之上且经由对象存储系统进行言说听二级(近线)数据,其可以内部或者外部形式存在且数据访问速度更慢,但每 GB 资源使用成本则远低于热边缘存储。
戴尔 -EMC 公司将此称为冷核心或者容量层,其同时亦在着手打造一款 2 TIERS 抽象层用以实现这一目标。以下为戴尔 -EMC 方面公布的一份演示文稿:
我们对于演示文稿中提到出的第三点并不认同,因为内部文件或者块访问高容量磁盘并非被云存储所替代,而是被可进行内部或外部(云端)部署的对象访问型高容量磁盘所替代。
EMC 方面认为,热边缘方案的存储容量区间应该是在数百 TB 级别,而容量层的容量水平则要高得多 ; 预计可能达到数百 PB。
将有一个统一的抽象层掌控元数据,用于指示数据条目位于哪个层以及层中的哪个具体位置。各数据条目随后会被分配单一全局命名空间,此空间可容纳数万亿个对象。此层中的代码亦会将数据根据需求在不同层间移动,具体依据一套策略驱动型自动化数据放置(分层)方法。
EMC 方面认为,利用其它方案以逻辑方式将两层加以统一会耗尽位于热边缘的元数据空间,进而引发额外元数据被放置在容量层内,最终导致访问速度缓慢。而解决这一难题的作法并非增加快速层内的元数据存储空间,而是对元数据进行缓存。
要实现这样的效果,其设想访问快速层的一组客户端服务器会利用 RDMA 访问向一台共享式 DSSD 阵列发送请求,或者利用 ScaleIO 访问一台虚拟闪存 SAN 以整合各本地直接附加闪存驱动器。
直接整合或者网络附加型快速层存储原理图。
在此之后是一个基于对象存储的容量层,其可以由一台 Isilon 阵列或者一台 ECS 向外扩展商用设备集群充当。这两种层皆可分别实现扩展或者收缩。
需要注意的是,这套缩减闪存快速层容量的整体模式在一定程度上类似于昆腾公司的 StorNext 产品,其专门面向娱乐与媒体工作流市场。
每台服务器都会访问 2 TIERS 软件,后者通过一个 POSIX API 与单一命名空间为服务器应用提供 SAN,同时亦利用策略驱动型分层机制将陈旧或者不必要的数据发送至容量层。其会将指向数据的应用访问映射至容量层中的对应对象。
这款 EMC 软件利用一套分布式 Orange 文件系统配合运行于本地 FUSE 文件系统之上的一项只读、通读型翻译服务,从而建立起快速层。这项服务采用动态负载命名空间(简称 DLN)以实现元数据分层。DLN 指向的是全局命名空间中的一部分,例如文件系统中的子树。在此部分中包含指向对象的指针,例如文件系统目录中的 inode。
我们尚不清楚 DLN 如何实现加载或者预读取。
利用这套 2 TIERS 模式,EMC 公司推荐了两种实例化思路,即利用 DSSD 快速层配合 Isilon 或者 ECS 容量层:
戴尔 -EMC 2 TIERS 示例
另一种备选方案是利用 Omnibond 的 CloudyCluster ——专门负责将 OrangeFS 部署在 AWS 当中——托管整套体系。
总体来讲,这是一套面向后 SAN/ 后 NAS 阵列内部或者公有云世界的解决方案。其 SAN/ 文件系统被拆分为两大类,且在逻辑层面利用 2 TIERS 软件实现这种 SAN 拆分。
评论观点
这种富有想象力的存储方案正是我们期待从 EMC 身上所看到的,而且目前尚无其它主流竞争对手拥有与之等同的解决方案。事实上,惟一能够在创新层面与之相匹敌的只有 HPE 的服务器事业部,其开发出了 Synergy 方案。
如果戴尔将 EMC 的这一发明应用至服务器,那么 HPE 无疑需要保持警惕。同样的,如果 HPE 方面将其 Synergy 纳入自家存储产品,则戴尔 -EMC 亦将面临严酷的竞争压力。
顺带一提,戴尔 -EMC 方面已经注册了 2 TIERS 商标。