浪潮着力研发与集成面向分布式文件系统的智能存储管理技术Smart Storage

来源:智汇工业

点击:1115

A+ A-

所属频道:新闻中心

关键词:浪潮

    HDFS(Hadoop Distributed File System)作为通用的分布式文件系统,可以提供高可扩展、低成本、高可靠的海量数据存储,并广泛应用于大数据存储和分析方向。近年来伴随5G、物联网、人工智能等领域的快速发展,数据量规模不断增大,同时随着大数据应用的多样化发展,对数据的利用也更加成熟与深入,更大数据量以及更加灵活的数据处理场景对HDFS的数据存储与数据读写吞吐提出了越来越高的要求。


    为应对这些挑战,浪潮着力研发与集成的面向分布式文件系统的智能存储管理技术Smart Storage Management(简称SSM)应运而生。通过多项新技术及特性来解决存储场景中的各类挑战,助力大数据产品提供更加高效、智能的存储解决方案。


    概念上,智能存储管理(SSM)被定义为面向 HDFS的智能管理架构,主要提供针对新型存储设备、高速网络、新计算的存储优化与数据优化解决方案,实现端到端的数据管理服务,聚焦点可以概括为“两核心、三场景、四技术、五特性”。


    “两大核心”SSM的核心是基于数据热度的智能化管理来实现自动化面向存储的全生命周期优化。在数据热度方面,SSM通过收集文件系统操作数据与状态信息,利用多项指标分析数据访问模式,从文件级别定义数据热度,针对热度信息统筹规划相应地优化数据管理方式。在智能决策方面,SSM建立了基于规则的智能决策体系,围绕现有的大数据存储模式智能地构建了实用的解决方案。


    “三种场景”目前SSM在三种典型场景下表现突出,例如多存储模式。SSM适用于数据存储模式丰富的应用场景,可以提供更加灵活的存储模式选择;在数据优化上则提供了小文件合井、数据灾备、数据压缩等新功能,适用于对数据优化有需求的应用场景;智能化管理是面向大规模集群的数据管命周期的自动化管理。



    “四项技术”SSM主要通过四项技术实现智能的存储管理,主要包括通过分布式集群自治技术解决管理服务的高可用问题来实现存储管理集群去中心化;利用分布式事件驱动技术实现面向高并发场景的轻量级计算服务与监督机制,提升管理操作执行效率与容错性。


    基于规则的智能存储管理技术解决存储数据量巨大、数据增量高、数据类型混杂难以管理的问题,实现数据生命周期的智能化管理;凭借数据热度感知技术解决存储资源利用不均、资源浪费问题,实现数据冷热分层等。



    “五种特性”面向用户场景,SSM最终体现为五类典型的特性增强,主要包括如下:


    异构存储增强:结合智能规则管理与数据热度感知,充分发挥异构存储访问效率;


    纠删码增强:针对文件级的副本与纠删码、纠删码间快速转换,效率提升30%;访问路径不变。


    小文件合并增强:自动感知小文件,减缓NameNode压力,读性能提升一倍;


    自动化数据灾备:全自动跨域数据增量备份;


    透明化自动压缩:自选压缩模式,无感知压缩。


    总体来看,智能存储管理(SSM),以数据热度识别及智能化的决策体系为核心,配置面向应用场景的技术优化整体方案(异构存储增强、纠删码增强、小文件合并、自动化灾备、透明化压缩),自动化智能化的解决HDFS存储面向异构介质、存储空间及应用负载等方向的挑战,大大提升HDFS分布式存储的易用性及适用场景。


    作为面向海量数据存储、计算、挖掘的一站式企业级大数据解决方案,浪潮云海Insight大数据平台采用新型技术架构可承担企业大规模数据的采集集成、多样存储、规模计算以及智能分析挖掘等工作,支撑企业数据中心业务模型快速落地,助力企业信息化智能转型。


    具体来说云海Insight团队从客户需求出发,结合业务场景对智能存储管理技术(SSM)进行全面的方案验证及增强,最终在大数据平台中将智能存储管理技术产品化,包括智能存储的一键安装、可视化运维、基于票据的认证架构等,解决了用户针对大数据平台的备份灾备、数据生命周期管理、小文件合并等技术的诉求,提供了更优秀的用户体验。


    经过多方实践验证,面向HDFS的智能存储管理技术能够免去外界触发完成数据管理并进一步细化管理粒度,实现一次规则定制即可完成数据生命周期管理的解决方案,达成效果:


    冷热数据在异构介质间的快速迁移可提升数据访问效率2倍以上;


    数据存储在副本与纠删间的自动快速转换节省存储空间超过50%;


    凭借透明化的数据压缩、小文件合并以及平台级自动数据备份及迁移等方式可达成业务无感知,全面提升大数据平台的智能数据管理能力。




    (审核编辑: 小王子)