Seagateのデータ・センター・ワークロード全体をハイブリッド・ストレージ・システムとハードディスク・ドライブ・ストレージ・システムで処理
データに対する需要が尽きることのない時代において、Seagateはストレージ・ソリューションをリードするメーカーであるだけでなく、自社専用の広範なデータ・センターで膨大な量のデータを管理する主要なグローバル企業でもあります。オールフラッシュ・ストレージ・システムの老朽化に直面していたSeagateは、現在のニーズと将来のデータの増加に対応するために、戦略をモダナイズする機会を得ました。Seagateは、ハードディスク・ドライブの大容量とフラッシュの薄いレイヤーを備えたハイブリッド・ストレージ・システムの導入を選択しました。その理由として、パフォーマンスを一切損なうことなく、大量のデータ容量を効率的に拡張できることが挙げられます。また、多数のInfinidat InfiniBoxストレージ・アレイをいくつかのSeagateデータ・センターに導入しました。
ハードディスク・ドライブとSSDのデータ・センターへの適合性については、近頃、多くのことが語られてきました。ハイパースケールおよびクラウド容量の要件の約90%をハードディスク・ドライブが占め続けているのには、正当な理由があります。1 Seagateの独自の経験が、その理由を示しています:フラッシュ・ドライブとハードディスク・ドライブが共存するだけでなく、互いに補完し合う包括的な戦略により、日常的なものから例外的に厳しいものまで、Seagateのストレージ・ニーズをすべて満たすことができます。
Seagateによるこれらのハイブリッド・ストレージ・システムの導入は、2つの技術の相乗効果が現代のデータ・センターの要件に特に効果的であることを示す好例です。フラッシュ・ストレージには、特定のタスクのパフォーマンスを高める役割があります。その一方で、ハードディスク・ドライブはバックボーンの役割を果たし、大容量のデータ・ストレージを処理します。
ハードディスク・ドライブとSSDはどちらも重要ですが、ストレージ技術としては異なり、データの読み取りと書き込みに対するアプローチが根本的に違っています。そして当然ながら、ハードディスク・ドライブはSSDに対してテラバイトあたりのコストで大きな優位性を持っています。スケールアウト・ストレージ・アーキテクチャに必要なのは、予算、容量、ワークロードのパフォーマンスのニーズを満たすように最適化されたメディア・デバイスの組み合わせです。
データ・センターのアーキテクトとオペレータにとって、ストレージ・アーキテクチャの決定を促すいくつかの重要な要素として、高可用性および回復力、パフォーマンス、容量、サポート性、全体的なコストが挙げられます。これらの要素により、ストレージ・インフラストラクチャで効率的かつ経済的に多様で高負荷なワークロードを確実に処理できるようになります。
Seagateのデータ・センターの要件は、研究、設計、製造、B2BおよびB2Cチャネルを網羅する多様な市場プレゼンスなど、自社の複雑な業務に対応する明確な目標によって方向付けられていました。Seagateは、製造業でIoTデバイス、自動化、デジタル化によって生成されるデータの量が増加していることを認識し、ストレージ容量とパフォーマンスをコスト効率よく向上させることに着手しました。この強化は、大量の非構造化データからインサイトを引き出して、ビジネス価値の向上を促すAIとデータ分析を活用するために欠かせません。
Seagateの幅広い重要な業務は、以下によって支えられています。
アナリストは、企業のワークロードに関連するデータの大部分に必要なのは、大容量とわずかな時間でのデータ転送であり、これらはハードディスク・ドライブによってもたらされる容量とTCOの利点に適していると指摘しています。SeagateのITインフラストラクチャ担当VP兼グローバル・ヘッドであるビノド・パシ (Vinod Pasi) は、このパラダイムは、自社のデータ・センター・ワークロードのすべてを効果的に処理するデータ・ストレージ・アーキテクチャの構築におけるSeagateの経験を反映したものであると認めています。
Seagateでのハイブリッド・ストレージ・システムの戦略的な導入は、多種多様なデータ・センター・ワークロードの効率的な管理に役立っています。Seagateは、さまざまなレベルのデータ転送性能と大量のストレージ容量を必要とする具体的なワークロードを特定しました。
例えば、BDWやInformaticaなどの非リアルタイム・レポート・データベースのほか、ODS、TS、PICなどのファクトリ・データベースは、Seagateのデータ・ストレージ・ニーズの大部分を占めています。これらのワークロードには、LinuxおよびWindowsアプリケーションをホストするVMware VM、ファイル共有サービス (NFS、CIFS、SFTP、FTP)、複数のサイト向けのHadoop HDFS、バックアップおよび機械学習アプリケーション向けのMinIOストレージ・クラスタなども含まれ、合計でSeagateのストレージ容量の約90%を占めています。これらのワークロードは、主にハードディスク・ドライブによって処理されます。その理由は、これらのワークロードに必要な容量が大きく、ハードディスク・ドライブ・ストレージのコスト効率が高いためです。
Seagateのストレージ・ニーズの10%を占めるファクトリ・ライン・サポート・データベースやCitrix VDIなど、リアルタイムのデータ転送を必要とするワークロードでは、ハイブリッド・ストレージ・システムのインテリジェントなキャッシングおよびデータ配置機能によって、パフォーマンスが損なわれないようにしています。これらのアプリケーションでは、ハイブリッド・システムに統合されたSSDの薄いレイヤーのメリットが活かされており、データ・ストレージの大部分に大容量ハードディスク・ドライブを活用しつつ、リアルタイムな操作に必要な速度と低レイテンシを実現します。
Seagateのデータ・センター・ワークロードは、企業データの大半がハイブリッド・ストレージ・ソリューションによって効率的に管理されている業界の大まかな傾向を示しています。わずかな時間およびリアルタイムでのデータ転送性能が求められる大容量ストレージ用のハードディスク・ドライブと、リアルタイムおよびウルトラ・リアルタイムでのデータ転送が求められるパフォーマンス集約型タスク用のSSDとのバランスを最適化することで、ハイブリッド・ストレージ・システムは柔軟でコスト効率の高いアーキテクチャを実現します。このアーキテクチャは多様で要求が厳しいデータ・センター・ワークロードに対応しており、オールフラッシュ・インフラストラクチャに伴う非常に高額なコストをかけずに、高性能と拡張性を確保することができます。
クラウド、ハイパースケール、大規模なエンタープライズ・ストレージのアーキテクトは、コスト、容量、パフォーマンスを最適化するために、ストレージ・タイプの最適な組み合わせを選択する傾向にあります。高度なハイブリッド・ストレージ・アレイは、その目的に非常に適しています。SSDは、ウルトラ・リアルタイムのデータ転送が求められるハイパフォーマンスな読み取り集約型のワークロード(ワークロード全体に占める割合は非常に小さい)に最適です。その一方で、ハードディスク・ドライブは、必要に応じて大量のデータにアクセスでき、圧倒的大部分のワークロードを処理します。ハードディスク・ドライブではフラッシュに不向きなワークロードを処理し、フラッシュではハードディスク・ドライブに不向きなワークロードを処理します。高度なハイブリッド・システムを導入することで、アーキテクチャを簡素化し、各ストレージ・メディアを最も必要なときに利用できるようにします。
Seagateのデータ・センターでは、特定の運用ニーズを満たせるようにカスタマイズされたストレージ・ソリューションを組み合わせて使用しています。
以前、Seagateは、性能は高いものの、コストが非常に高額なオールフラッシュ・システムを使用して、いくつかのストレージ・パフォーマンスの要件に対応していました。フラッシュ・メディアには、テラバイト (TB) あたりでハードディスク・ドライブ・メディアの6倍を超えるコストがかかります。同等のパフォーマンスと将来の成長に必要な拡張性を備える、よりコスト効果の高いソリューションを求めていたSeagateは、新たに17台のハイブリッド・ストレージ・システムを導入しました。
Seagateは、ハイブリッド・アレイ以外にも、セキュリティ・カメラ・データ・ストレージ、バックアップ・ターゲット、認証ログ保持などの特定の機能向けに26台のExosハードディスク・ドライブ・ストレージ・システムを導入しています。
50ペタバイトを超えるSeagateのストレージ容量の大部分は、複数のSeagate Exosハードディスク・ドライブによって提供されており、これらはInfinidatハイブリッド・システムと純粋にディスク・ベースのExosストレージ・システムの両方に統合されています。
各ハイブリッド・アレイは、4.6ペタバイトの使用可能なハードディスク・ドライブ・スペースと薄いフラッシュ・レイヤーを備えています。インテリジェントなキャッシング技術によって、さまざまなストレージ・メディア間でのデータ管理を動的に最適化し、変化するワークロードに合わせて調整して、Seagateの要求が厳しいアプリケーションのために高いパフォーマンスを自動的に確保します。このアーキテクチャでは、データ集約型のタスクに対して容量とアクセス速度の両方を最適化することで、データ・ストレージの増加に対する要求を満たし、企業であらゆるワークロードを効率的に管理できるようにします。そして、そのすべてを、TBあたりのTCOを抑えつつ実現します。
ハードディスク・ドライブとSSDは、ストレージ・ソリューションにおいて互いに補完し合います。具体的には、SSDで高速かつ低レイテンシの要件に対応し、ハードディスク・ドライブで大規模な大容量ストレージのニーズに対応します。SSDは一般的に、1ミリ秒未満の非常に低いレイテンシが求められるブロック・タイプとファイル・タイプに最適で、非常にパフォーマンスが高い読み取り集約型のワークロードに適しています。その一方で、ハードディスク・ドライブは、ブロック・タイプ、ファイル・タイプ、オブジェクト・タイプを含むより幅広いファイル・タイプに適しており、特に大容量が不可欠な場合に適しています。ハードディスク・ドライブは、1ミリ秒から100ミリ秒以上にわたる中~高レイテンシが要件となるアプリケーションに最適です。
ほとんどのハイブリッド・ストレージ・システムと同様に、InfinidatのInfiniBoxには、プライマリ・ストレージとしてハードディスク・ドライブが組み込まれています。また、通常よりも大規模なDRAMキャッシュと、セカンダリ・キャッシュとして機能するソリッド・ステート・ティアも備えています。より大規模なDRAMキャッシュによって、さらに多くのデータをCPUの近くに保存できるようになります。これにより、パフォーマンスを高めて、データ配置戦略の効果の向上を支援します。システムのデータのほとんどはハードディスク・ドライブに保存され、大容量ストレージ機能の基盤となっています。書き込みキャッシュ内のデータをスマートに融合し、連続的に書き込むことで、これらのシステムは高い書き込み効率を実現し、フラッシュ・メディアの耐久性への影響を最小限に抑えます。システムのメタデータは、高速で効率的なアクセスを実現するために、トライデータ構造を使用してDRAMに保持され、システムの高いパフォーマンスと拡張性を支援します。
アルゴリズムにより、階層型ストレージ階層の全体でデータ配置をスマートに管理します。システムでは、共に参照および使用される可能性が最も高いデータに関する動的な情報を活用し、メタデータのタグ付けを使用して、アクセス頻度、ブロック・サイズ、読み取り/書き込み頻度、関連するアプリケーションI/Oプロファイルなどの指標をモニタリングします。その後、システムで効率的にデータをプリフェッチして、高い読み取りキャッシュ・ヒット率につなげます。
こうした統合型のアプローチは、高度なハイブリッド・ストレージ・システムでハードディスク・ドライブとSSDの両方の強みを活かして、最も効率的に処理できる場所(大容量ストレージが必要な場合はハードディスク・ドライブ、パフォーマンス強化が必要なタスクの場合はSSD)にワークロードを割り当てる方法を示しています。
Seagateのハイブリッド・ストレージ戦略の導入は、コスト効率と生産性の向上につながりました。これにより、ITインフラストラクチャのコストの削減、バックアップ時間の改善、ロード時間の短縮、トランザクション速度の高速化を含め、年間でストレージ容量1ペタバイトあたりの財務面のメリットがもたらされました。
新しいハイブリッド・システムはコストを抑えつつ従来のオールフラッシュ・アレイの性能を上回る一方で、大幅な容量増加を実現し、大規模なデータベースと分析からファイル共有サービスとVMwareワークロードまでにわたる、さまざまなワークロードに非常に効率的に対応します。このことを自身のITチームのベンチマークが示していると、ビノド・パシは述べています。
こうした変化により、Seagateはデータ・ストレージ業務の合理化を実現し、重要な350TBのデータベースを管理するために、複数のオールフラッシュ・アレイから単一のハイブリッド・システムに移行しました。また、このシフトは、アーキテクチャを簡素化して、サポートとメンテナンスの複雑さを軽減し、より効率的なデータ管理への戦略的な一歩となりました。
上述のITチームは、ワークロードの全体で幅広く、いくつかのパフォーマンス指標における大幅な改善を確認しました。バックアップ時間が90%改善され、数時間から数分に短縮されました。ロード時間が40%短縮しました。トランザクション速度が35%向上しました。クエリーの実行速度が20%以上増加しました。
上述のITチームは、ワークロードの全体で幅広く、いくつかのパフォーマンス指標における大幅な改善を確認しました。バックアップ時間が90%改善され、数時間から数分に短縮されました。ロード時間が40%短縮しました。トランザクション速度が35%向上しました。クエリーの実行速度が20%以上増加しました。
ストレージ・アレイを統合することで、Seagateは資本的支出 (CapEx) と運用支出 (OpEx) の両方を大幅に削減し、全体的な費用をほぼ半減させました。これらのハイブリッド・システムの導入によって、SeagateのIT運用能力が強化されたほか、管理が簡素化され、回復力が向上しました。
こうした変化により、Seagateは容量とパフォーマンスの両方の要件を容易に達成できました。単一のハイブリッド・システムでは、最大17.287PBの有効容量を管理できます。そのため、Seagateは自社のITワークロードの統合を現在進行形で促進するだけでなく、ドライブ1台あたり30TB以上、プラッタ1枚あたり3TB以上を備えるMozaic 3+技術を搭載した最新のExosハードディスク・ドライブを導入しているため、複数の要素によって将来的に自社システムの容量を簡単に拡張することができます。
Seagateのデータ・センター・インフラストラクチャがシンプルで、複雑さが軽減されていることも、大きな利点となっています。より数を絞ったハイブリッド・システムに多種多様なワークロードを統合することで、Seagateは運用を合理化し、異種ストレージ・アレイ環境の管理に伴う諸経費とロジスティクスの課題を低減しました。このように簡素化することで、コストが削減されるだけでなく、運用面の俊敏性も向上し、SeagateのITチームはイノベーションにより注力し、メンテナンスに費やす時間を短縮できるようになりました。このシステムの柔軟性と拡張性は、Seagateの戦略的な方向性を補完し、一般的にオールフラッシュ・ソリューションの拡張時に生じる金銭面および物流面の負担なしで、変化するビジネス・ニーズに合わせてストレージ容量を動的に拡張できるようにしています。
ビノド・パシは、Seagateの意思決定プロセスの核心にある基本的な真実について指摘しています。それは、パフォーマンスと容量のバランスが最も重要であるということです。Seagateで以前導入したオールフラッシュ・アレイは高いパフォーマンスを発揮していましたが、Seagateのような企業の全体的なニーズでは大量のデータ容量も求められます。ハイブリッド・ストレージ・システムはこのようなギャップを巧みに埋めて、ペタバイト級のデータを経済的に保存できる状態を維持しつつ、高いパフォーマンス指標を実現します。こうした均衡は、当面の運用要件をサポートするだけでなく、Seagateが将来的なデータの増加や技術のシフトに対応できるようにします。
IDC『Multi-Client Study, Cloud Infrastructure Index 2023: Compute and Storage Consumption by 100 Service Providers』(2023年11月)