Cargas de trabalho de data center da Seagate totalmente atendidas por sistemas de armazenamento híbrido e de disco rígido
Em uma era de demanda insaciável por dados, a Seagate não é apenas a fabricante líder de soluções de armazenamento; é também uma grande empresa global que gerencia enormes quantidades de dados em seus próprios data centers amplos. Para enfrentar os sistemas de armazenamento totalmente flash envelhecidos, a Seagate viu uma oportunidade de modernizar sua estratégia para atender às necessidades atuais e ao crescimento de dados futuro. A empresa escolheu implantar sistemas de armazenamento híbrido que fornecem capacidade massiva por meio de discos rígidos com uma fina camada de flash, pois eles podem expandir a capacidade de dados massivos com eficiência, sem sacrificar o desempenho de forma alguma. Vários arrays de armazenamento Infinidat InfiniBox foram implantados em vários data centers da Seagate.
Muito foi feito recentemente sobre a adequação de discos rígidos e SSDs para data centers. Há bons motivos de os discos rígidos continuarem a arcar com aproximadamente 90% dos requisitos de capacidade de nuvem e hiperescala.1 A própria experiência da Seagate demonstrou o motivo: Uma estratégia bem elaborada, na qual os discos rígidos e flash não só coexistem, mas se complementam, garante que todas as necessidades de armazenamento da Seagate, desde as mais rotineiras até as excepcionalmente exigentes, são atendidas.
A implantação desses sistemas de armazenamento híbrido pela Seagate é um ótimo exemplo de como a sinergia das duas tecnologias é mais eficiente para atender às demandas do data center moderno. O armazenamento flash tem seu lugar no aprimoramento do desempenho para tarefas específicas, enquanto os discos rígidos formam a base, lidando com o armazenamento de dados massivos.
Discos rígidos e SSDs são tecnologias de armazenamento importantes, mas diferentes, com abordagens fundamentalmente diferentes para a leitura e a gravação de dados. E, é claro, os discos rígidos têm uma vantagem de custo por terabyte significativa em relação aos SSDs. A arquitetura de armazenamento de expansão horizontal requer uma combinação de dispositivos de mídia, otimizados para atender às necessidades de orçamento, capacidade e desempenho das cargas de trabalho.
Para os arquitetos e operadores de data centers, vários fatores importantes estimulam as decisões de arquitetura de armazenamento: alta disponibilidade e resiliência, desempenho, capacidade, capacidade de suporte e custo em geral. Esses elementos garantem que a infraestrutura de armazenamento possa lidar com cargas de trabalho diversas e exigentes de maneira eficiente e econômica.
Os requisitos de data center da Seagate foram definidos por objetivos claros relacionados às operações complexas da empresa, que abrangem pesquisa, design, fabricação e uma presença diversificada no mercado, incluindo canais B2B e B2C. Reconhecendo o crescente volume de dados gerados por dispositivos de IoT, automação e digitalização na fabricação, a Seagate se dispôs a aprimorar sua capacidade de armazenamento e seu desempenho de forma econômica. Esse aprimoramento seria vital para aproveitar a IA e a análise de dados, que geram valor comercial ao obter insights de grandes volumes de dados não estruturados.
A ampla gama de operações cruciais da empresa é ancorada por:
Os analistas observaram que a grande maioria dos dados associados às cargas de trabalho corporativas requerem capacidade massiva e transferência de dados em tempo nominal, que são ideais para a escala e as vantagens de TCO oferecidas pelos discos rígidos. Vinod Pasi, vice-presidente e diretor global de infraestrutura de TI da Seagate, confirma que esse paradigma reflete a experiência da Seagate em criar uma arquitetura de armazenamento de dados que atenda, com eficácia, a todas as suas cargas de trabalho de data center.
A implantação estratégica dos sistemas de armazenamento híbrido da Seagate foi fundamental para o gerenciamento eficiente de sua variedade diversificada de cargas de trabalho de data center. A empresa identificou cargas de trabalho específicas que exigem níveis variados de desempenho de transferência de dados e capacidade de armazenamento massivo.
Por exemplo, bancos de dados de relatórios em tempo não real, como BDW e Informatica, junto com bancos de dados de fábrica, como ODS, TS e PIC, representam uma parte significativa das necessidades de armazenamento de dados da Seagate. Essas cargas de trabalho, que também incluem MVs VMware hospedando aplicativos Linux e Windows, serviços de arquivos (NFS, CIFS, SFTP, FTP), Hadoop HDFS para vários locais e clusters de armazenamento MinIO para aplicativos de backup e machine learning, coletivamente somam cerca de 90% da a capacidade de armazenamento da Seagate. Essas cargas de trabalho são predominantemente atendidas por discos rígidos, devido aos seus requisitos substanciais de capacidade e à relação custo-benefício do armazenamento de disco rígido.
Para cargas de trabalho que exigem transferência de dados em tempo real, como bancos de dados de suporte de linha de fábrica e Citrix VDI, que somam 10% das necessidades de armazenamento da Seagate, os recursos de colocação de dados e cache inteligente dos sistemas de armazenamento híbrido garantem que o desempenho não seja comprometido. Essas aplicações se beneficiam da fina camada de SSDs integradas aos sistemas híbridos, fornecendo a velocidade e baixa latência necessárias para operações em tempo real, enquanto ainda aproveitam os discos rígidos de alta capacidade para o volume do armazenamento de dados.
As cargas de trabalho de data center da Seagate ilustram uma tendência mais ampla do setor na qual a maioria dos dados corporativos é gerenciada de forma eficiente por soluções de armazenamento híbridas. Ao otimizar o equilíbrio entre discos rígidos para armazenamento massivo, que precisa de desempenho de transferência de dados nominal a em tempo real, e SSDs para tarefas que exigem alto desempenho e que precisam de transferência de dados em tempo real ou ultrarreal, os sistemas de armazenamento híbrido oferecem uma solução versátil e econômica para arquitetura eficiente. Essa arquitetura pode lidar com cargas de trabalho de data center diversas e exigentes, garantindo alto desempenho e escalabilidade sem os custos proibitivos associados a uma infraestrutura totalmente flash.
Os arquitetos de armazenamento em nuvem, de hiperescala e grandes empresas tendem a selecionar a combinação mais apropriada de tipos de armazenamento para otimizar o custo, a capacidade e o desempenho. Os arrays de armazenamento híbrido avançado são perfeitos para esse objetivo. Os SSDs são ideais para cargas de trabalho de alto desempenho e leitura intensa que exigem transferência de dados em tempo ultrarreal (uma proporção muito pequena das cargas de trabalho), enquanto os discos rígidos fornecem o acesso necessário a dados massivos e atendem à grande maioria das cargas de trabalho. Os discos rígidos lidam com cargas de trabalho que a flash não deve lidar e a flash lida com cargas de trabalho que os discos rígidos não lidam. A implementação de sistemas híbridos avançados pode simplificar a arquitetura, garantindo que cada mídia de armazenamento seja utilizada quando for mais necessária.
Os data centers da Seagate usam um mix de soluções de armazenamento especiais para atender a necessidades operacionais específicas.
Anteriormente, a Seagate atendia a algumas demandas de desempenho de armazenamento usando sistemas totalmente flash, que forneciam alto desempenho mas um custo significativo: a mídia flash custa seis vezes mais do que a mídia de disco rígido por terabyte (TB). Em busca de uma solução com melhor relação custo-benefício que pudesse oferecer desempenho comparável e a escalabilidade necessária para o crescimento futuro, a Seagate implementou 17 novos sistemas de armazenamento híbrido.
Além dos arrays híbridos, a Seagate emprega 26 sistemas de armazenamento de disco rígido Exos para funções específicas, como armazenamento de dados de câmera de segurança, destinos de backup e retenção de log de certificação.
A maior parte da nossa capacidade de armazenamento, mais de 50 petabytes, é fornecida pelos discos rígidos Seagate Exos, que são integrados nos sistemas híbridos Infinidat e nos sistemas de armazenamento Exos puramente baseados em disco.
Cada array híbrido fornece 4,6 petabytes de espaço útil em disco rígido, além de uma fina camada flash. A tecnologia de cache inteligente otimiza dinamicamente o gerenciamento de dados entre as suas variadas mídias de armazenamento, ajustando-se às cargas de trabalho dinâmicas para garantir automaticamente alto desempenho para as aplicações exigentes da Seagate. A arquitetura atende à demanda por maior armazenamento de dados, possibilitando que a empresa gerencie com eficiência qualquer carga de trabalho ao otimizar a capacidade e a velocidade de acesso para tarefas com volume intenso de dados, tudo isso com um TCO mais baixo por TB.
Discos rígidos e SSDs se complementam em soluções de armazenamento, com os SSDs lidando com requisitos de alta velocidade e baixa latência e os discos rígidos com as necessidades de armazenamento de alta capacidade e grande escala. Em geral, os SSDs são ideais para tipos de arquivo e bloco que requerem uma latência muito baixa de menos de 1 milissegundo, tornando-os apropriados para cargas de trabalho com volume intenso de leitura e alto desempenho. Por outro lado, os discos rígidos são apropriados para uma variedade maior de tipos de arquivo, incluindo tipos de bloco, arquivo e objeto, principalmente nos quais a alta capacidade é essencial. Os discos rígidos são mais apropriados para aplicações com requisitos de latência moderada a alta, variando de 1 a mais de 100 milissegundos.
Como a maioria dos sistemas de armazenamento híbrido, o InfiniBox da Infinidat incorpora unidades de disco rígido rígido como seu armazenamento primário. Ele também inclui um cache DRAM maior do que o normal e uma camada de estado sólido que serve como cache secundário. Com o cache DRAM maior, mais dados podem ser armazenados perto das CPUs, o que aumenta o desempenho e ajuda na eficácia das estratégias de colocação de dados. A maioria dos dados do sistema reside em discos rígidos, que são a base dos recursos de armazenamento massivo. Ao unir dados no cache de gravação de forma inteligente e gravá-los sequencialmente, esses sistemas garantem eficiências de gravação mais altas e minimizam o impacto sobre a resistência da mídia flash. Os metadados do sistema são mantidos na DRAM usando estruturas de dados triplos para garantir acesso rápido e eficiente, contribuindo para o alto desempenho e escalabilidade do sistema.
Algoritmos gerenciam a localização dos dados de maneira inteligente em uma hierarquia de armazenamento em camadas. Os sistemas usam marcação de metadados para monitorar métricas, incluindo frequências de acesso, tamanhos de bloco, frequências de leitura/gravação e perfis de E/S de aplicativo associados, usando informações dinâmicas sobre quais dados têm maior probabilidade de serem referidos e usados juntos. Dessa forma, o sistema faz uma pré-busca dos dados com eficiência, levando a taxas altas de acesso ao cache de leitura.
Essa abordagem integrada ilustra como os sistemas avançados de armazenamento híbrido aproveitam os pontos fortes do disco rígido e do SSD, alocando cargas de trabalho onde elas podem ser tratadas de forma mais eficiente: armazenamento massivo em discos rígidos e tarefas que aumentam o desempenho em SSDs.
A implantação da estratégia de armazenamento híbrido da Seagate levou a uma eficiência de custos e ganhos de produtividade que fornecem benefícios financeiros anuais por petabyte de capacidade de armazenamento, incluindo custos de infraestrutura de TI reduzidos, tempos de backup e de carregamento aprimorados e taxas de transação aceleradas.
Segundo Vinod Pasi, o benchmarking de sua equipe de TI mostra os novos sistemas híbridos superando o desempenho dos arrays totalmente flash anteriores a um custo mais baixo, proporcionando um crescimento de capacidade substancial, acomodando diversas cargas de trabalho com alta eficiência, incluindo tudo, de grandes bancos de dados e análise a serviços de arquivo e cargas de trabalho VMware.
Com a transição, a Seagate pôde simplificar suas operações de armazenamento de dados, passando de vários arrays totalmente flash para um único sistema híbrido para gerenciar seu crucial banco de dados de 350 TB. Essa mudança simplificou a arquitetura e reduziu a complexidade de suporte e manutenção, marcando um passo estratégico em direção ao gerenciamento de dados mais eficiente.
Entre as cargas de trabalho mais abrangentes, a equipe de TI viu aprimoramentos significativos em diversas métricas de desempenho. Os tempos de backup foram aprimorados em 90%, passando de horas para minutos. Os tempos de carregamento diminuíram 40%. As taxas de transação aumentaram 35%. As velocidades de consulta são mais de 20% mais rápidas.
Entre as cargas de trabalho mais abrangentes, a equipe de TI viu aprimoramentos significativos em diversas métricas de desempenho. Os tempos de backup foram aprimorados em 90%, passando de horas para minutos. Os tempos de carregamento diminuíram 40%. As taxas de transação aumentaram 35%. As velocidades de consulta são mais de 20% mais rápidas.
Ao consolidar arrays de armazenamento, a Seagate reduziu significativamente as despesas de capital (CapEx) e as despesas operacionais (OpEx), quase cortando pela metade as despesas gerais. A adoção desses sistemas híbridos aprimorou os recursos operacionais de TI da empresa, simplificando o gerenciamento e aumentando a resiliência.
Com a transição, a Seagate pode facilmente atender aos seus requisitos de capacidade e desempenho. Um único sistema híbrido pode gerenciar até 17.287 PB de capacidade efetiva. Assim, além de facilitar a consolidação da carga de trabalho de TI da Seagate hoje, a Seagate pode facilmente expandir a capacidade dos seus sistemas no futuro por vários fatores, à medida que a empresa implementar seus discos rígidos Exos mais recentes com tecnologia Mozaic 3+ oferecendo mais de 30 TB por disco e mais de 3 TB por prato.
A simplicidade e complexidade reduzida da infraestrutura de data center da Seagate é outro benefício significativo. Ao consolidar uma variedade diversificada de cargas de trabalho em menos sistemas híbridos, a Seagate simplificou as operações, reduzindo as despesas gerais e os desafios logísticos associados ao gerenciamento de um panorama de arrays de armazenamento heterogêneos. Essa simplificação se traduziu não só em economia de custos, mas também em maior agilidade operacional, permitindo que a equipe de TI da Seagate se concentrasse mais na inovação e menos na manutenção. A flexibilidade e escalabilidade dos sistemas complementaram o direcionamento estratégico da Seagate, fornecendo a habilidade para expandir dinamicamente a capacidade de armazenamento de acordo com as crescentes necessidades dos negócios, sem os encargos financeiros e logísticos normalmente associados ao dimensionamento de soluções totalmente flash.
Vinod Pasi observa uma verdade fundamental no cerne do processo de tomada de decisão da Seagate: o equilíbrio entre desempenho e capacidade é essencial. Embora seus arrays totalmente flash implantados anteriormente oferecessem alto desempenho, as necessidades holísticas de empresas como a Seagate também requerem capacidades de dados volumosas. Os sistemas de armazenamento híbrido preenchem essa lacuna habilmente, fornecendo métricas de alto desempenho sem sacrificar a capacidade de armazenar petabytes de dados economicamente. Esse equilíbrio não só cumpre os requisitos operacionais imediatos, mas posiciona a Seagate para lidar com o crescimento de dados futuro e as mudanças tecnológicas.
Estudo com vários clientes da IDC, Cloud Infrastructure Index 2023: Compute and Storage Consumption by 100 Service Providers, novembro de 2023