
Pense nessa ocasião: você aprova um servidor corporativo com CPU “de sobra”, a VM sobe rápido e, na primeira semana, o ERP começa a “engasgar” sem motivo aparente.
O que quase ninguém te conta no comitê de compra é simples: em servidores para empresas, performance não é sobre o “processador mais forte”, e sim sobre o caminho completo do dado (CPU → memória → rede → storage → aplicação).
Se você quer evitar o clássico “CPU forte, storage fraco”, faça isso antes de ir para produção:
1) Defina a métrica que manda no seu workload: latência p95, não “média”.
2) Meça I/O por tipo: leitura, escrita, aleatório e sequencial.
3) Valide fila de disco e tempo de espera por I/O no SO/hipervisor.
4) Rode teste sintético (fio/DiskSpd) com bloco e profundidade de fila parecidos com o real.
5) Faça um “go/no-go” com critérios numéricos de latência e throughput.
Régua técnica para projetos de servidor empresarial: se você não consegue explicar “qual latência p95 aceitamos” e “qual IOPS precisamos”, você ainda está comprando no escuro, mesmo com a melhor CPU do mundo.
CPU é fácil de vender porque é visível: núcleos, GHz, geração. Storage é onde a dor aparece porque “parece detalhe” até a aplicação entrar em carga.
Na prática, o gargalo se manifesta como:
• Usuário reclamando de lentidão “intermitente” (picos).
• Banco de dados com tempo de resposta irregular.
• Backup que invade janela de produção.
• VM com CPU baixa, mas travando em I/O wait.
Isso é contraintuitivo para muita liderança: CPU ociosa não significa folga; pode significar que a CPU está esperando o storage.
Use latência p95 (ou p99) do storage. A média esconde picos que quebram experiência e SLAs.
Para referência de observabilidade e troubleshooting, veja contadores e boas práticas do Windows e do ecossistema de performance:
• Microsoft (contadores/visão de disco): https://learn.microsoft.com/en-us/windows-server/administration/windows-commands/typeperf
• VMware (visão de latência e performance em vSphere): https://docs.vmware.com/en/VMware-vSphere/index.html
• SNIA (fundamentos e padronização de storage): https://www.snia.org/education
Vamos para um caminho bem objetivo, do tipo que um Coordenador de TI consegue aplicar em projeto e o CEO entende como redução de risco.
Sem isso, você só tem opinião. Com isso, você tem especificação.
4 números mínimos:
• IOPS (leitura e escrita).
• MB/s (throughput).
• tamanho de bloco (ex.: 4K, 8K, 64K).
• latência p95 alvo (em ms).
Exemplo prático: se seu banco trabalha com páginas de 8 KB, testar só com 64 KB dá uma falsa sensação de throughput alto e latência “bonita”.
Quando o fornecedor fala “X GB/s”, pergunte: em qual tamanho de bloco?
Fórmula útil:
IOPS ≈ (MB/s × 1024) ÷ (Bloco em KB)
Exemplo ilustrativo: 800 MB/s com bloco de 8 KB ≈ (800×1024)/8 ≈ 102.400 IOPS. Parece muito, mas só vale se a latência p95 ficar dentro do alvo e se o perfil for compatível (sequencial vs aleatório).
Para ambientes Linux, fio é comum. Para Windows, DiskSpd costuma ser a escolha. O ponto não é a ferramenta, e sim a disciplina:
• Defina mix (70/30 leitura/escrita, por exemplo) conforme a aplicação.
• Ajuste iodepth (fila) para simular concorrência.
• Colete latência p95/p99, não só throughput.
Se você só reporta “MB/s”, você está testando cópia de arquivo, não transação.
Um gargalo “parecido com storage” pode ser:
• rede saturada entre host e storage (ou entre nós).
• cache insuficiente para o padrão de leitura.
• RAID/paridade mal dimensionado para escrita aleatória.
• discos com latência variável sob pico (principalmente em “noisy neighbor” interno).
Use esta matriz antes de aprovar a virada para produção. Ela “força” a conversa certa com integrador, time de infraestrutura e aplicações.
| Item | Como medir | Sinal de risco | Ação |
| Latência p95 de leitura | Hipervisor/SO + APM | Picos frequentes (mesmo com CPU baixa) | Rever perfil de I/O e cache |
| Latência p95 de escrita | fio/DiskSpd + counters | Fila cresce e commits atrasam | Rever proteção, RAID e layout |
| IOPS sustentado | Teste 30–60 min (não 2 min) | Performance cai com o tempo | Checar throttling e tiering |
| Queue depth / fila | PerfMon / esxtop / iostat | Fila alta com latência alta | Reduzir contenção e paralelizar |
| “I/O wait” da CPU | Top/PerfMon/APM | CPU ociosa + app lenta | Tratar storage como gargalo |
Em análises de incidentes, um padrão aparece muito: picos de latência em horários previsíveis.
Quando você cruza:
• janela de backup/snapshot;
• tarefas de antivírus/EDR no host;
• jobs de ETL/relatórios;
• e aumento de acessos de usuários,
o storage vira “o gargalo que não estava no projeto”, porque o sizing foi feito com base em capacidade (TB) e não em capacidade transacional (IOPS/latência).
Em 2026, com mais telemetria e mais dependência de SaaS + integrações, variabilidade virou o novo inimigo. Por isso p95/p99 importam mais do que “pico teórico”.
Criptografia, inspeção, auditoria e EDR podem alterar perfil de I/O e CPU. O erro é tratar segurança como “camada depois”.
Para o Coordenador de TI, a dica é: se o projeto envolve requisitos de conformidade, planeje testes com as mesmas políticas habilitadas que irão para produção.
Leia mais:
Subutilização de servidores: onde o sizing falha na vida real
Vida útil real de servidores: como planejar refresh sem susto
Se a sua objeção é o receio de mudar fornecedor, dá para começar com um passo controlado: assessment de performance (telemetria, testes e critérios go/no-go) e um plano de evolução por fase.
Quer validar se você está comprando performance ou gargalo? Agende uma conversa com nossos especialistas e traga seus números (IOPS, latência e perfil de aplicação).
Priorize latência p95/p99 (leitura e escrita), IOPS sustentado (não só pico), throughput (MB/s) e indicadores de fila/queue depth no SO ou hipervisor. A média de latência costuma mascarar picos que derrubam a experiência do usuário.
Um sinal forte de gargalo de storage é CPU baixa com aumento de I/O wait, fila de disco subindo e latência p95 alta. Se a CPU estiver alta de forma constante e a latência de I/O estiver saudável, o problema tende a ser computacional (CPU/RAM/aplicação) e não o subsistema de disco.
Sim. Rode testes sintéticos (fio em Linux ou DiskSpd em Windows) com tamanho de bloco, mix de leitura/escrita e profundidade de fila parecidos com o workload real. Colete latência p95/p99 e IOPS sustentado por 30–60 minutos, e defina critérios go/no-go antes do corte.
Confira as tendências e desafios da área da tecnologia para 2021Estamos vivendo as primeiras semanas de 2021 e, em várias empresas, o planejamento estratégico está em fase avançada de elaboração ou mesmo já nos primeiros movimentos de execução. ...Ler notícia
Por que apostar em workstations híbridas aumenta a segurançaColoquese nessa situação: Perder algumas horas de trabalho por uma queda na nuvem ou, pior, sofrer um ataque porque todos os dados sensíveis da empresa que estão em servidores externos. ...Ler notícia
Por que escolher o Access Point HPE Aruba 650 Wi-Fi 6E?Novos dispositivos conectados surgem a cada mês na sua empresa e a rede sem fio começa a apresentar lentidão em reuniões importantes. O tempo de resposta impacta diretamente a ...Ler notícia 
