(Fiberwdm Todos os direitos reservados)
Este caso apresenta a solução de otimização da nossa empresa para os problemas de estabilidade de serviço causados pela implantação de módulos ópticos multimodo de 100G na rede ativa de um cluster de computação de alta capacidade. Por meio da análise das questões de compatibilidade e adaptação entre a distância de transmissão e os módulos/cabos ópticos, foi formulada uma solução de substituição baseada em cenários para módulos ópticos multimodo/monomodo, que resolveu completamente as falhas de rede e garantiu a estabilidade da comunicação entre os racks no cluster de computação de alta capacidade.
I. Contexto do Projeto
Uma empresa de clusters de computação implantou
Módulos ópticos multimodo QSFP28 100G SR4
Em larga escala, em sua rede ativa para interconexão de nós de computação e dispositivos de rede entre racks, ocorreram frequentes problemas de instabilidade de comunicação durante a operação, afetando o agendamento normal e a transmissão de dados do cluster de computação. Portanto, foi necessário identificar os problemas e formular uma solução otimizada.
II. Resolução de Problemas e Análise das Causas Principais
Nossa equipe técnica realizou uma investigação completa da topologia da rede em funcionamento, dos links de transmissão óptica e da configuração do hardware, e identificou o problema principal como a incompatibilidade entre as especificações de transmissão dos módulos ópticos e a distância real do link, conforme detalhado abaixo:
-
O cliente possui um grande número de cenários de interconexão entre armários, e a distância real de transmissão de alguns enlaces de fibra óptica supera em muito as expectativas, chegando a ultrapassar 100 metros.
-
O QSFP28 100G SR4 é um módulo óptico multimodo, e sua distância de transmissão é limitada pelas especificações dos cabos ópticos multimodo suportados: cabos ópticos OM3 suportam uma distância máxima de transmissão de 70 metros, e cabos ópticos OM4 suportam uma distância máxima de transmissão de 100 metros. A transmissão a longa distância sem margem de segurança leva à atenuação da potência óptica e à distorção do sinal, causando instabilidade nos serviços.
-
Embora algumas ligações de curta distância (dentro de 50 metros) não excedam o limite de distância, os cabos MPO que os suportam apresentam alta perda de inserção, o que agrava ainda mais o problema de atenuação do sinal em ligações multimodo.
III. Solução Personalizada
Combinando a distribuição da distância de enlace do cluster de poder computacional, a compatibilidade do hardware de rede em operação e o princípio da otimização de custos, foi formulada uma solução otimizada baseada em cenários para o dimensionamento de módulos ópticos e cabos ópticos classificados por distância de transmissão. O princípio fundamental é "otimizar as instalações de suporte multimodo para curtas distâncias e substituí-las por módulos ópticos monomodo para longas distâncias".
-
Para enlaces entre armários com mais de 50 metros: Substitua uniformemente os módulos ópticos multimodo QSFP28 100G SR4 por módulos ópticos monomodo QSFP28 100G LR4. Os módulos ópticos monomodo suportam transmissão de longa distância de até 10 km, atendendo plenamente aos requisitos de enlaces interarmários de longa distância e resolvendo fundamentalmente o problema da limitação de distância.
-
Para enlaces de curta distância, até 50 metros: Mantenha os módulos ópticos multimodo SR4 de 100G e substitua os cabos ópticos de suporte por cabos multimodo MPO de baixa perda de inserção, com especificação OM3/OM4, para reduzir a perda de inserção do enlace e melhorar a estabilidade da transmissão de sinal em enlaces multimodo. Ao mesmo tempo, aproveite a vantagem de custo dos módulos ópticos multimodo para controlar o custo de transformação dos enlaces de curta distância.
IV. Efeitos da Implementação
Após o cliente concluir a transformação de todos os links de rede ativos e a atualização de hardware de acordo com esta solução, os seguintes resultados foram alcançados:
-
A instabilidade nos negócios causada pela incompatibilidade dos links de transmissão óptica foi completamente eliminada, e a taxa de perda de pacotes e a flutuação da latência na transmissão de dados entre os gabinetes no cluster de poder computacional retornaram aos indicadores padrão.
-
A solução de configuração de hardware baseada em cenários equilibra a estabilidade da transmissão e o custo de transformação, evitando transformações desnecessárias de modo único em toda a extensão do enlace e controlando efetivamente o investimento em otimização de rede do cluster de poder computacional.
-
Os padrões de compatibilidade para módulos ópticos e cabos ópticos em rede foram padronizados, fornecendo uma base clara para a seleção de hardware de transmissão óptica para a subsequente expansão e ajuste de topologia do cluster de poder computacional.
V. Resumo do Caso
A interconexão de alta densidade e alta largura de banda entre gabinetes em um cluster de computação impõe requisitos extremamente elevados para a compatibilidade dos enlaces de transmissão óptica. O módulo óptico multimodo 100G SR4 é adequado apenas para cenários de interconexão de curta distância (≤100 metros) com cabos ópticos OM3/OM4. Caso haja demanda por interconexão de longa distância entre gabinetes, o módulo óptico monomodo 100G LR4 deve ser a opção preferencial. Na implantação de comunicação óptica, é fundamental selecionar os módulos ópticos com precisão, considerando a distância de transmissão real e as especificações do cabo óptico, além de priorizar o uso de cabos de baixa perda de inserção para garantir a operação estável e de longo prazo dos enlaces de alta largura de banda.