A Loongson é uma empresa chinesa que desenvolve processadores próprios, sendo a criadora da arquitetura LoongArch, uma alternativa as da Intel e AMD. Uma das características marcantes é a compatibilidade com sistemas operacionais Linux e Unix, permitindo que os desenvolvedores criem software utilizando ferramentas e linguagens de programação já existentes.
O ecossistema de software para LoongArch ainda está em desenvolvimento, com menos opções de software otimizado para essa arquitetura em comparação com x86 e ARM. Os LoongArch são frequentemente utilizados em servidores e estações de trabalho, onde a demanda por alto desempenho e confiabilidade é maior. Assim a empresa está expandindo o uso de seus processadores nestes ambientes.
Um exemplo desta expansão é a inclusão de um driver EDAC (Error Detection And Correction) no kernel Linux garantirá a integridade dos dados em sistemas críticos, como servidores, ao detectar e corrigir automaticamente erros de memória. Os modelos de processadores Loongson 3A5000, 3C5000, 3D5000, 3A6000 e 3C6000 são os primeiros a serem suportados por esse driver.
O que é o driver EDAC para LoongArch + ECC?
ECC significa “Error-Correcting Code”, ou código de correção de erros. É uma tecnologia usada em memórias para detectar e corrigir automaticamente erros de bits. O driver EDAC funciona continuamente, verificando a integridade dos dados na memória RAM e corrigindo os erros encontrados. Caso a correção não seja possível, o sistema alertará para que o usuário tome as medidas necessárias, como salvar os dados e reiniciar o computador.
Erros na memória podem causar falhas no sistema, perda de dados e até mesmo a corrupção de arquivos. O driver EDAC ajuda a prevenir esses problemas, contribuindo para uma maior estabilidade do sistema, reduzindo a ocorrência de travamentos e reinícios inesperados. Sistemas que utilizam memória ECC e o driver EDAC são mais confiáveis.
O que são erros de memória?
São alterações indesejadas em um ou mais bits de informação armazenados na memória RAM de um computador. Imagine-a como uma série de pequenos interruptores, cada um representando um bit de informação (0 ou 1). Um erro de bit ocorre quando um desses interruptores muda de estado espontaneamente, alterando o valor original do dado.
Campos eletromagnéticos externos, como aqueles gerados por outros componentes do computador ou por dispositivos próximos, podem causar interferência na memória, levando a erros de bits. Com o tempo, as células de memória podem se degradar, aumentando a probabilidade de erros.
Erros de bits podem corromper os dados armazenados na memória, levando a resultados imprevisíveis nos programas em execução, causando travamentos, reinicializações inesperadas e outras instabilidade do sistema. Em casos mais graves, podem levar à perda permanente de dados.
Fontes: links no texto e imagem