Ryzen 5 1600 - PC Reinicia e Congela, Ambos De Maneira Aleatória

Nossa… até Ryzen 7 1700X está havendo este problema?

No meu caso, não importa se o sistema está ocupado ou ocioso, ele congela e reinicia a qualquer momento, independente da forma de uso.

Você disse que está deixando sempre algo rodando para evitar que o CPU entre em modo ocioso… isso me parece uma situação chata, visto que você precisa sempre estar de olho nisto…

Já experimentou desabilitar o “Global C-State Control” no BIOS, ou adicionar o parâmetro “processor.max_cstate=1" no GRUB?

É esse o problema fundamental. Os núcleos Ryzen zeram a própria voltagem quando estão ociosos e não é sempre que o Linux consegue “reengatar” o processador quando ele entra nesse estado. A solução “deixar todos os núcleos sempre ocupados” é válida, mas você pode deixar o Linux cuidar disso pra você com o parâmetro do GRUB.

1 curtida

Esse parâmetro faz o que exatamente?

Para mais detalhes eu deixei um link aqui em cima:
https://www.dell.com/support/article/pt-br/qna41893/o-que-é-c-state

Mas em linhas gerais, os C-States são modos de economia de energia que são ativado quando um dos núcleos do processador não está rodando nada. Tem vários C-States, e quanto maior o número maior a economia de energia, mas também mais “desligada” fica a CPU. Esse parâmetro limita o quanto a CPU pode “desligar” enquanto está ociosa, já que se os Ryzen “desligarem” demais e a placa mãe não cooperar com o Linux, dá esse bug.

1 curtida

“Interrompe os principais clocks internos da CPU por meio de software; a unidade de interface de barramento e o APIC são mantidos em funcionamento, na velocidade máxima”
Fonte: https://www.dell.com/support/article/pt-br/qna41893/o-que-é-c-state?lang=pt

Para adicionar ao GRUB:

sudo nano /etc/default/grub

Na linha “GRUB_CMDLINE_LINUX_DEFAULT=”, adicione “processor.max_cstate=1”, ficará mais ou menos assim:

GRUB_CMDLINE_LINUX_DEFAULT=“splash quiet processor.max_cstate=1”

Por fim, atualize o GRUB:

sudo update-grub2

Reinicie.

2 curtidas

Para evitar ficar repetindo “processor.max_cstate=1”, estarei abreviando para C1.

Por 6 meses usei C1 no GRUB, e não houve congelamento, nem reinicialização durante estes 6 meses, até havia esquecido que tenho este problema com Ryzen, mas acabei me interessando em tentar identificar a raiz do problema, e, caso me certificar que seja defeito de fabricação, irei solicitar o RMA da AMD.

Nos últimos 20 dias, tenho experimentado adicionar outros C-States ao GRUB.

C5: Sistema congelou e/ou reiniciou com 20 minutos de uso.
C4: Sistema congelou e/ou reiniciou com algumas horas de uso.
C3: Sistema congelou e/ou reiniciou com alguns dias de uso.
C2: Sistema congelou e/ou reiniciou com alguns dias de uso.
C1: Sistema não congelou e nem reiniciou por 6 meses.

Quando apliquei o C3 ao GRUB, o sistema durou alguns dias sem problemas, até pensei que poderia usá-lo, visto que é mais econômico que C1, mas para minha surpresa, após alguns dias ele congelou e reiniciou (mesma coisa com C2).

Um fato curioso… eu retornei o C1 ao GRUB, e por incrível que pareça, o sistema operacional congelou após alguns dias, coisa que não aconteceu durante 6 meses, o que me fez perceber que C1 ainda sim não é uma solução absoluta para o problema.

Nos próximos dias, estarei desabilitando o “Global C-State Control”, para ver por quanto tempo o sistema ficará sem dar problemas.

Caso o problema persista, irei solicitar o RMA da AMD.

2 curtidas

O meu já saiu da garantia :sob:

Vlw @Capezotte e @ewertonurias deu pra entender bem o que é.

Falando nisso lembro que a uns anos atrás tinha um script que rodava e se não desse problema com ele vc não teria problemas de congelamento dos Ryzen 1 geração. Alguém já testou ele?

Edit: Acho que é esse aqui ryzen-test

1 curtida

Segundo Rodrigo Baltar, “foi detectado uma falha de projeto nos processadores, e a AMD está fazendo Recall de todos processadores fabricados até 25ª semana pós lançamento.”

Para saber se o seu processador está vulnerável à esta falha, basta verificar a informação que está na chapa dele.

image

“UA 1703” significa que “foi fabricado em 2017, na 3ª semana”, ou seja, até o “UA 1725”, a AMD está trocando “todos os processadores”.

Caso você não queira abrir o computador, há outra forma, que é explicado no vídeo dele: https://youtu.be/sx8jrMnKWBw

Segundo Rodrigo Baltar, a AMD parece dar 3 anos de garantia para os Ryzens (ele não tem certeza em relação ao tempo de garantia RMA), por isto estou te falando isto, talvez haja uma chance de você trocá-lo por um novo, visto que você mencionou isto:

2 curtidas

Eu entrei em contato com a Dell, mas eles não falam nada. Eles querem que eu pague praticamente R$ 400,00 para eles me orientarem a EU fazer uma formatação e outras coisas mais. Falam que se o sistema não estivesse bom, devolveriam o dinheiro mas o critério deles é bem subjetivo. Eles devem saber desses problemas nos Inspiron 5675 deles mas não ajudam ao usuário.

3 curtidas

Eu lembro que tinha dois problemas. O pior era esse principalmente nos ryzen 7 que davam “segmentation fault” durante uso pesado. Na época eu rodei esse teste e o meu funcionou sem problemas. O outro era esse do C-State que travava aleatoriamente, mas apenas durante ocioso ou uso bem leve. Esse é o meu caso.

Já faz quanto tempo que você tem esse CPU?
Dois anos e meio

Os problemas começaram logo quando adquiriu ele?
Sim

Depois que você desabilitou o Global C-State Control, os problemas pararam?
Sim

Já faz quanto tempo que você desabilitou isto no BIOS?
Um ano e meio.

1 curtida

Estou rodando o script aqui… já tem uns 15 minutos e nada de erro.
Preciso deixar por muito tempo??

Edit: Agora deu isso aqui e parou de usar a cpu em 100%

Eu entrei em contato com a AMD, vi que o processador é desse lote, mas ele estão querendo tirar o corpo fora. Estou começando a ficar chateado com isso. Pior é que eles não querem admitir que houve erro no lote.

Talvez seja coisa da AMD Brasil…

A solução é sim desabilitar este maldito Global C-state Control! Muito obrigado pois salvou meu setup. Estava desistindo pois em todos os foruns, até aqui, todo mundo culpava Fonte, Memoria, GPU e até tomada… Não tem nada a ver com Hardware… Desabilte este Global C-state Control no Adavanced no setup da placa mãe e seja feliz como eu! Muito obrigado… No clube do hardware só falaram que era hardware.

3 curtidas

Sim, desabilitar o Global C-State Control no setup da BIOS solucionou o meu problema com reinicializações, já faz mais de 1 ano que desabilitei e não tive nenhuma reinicialização.

Eu continuei tendo “congelamentos de sistema”, mas também resolvi isto, foi só retornar o valor da frequência da RAM de 2666 MHz para AUTO (2133 MHz), e os congelamentos pararam.

Mas eu gostaria de deixar uma observação muito importante aqui, desabilitar o Global C-State Control infelizmente não é a solução para TODAS as pessoas, eu participei de uma discussão envolvendo centenas de usuários com problemas de reinicializações, e uma grande parcela disse que desabilitar o Global C-State Control NÃO RESOLVEU para eles.

Também gostaria de pedir desculpas por não ter retornado à este tópico, eu havia aberto outros tópicos em outros locais (fóruns, redes sociais…), e na maioria deles eu postei a solução, mas acabei me esquecendo deste aqui.

Resumindo…

  1. Talvez desabilitar o Global C-State Control na BIOS pode resolver o problema com reinicializações (funcionou comigo e também com o amigo acima);

  2. Retirar o overclock da RAM resolveu o meu problema de congelamento de sistema.

Obrigado à todos que colaboraram com essa discussão :clap: :clap: :clap:

1 curtida

Este tópico foi fechado automaticamente 3 dias depois da última resposta. Novas respostas não são mais permitidas.