Boas!
Pessoal, estou com um comportamento muito estranho no meu PC. De uns tempos pra cá, aleatoriamente ele reinicia de forma súbita (como se tivesse pressionado o botão reset do gabinete), ou mesmo ele simplesmente “desconecta” o SSD interno, causando CPU indo a 100% e erros de I/O por todo o sistema.
Ele começou com esse comportamento há mais ou menos uns 9 meses, e não fiz nenhuma alteração “grande” nele (não troquei de distro - nem mesmo formatei, nem troquei nenhum componente de hardware). No início, fazia isso uma ou duas vezes por semana, no máximo. Eu desmontava, fazia uma limpeza geral nos componentes, e o problema parecia sanado.
Porém, de mais ou menos um mês pra cá, está bem impossível. Eu percebi que ele geralmente faz isso quando entra em algum workload muito alto. Como trabalho com desenvolvimento .NET, principalmente quando eu abro o JetBrains Rider - durante a inicialização, ele joga tudo a 100%, desde disco e CPU até GPU. Tem vezes que ele faz isso 4, 5 vezes no dia (ou até mais), assim como tem vezes que eu passo dois ou três dias com ele ligado direto e não acontece nada… ATÉ eu abrir o JetBrains Rider, e PAH, dá algum problema desses.
Curiosamente, se eu faço testes de benchmark (CPU com CPU-X, GPU com FurMark), ele não apresenta nenhum problema. Já cheguei a deixar 2h ele rodando os testes em paralelo, e nada. Também já rodei o Memtest e não deu nenhum problema. O SSD não cheguei a fazer um teste “real”, no máximo coloquei ele no meu laptop (que é mais fraco) e fiz as mesmas coisas, e nele não apresentou nenhum problema.
Minha dúvida é se alguém já experienciou algo parecido. Não necessariamente com o Rider, mas algum tipo de comportamento “anormal” quando o PC entra em um workload muito alto. E também se eu consigo fazer algum tipo de diagnóstico para saber onde realmente está o problema: se é a fonte que não está aguentando entregar energia suficiente, se é algum componente (memória, SSD, GPU, placa mãe) apresentando falha intermitente, se é algum bug do sistema que uma formatada resolveria…
Já cheguei a testar alterações de software, como trocar a versão dos drivers da GPU, testar outro kernel, limpar a BIOS (via interface e retirando a pilha do CMOS). Também, como dito, fiz testes de stress na CPU, na GPU, teste de integridade nas memórias e “teste de padaria” no SSD, colocando ele no meu laptop (que tem um hardware mais fraco, porém a GPU também é Nvidia e o processador é Intel) da forma como estava (sistema, sofwares, arquivos etc), e rodou tranquilamente.
Se vale de alguma coisa, essas são as specs do meu PC:
Placa mãe: Biostar B550M-H
CPU: AMD Ryzen 5 3600X
Memória: 2x 32GB DDR4 Corsair
SSD: Kingston NV1 1TB M.2
GPU: Asus Nvidia GTX 1660 Super OC 6GB c/ driver nvidia-driver-580-open
SO: Linux Mint 22.2 Cinnamon c/ Kernel 6.8.0-86-generic
Obrigado desde já!
