Estou recebendo congelamentos em qualquer disto Linux

Fala pessoal tudo certo?!
Já tem uma semana que estou sem dormir batendo a cabeça para resolver um problema relacionado a congelamentos em qualquer Distro Linux, vou tentar listar com detalhes o meu problema.
Obs: Windows funciona perfeitamente.
Meu PC:

  • Processador Intel® Core™ i7-4790
  • G1.Sniper B5 Intel® B85 Chipset
  • SSD Kingston A400 480GB
  • PLACA DE VIDEO GALAX GEFORCE GTX 1060 3GB GDDR5 EXOC WHITE 192-BIT, 60NNH7DVM3NW
  • 12GB de Memoria RAM DDR3 1333mhz
  • Fonte Redragon RGPS 500W

Então vamos ao meu problema, quando estou usando uma Distro Linux seja ela qual for com KDE,Gnome e etc, meu PC simplesmente congela, se eu estiver jogando, vendo algum vídeo ou ouvindo musica o audio entra em loop, até o pc desligar.
Quando ocorre o travamento, tanto o mouse quanto o teclado param de funcionar, e todo o sistema de iluminação dos periféricos são cortados.
O travamento ocorre de forma aleatória, as vezes eu consigo usar o pc por horas sem da problemas, porem se eu começar a executar varias tarefas ao mesmo tempo ou jogar, o problema acontece em questão de minutos.

Então vou falar um pouco sobre oque eu tentei fazer para resolver o problema e alguns testes que eu realizei.
Antes de mais nada gostaria de acrescentar um detalhe que talvez seja pertinente.
Após acontecer os problemas eu instalei o High Sierra (MAC OS) o famoso Hackintosh , após a instalação tudo funcionava perfeitamente, porem eu recebi o mesmo problema que eu recebo no Linux, é completamente idêntico, então resolvi voltar para o Linux pois acreditei que seria mais fácil de resolver o problema através dele.

Voltando ao Linux realizei vários testes como:
Trocar de Distro
Trocar o Kernel para versão atualizada e para versão mais antiga.
Trocar o driver de Vídeo de Proprietário para Open Source.
Rodei testes de Memoria RAM, mas não foi encontrado problemas.
Desativei aceleração de hardware em aplicativos e navegadores.
A BIOS se encontra atualizada.
O firmware do SSD esta atualizado e a saúde do SSD esta em 91% sem nenhum setor danificado ou em alerta, mas vale ressaltar que o Linux diz que meu SSD esta em 91 graus, e não acontece variação de temperatura fica sempre nos 91.
Verifique o uso da CPU e da Memoria RAM, em momentos que o problema acontece nada chegou a ficar 100%, e as temperaturas estavam normais, incluindo a da GPU.

Peço desculpa pela extensão do texto, qualquer ajuda ou sugestão será muito bem vinda, pois já estou angustiado com esse problema, pra min é muito importante que o problema seja resolvido pois esta relacionado diretamente a estudos e trabalhos.

O mais estranho é não estar congelando também com o windows, me parece ser alguma coisa de hardware.
Pensando assim, talvez no Linux alguma situação leve a algum uso extremo que não ocorre no windows, e daí iniciaria o problema.

Pode parecer besteira, mas eu começaria com uma bela faxina na máquina (estamos falando de 4a geração, então possivelmente já tem alguma idade).
Daquela que se fosse um avião pode chamar de “Check D”. Desmonta tudo, limpa (especialmente coolers e contatos) e remonta a máquina.

1 curtida

Fala cara, muito obrigado pela atenção, então recentemente comprei um novo cooler para o processador, e fiz toda a limpeza da maquina, troca de pasta termica e etc.
Eu também acredito que seja problema de Hardware, agora oque é eu não sei, mas acredito que a placa de video pode ser descartada.
Eu acredito que o problema esta vindo ou do SSD ou da Memoria RAM, mesmo a RAM não apresentando problemas e o SSD estando com uma saúde considerável (91%).
Em relação do Linux estar levando o meu pc para algum uso extremo, cheguei a monitorar isso, e pelo menos em relação a Memora RAM e CPU isso não aconteceu em nenhum momento, em relação ao SSD não consegui observar se estava em 100% no memento em que travou.
Também não descarto a possibilidade de ser algo relacionado ao Processador e a Placa Mãe, talvez algum Driver esteja causando o problema.

Esses erros travando geral com som e mouse são coisas bem baixo nível de hardware ou drivers.

Causas:

  1. Processador com defeito especialmente no modo de gerenciamento de energia (os C-States). Isso pode ser uma falha de fábrica.
  2. Falha de hardware nas conexões ou ainda hardware danificado mesmo. Já tive problema com isso por conta de placa de vídeo mal encaixada (depois que eu viajei com o desktop no carro, a trepidação causou mau contato). Também já aconteceu de ter um cabelo na hora que eu encaixei a memória na placa mãe e travar aleatóriamente.

Possíveis correções:

  1. Desativas os c-states da intel através da adição do parâmetro de kernel no boot intel_idle.max_cstate=0 ou ainda desativando os C-states pela BIOS.
  2. Ao iniciar o computador, coloque o “governor” do processador em modo “performance” e veja se ocorre travamento. cpupower frequency-set -g performance
  3. Retirar a placa de vídeo e conectá-la novamente (talvez umas 3x pra garantir contato), se possível adicionar suporte. Isso pode resolver especialmente se vc fez movimentação/limpeza e não retirou a placa de vídeo, ou ainda ficou sujeira encaixada no slot durante a reconexão.
  4. Verificar visualmente a placa mãe contra possíveis arranhões. Pode ser que a chave de fenda tenha escapado durante algum processo de montagem e danificou algum componente da placa mãe (ou trilha elétrica).
  5. Retirar a placa gráfica e usar o computador com a placa onboard para verificar a ocorrência do problema. Caso não aconteça, teste uma segunda placa de vídeo. Se acontecer com uma outra placa, o problema pode estar na placa mae. Se não acontecer com outra placa, o problema pode estar na sua placa de vídeo.
  6. Adicione a opção de parâmetro de kernel memtest=1 Isso fará com que o kernel faça um teste rápido na totalidade da memória e se houver problema de memória já vai travar na inicialização.

Para adicionar um parâmetro de kernel, edite manualmente a entrada de boot no grub de modo parecido a esse vídeo, mas adicionando os parâmetros que eu citei.

2 curtidas

Aparentemente a solução é essa.
Poderia me explica a diferença entre.
intel_idle.max_cstate=1
'intel_idle.max_cstate=0`
E em qual situação é indicado o 0 e o 1
Mesmo tendo o problema como resolvido ainda vale a pena colocar o governor em modo performance?

São os níveis de “modo de espera” que a Firmware/BIOS pode deixar o processador entrar. Nos processadores da Intel pode não funcionar (ou não precisa) usar a instrução global, mas sim uma específica para o driver dela (intel_idle). Pode ir de zero a seis segundo esse artigo

ou de zero a nove segundo a documentação do kernel 5.4 (buscar por intel_idle)

https://www.kernel.org/doc/html/v5.4/admin-guide/kernel-parameters.html

Por algum motivo o seu processador quando vai entrar ou sair de algum desses estados pode se perder e travar, travando o computador todo do pior jeito possível: o congelamento inclusive do monitor.

Geralmente não. Dei dica mais pra ver se por acaso vc não tivesse colocado o max_cstate=0, poderia resolver provisoriamente. Colocar o processador em performance é bom só quando vc está realmente usando o processador e precisa dele pronto pra dar o máximo a qualquer momento! Por exemplo, quando vc está jogando pra evitar o micro stuttering. (alteração entre baixa carga e alta carga de porocessamento rápida e imprevisível)

Dica

Ah, vc pode testar o valor de intel_idle.max_cstate=0 ,de 0 até 9, e ir testando. Prefira o maior valor que não dê travamentos, vai ativar a maior economia de energia aliado a não travar o computador.

Quando tiver definido o melhor valor, torne o parâmetro definitivo adicionando no arquivo
/etc/default/grub

seção GRUB_CMDLINE_LINUX_DEFAULT, dentro das aspas,

Salve e depois atualize o grub comsudo update-grub

Essa história do cstate pode ser mesmo a sua solução.
Mas por via das dúvidas, vc separou uma partição para SWAP?
Esses travamanetos também podem ocorrer quando a SWAP está
com algum problema ou mal configurada.
Abraço

Não separei, por padrão o sistema esta com 2GB, não sei se isso é o suficiente.
Eu cheguei a reverter o cstate e tentar desativar ele por completo na bios, advinha? Sem sucesso, aconteceu um freeze algum tempo depois.
Modifiquei o Cstate no sistema por enquanto tudo ocorre bem, mas vou tentar prestar atenção o Swap, e tentar relacionar o problema a ele.
Voltando ao Swap eu posso modificar esse valor sem precisar reinstalar o sistema? E qual valor seria ideal?

1 curtida

A SWAP não recomendo você mudar os valores (como muitos fazem aqui no fórum).

Os problemas com relação a SWAP são os seguintes: o uuid da partição do swap pode estar errado e o Linux fica tentando acessá-la e por não conseguir, acaba travando (mesmo que não fosse usála, o gerenciamento de memória do Linux é complexo e ele muitas vezes deixa alguma coisa na SWAP).

Para verificar, tente rodar free -h, swapon --show ou ir no Disk Utility, Gparted e tal e ver se ela está sendo reconhecida…

Aqui estou rodando há mais de um dia e ainda não tem nada na SWAP… Até estou estranhando para falar a verdade. Mas enfim, vou ter verificar aqui, pode estar relacionado com uns travamentos que tive esses tempos… kk.
Mas note que pelo menos tem 15 GB disponíveis, isso pq ela está sendo reconhecida…

[email protected] ~ % swapon --show
NAME      TYPE       SIZE USED PRIO
/dev/sda2 partition 15.6G   0B   -2

Para ver o valor da sua `swapness’ (o meu é 60):

$ sysctl vm.swappiness

Para ver as UUID das parições montadas:

$ ls -l /dev/disk/by-uuid/

PS: sobre a sua outra tentativa, se vc seguiu as orientações do Deleterium, deveria conseguir setar o cstate no grub, no campo correto e sem problemas…

Aqui esta alguns valores, por algum motivo ele não identifica o meu Swap como uma partição.
image

image

1 curtida

Isso é pq o sistema criou um arquivo de swap e não uma partição (que normalmente quem cria é o usuário). 2 GB pode ser pouco se vc tem pouca RAM, mas ela existe, e isso ajuda a evitar travamentos. Como você tem 12 GB, tá de bom tamanho

1 curtida

Bom, pelo que estão falando aí não é problema de swap/swapfile mesmo!
E pelo visto o seu swapfile está sendo reconhecido sem problemas!
Boa sorte aee mano!

Aparentemente eu tenho o mesmo problema, sempre quando abro varias coisas também, e somente no linux, tenho um i7-4500U, AMD radeon 8670m, 8 de ram um hd 1T, e um ssd 240gb.

Aqui é dificil acontecer, somente quando abro varias coisas e to com os dois monitores, já aconteceu em varias distros tbm

Acho que o tu pode fazer eh, na próxima vez que ele travar e vc reiniciar, a primeira coisa eh ver todos os logs do sistema.
Tem os programas para ver logs
sysctl
journalctl
dmesg
E vários logs, incluindo do X
em
/var/log/
Tem programas gráficos para ver os logs, como
System log viewer

Depois de alguns dias testando, oque resolveu mesmo foi mexer no “cstate”
Aqui vai os passos que eu usei para resolver o problema:
Abra o terminal;
sudo gedit /etc/default/grub
procurar a linha:
GRUB_CMDLINE_LINUX_DEFAULT=“quiet”
substituir por:
GRUB_CMDLINE_LINUX_DEFAULT=“quiet splash intel_idle.max_cstate=1”
volte para o terminal:
sudo update-grub
Agora e só reiniciar
Lembrando que isso só funciona para sistemas que usam o GRUB, um exemplo que não usa e o Pop!_OS.
Para realizar o mesmo procedimento no Pop!_OS basta seguir abaixo:
sudo kernelstub -v -a intel_idle.max_cstate=1
sudo kernelstub -f
Reiniciar a maquina.
Acredito que isso possa resolver o problema no Pop!_OS.

2 curtidas

Este tópico foi fechado automaticamente 3 dias depois da última resposta. Novas respostas não são mais permitidas.