Pop os! com micro travadas

Resumo da minha luta com chatGPT, pedir ele para fazer um resumo de tudo que já mandei lá… seguindo as dicas dele achei muitos erros com abios do sistema mas não sei o que fazer mais e o chatGPT está ficando sem soluções.

Olá. Estou tentando diagnosticar um problema persistente de travamentos no Linux e gostaria de algumas opiniões.

Hardware:

  • CPU: Intel Core i7-3770
  • GPU: NVIDIA GTX 1050 Ti 4 GB
  • RAM: 16 GB DDR3 (2×8 GB)
  • Placa-mãe: H61 chinesa com suporte a NVMe (BIOS AMI modificada)
  • SSD/NVMe: Silicon Motion SM2263XT
  • Rede: Realtek RTL8111/8168
  • Monitores: normalmente uso dois Full HD, ocasionalmente um terceiro 4K

Sintomas:

  • Micro travamentos/engasgos em todo o sistema.
  • Ocorrem simultaneamente em mouse, vídeos, animações e interface gráfica.
  • Não parecem estar ligados a uma aplicação específica.
  • Acontecem mesmo após instalações limpas do sistema.

Histórico:

  1. O problema começou no Pop!_OS 24.04.
  2. Suspeitei de incompatibilidade com kernels mais novos.
  3. Formatei e reinstalei várias vezes.
  4. Testei:
    • Pop!_OS 24.04;
    • Pop!_OS 22.04 (ISO oficial da System76);
    • Ubuntu 24.04.
  5. Algumas ISOs do Ubuntu mais recente e do Linux Mint nem chegaram a iniciar pelo pendrive, apresentando erro de kernel durante o boot.
  6. Testei diversos kernels:
    • 7.x (Pop!_OS 22.04 atualizado);
    • 6.16;
    • 6.8;
    • atualmente 6.2.6-76060206-generic.
  7. Testei diferentes drivers NVIDIA:
    • 470;
    • 525.105.17;
    • 580.x.
  8. O comportamento permaneceu essencialmente o mesmo em todos os cenários.

Estado atual:

  • Sistema: Pop!_OS 22.04 recém-instalado.
  • Kernel: 6.2.6-76060206-generic
  • Driver NVIDIA: 525.105.17
  • Problema continua ocorrendo.

O que já descartei:

  • Temperaturas normais.
  • Uso de CPU aparentemente normal.
  • Uso de RAM aparentemente normal.
  • NVMe sem sintomas evidentes de falha.
  • O problema persiste mesmo após múltiplas instalações limpas.

Minhas suspeitas atuais:

  • Alguma incompatibilidade entre a GTX 1050 Ti e esta plataforma específica.
  • Problema relacionado à placa-mãe H61 chinesa (BIOS, gerenciamento de energia, PCIe ou controlador NVMe).
  • Possível defeito intermitente de hardware que o Windows não evidencia (RAM, fonte, placa-mãe ou GPU).

Perguntas:

  1. Alguém já encontrou micro travamentos semelhantes envolvendo H61 chinesa + NVMe + NVIDIA?
  2. Existe algum teste específico que recomendam para isolar placa-mãe, GPU ou fonte?
  3. Vale a pena testar uma GPU diferente ou desabilitar completamente a GTX 1050 Ti para fins de diagnóstico?
  4. Há alguma configuração conhecida de BIOS nessas H61 chinesas que possa causar esse tipo de comportamento?

É, eu ia sugerir isso. Várias vezes tive que voltar pra essa versão pra resolver travadas e reinicialização repentina :frowning:

Vejá se está com fstrim.timer enable no boot do sistemd

systemctl list-unit-file  --state enabled

Se não estiver ativado

sudo systemctl enable --now fstrim.timer

:+1:

estou na eminência de problemas de Hardware aí ferrou :face_with_spiral_eyes:

está habilitado, vou fazer teste com aquele memtest pelo boot, fiz pelo sistema e estava tudo ok, agora esperar o teste.

Eu tive problemas de travamentos esporádicos, utilizando uma distribuição baseada no Arch.

Quando eu abri uma thread relatando que haviam começado a apresentar essas anomalias. Uma pessoa me relatou que isso estava ligado ao driver da Nvidia. Que, no caso dela, isso ocorria no Zorin OS. Essa mesma pessoa me informou que quando fez uma regressão do driver no Zorin conseguiu ter uma usabilidade normal.

Na distribuição que eu estava usando eu fiz isso porém eu comecei a ter outros problemas. Cessaram-se os congelamentos, mas passei a ter problemas para executar algumas aplicações que demandavam da GPU. Aí eu voltava a pro driver mais atual e os travamentos voltavam a ocorrer.

Eu estou relatando isso porque eu não sei se o driver que o Pop OS utiliza é o mesmo que algumas distribuições estão utilizando. Por isso você possa estar tendo esses problemas de pequenos congelamentos na utilização do sistema. Mas é fato consumado que isso está relacionado à placa de vídeo nvidia.

Não os drivers Nvidia não estão tão bons assim quanto o drivers AMD e Intel/ARC. Na distribuição atual que eu estou utilizando, que no caso é o Bazzite, estes congelamentos não ocorrem. Entretanto eu sinto que algumas aplicações não funcionam com a performance que deveriam.

Eu tenho pesquisado bastante sobre isso e vou ser sincero a todos vocês que não parece haver uma luz no fim desse túnel.

O que tem funcionado para muitos é regressão de driver como já foi citado aqui por outras pessoas. É tentativa.

Esta em ahci na bios?

Fala de pequenos travamentos.

Já tentou desativar swap?

Já tentou usar um pente de memória por vez?

tentei acho que 3 drivers, 470, 525 580 e se não me engano o 530 mas ficou na mesma, vou fazer um teste mais agressivo, vou testar no windows hehehehe

fiz o memtest e deu erro lá, uns 200 e poucos erros perto de 200mb iniciais, com modulos separados, em slots cruzados, minha placa mãe é destas “coisinhas” chinesas 1155 com nvme, aí na duvida se ela deu problema ou se minhas Rams morreram, ou pior se a placa mãe matou elas… tenho um kit parado ali acho que 1150, amanhã fazer novo teste memtest e ver se bate as falhas

Ai a coisa muda de figura e no caso não a Nvidia o problema. Suas memórias que são. Sim pode fazer sentido que, das duas uma, ou sua placa tá ruim ou as memórias estão. Como sua placa é uma daquelas chinesas, elas são daquela série de projetos “gambiarras” que os chineses desenvolveram e colocaram no mercado, Tanto pra linhas 1155 quanto pra linha 1150. Então a chance delas darem problemas é grande. Se o seu kit 1150 for de uma boa marca, faça o teste das memórias nele e veja se ainda sim os problemas persistem. Se persistir pode ser as memórias.

se o problema foi para hardware, fica complicado contornar,
sei que em disco consegue isolar os BadBlocks, mas nao sei se tem para mem.

rodou o teste no linux?
tem o QDiskInfo seria a versao linux do Crystaldiskinfo do janela,
e o Memtester

exatamente, fiz agora um teste e as memórias estão boas, gambiarra chinesa com problema… ô “trestéza”… e é aquela coisa, 2 módulos darem problemas juntos assim é muito difícil…

anteriormente tinha feito uma “isolação” de um trecho das Rams com chatGPT mas como o problema era a placa mãe, não tive sucesso. agora chorar para trocar placa mãe, o kit reserva que tenho não tem nem pci 1x extra para fazer mais gambiarra hehehe e por o NVME nela.

Procure por asrock.

É uma boa placa e o preço não é tão cara