Perdendo sinal de vídeo no POP OS

Instalei o Pop OS em um pc que acabei de montar e venho tendo um problema bem chato, em alguns momentos bem aleatórios perco o sinal do monitor e o teclado trava, só consigo restabelecer reiniciando o equipamento, já fiz alguns testes no hardware porque de cara achei que era a placa de vídeo, mas já testei a mesma e não deu nenhum erro (não que ainda não possa ser), a temperatura de todo o conjunto está “ok”, como disse o problema é bem aleatório, já utilizei o pc por algumas horas assistindo vídeos, utilizando programas e nada ocorreu, mas algumas vezes o computador apenas ligado o problema volta a surgir. Lembrando que o pc não desliga ou trava no momento, algumas das vezes em que estava assistindo vídeo ou ouvindo música na ocorrência do problema eu continuo ouvindo e até consigo parar e voltar a ouvir utilizando o mouse “as cegas”, só depois de algum tempo o sistema parece acusar a falta do teclado e não consigo mais. Quando eu diminuo a resolução da tela (e a frequência) o problema parece demorar mais para ocorrer e ou quando desabilito as funções HiDPI Daemon.

Utilizo um Xeon 2620 V3 com 8gb ddr4 e placa de vídeo Radeon R7 350 2gb.
O Monitor é (antigo) um LG 1753, utilizando DVI.

Penso que pode ser os drivers da placa no sistema (Está como Radeon, Radeon), mas não tenho como garantir isso é só mais um dado para avaliar e se algum puder me dar alguma luz sobre o assunto desde já agradeço.

2 curtidas

Olá @LuizSoares, tudo bem contigo?

Esse problema ocorre em outras distros? Quais testes exatamente você fez? Procurou capacitores estufados ou zonas de calor fora do comum no conjunto?

Recentemente estava enfrentando um problema de travamentos no meu computador e mesmo não encontrando nenhuma anomalia de temperatura decidi fazer testes com curvas de potência diferentes no cooler da CPU e da GPU.

E adivinha? Problema resolvido.

No meu caso, descobri que meu setup estava com uma curva de potência focada em reduzir o ruído, por isso, a capacidade dos coolers estava bem abaixo da capacidade máxima.

:vulcan_salute:

2 curtidas

Como eu disso o meu pc não chega a travar, só perde o sinal, se estiver ouvindo música ou vendo vídeo com os fones continuo ouvindo tudo que está sendo reproduzido, apenas o sinal com o monitor se perde. O equipamento é novo e como o problema não é digamos “gritante”, fica difícil avaliar um possível defeito, fora esses eventos o equipamento funciona muito bem e o mostrador da placa mãe fica inalterado, não indica um possível problema. Não testei outra distribuição porque minha intenção é trabalhar com o Pop Os mesmo, em último caso, esgotadas todas as opções eu ainda vou fazer esse teste, mas vou tentar fugir desse caminho o máximo que puder. Agradeço a sua atenção e vou investigar essa questão dos coolers, apesar do equipamento não dar sinais de que o problema seja a temperatura do conjunto, até porque não ocorrem travamentos ou desligamentos abruptos e já fiz o teste da placa de vídeo onde o processador foi exigido ao máximo e tudo transcorreu sem problemas.

Olá @LuizSoares, citando Sherlock Holmes “Uma vez eliminado o impossível, o que restar, não importa o quão improvável, deve ser a verdade.”

Você precisa fazer testes e colher informações para conseguir evoluir as observações em certezas. Sem testes, fica bastante difícil apontar alguma possível solução.

  1. instale o pacote LM-Sensors e configure (sudo sensors-detect) para colher mais dados dos componentes do computador.
  2. Quais logs de erros você já olhou? Veja se existe alguma informação que pode ser útil em /var/log/messages e /var/log/kern.log
  3. Instale um programa como o GPUX ou PFSensor para observar o uso do hardware em tempo-real. Isso pode te ajudar a encontrar algo para analisar com mais detalhes.

Testar com outra distribuição via live-pendrive (sem formatar a máquina) vai te ajudar a eliminar se o problema é alguma configuração específica do Pop!_OS e será de base para fundamentar outros testes.

Este tipo de travamento sem um motivo aparente pode ser bem difícil de diagnosticar. Conforme seus testes evoluírem, comente aqui da forma mais detalhada possível.

Assim a comunidade pode ser bem objetiva ao indicar novos testes e possíveis soluções.

:vulcan_salute:

2 curtidas

Boa noite e muito obrigado pelas sugestões!

Ontem a noite eu ativei o “amdgpu” pois estava bem desconfiado do problema no meu pc ser de drivers, já que não havia travamentos no equipamento. Hoje o problema pela primeira vez em uma semana de instalado não se manifestou e eu já trabalhei bastante nele, ainda não estou totalmente confiante de que tenha resolvido, mas aparentemente sim. Antes de eu abrir o post eu tinha pesquisado bastante sobre problemas semelhantes e não encontrei muita coisa, mas me deparei no meio do caminho com um tutorial do Dio explicando sobre esse assunto e já tinha decidido de que essa seria uma das alternativas e até o momento parece ter sido a correta e como eu disse, não achei casos semelhantes e pensei ser interessante criar o post e caso resolvesse ser de ajuda para mais alguém em situação igual a minha. Agradeço de coração o tempo gasto em tentar me ajudar.

1 curtida

Eu vim aqui pra sugerir mudar o driver para amdgpu (que é o correto para placas recentes), mas você já descobriu, na verdade isso acaba sendo um falha na distro, só as placas legadas usam o driver radeon

1 curtida

De qualquer forma agradeço a atenção amigo.

1 curtida

Atualizando: Depois de três dias funcionando de boa com “amdgpu”, após uma atualização o problema voltou, mas por experiência própria após a reinicialização do sistema eu verifiquei se esse processo tinha desfeito minha configuração e realmente tinha retornado ao “RADEON”, refiz a modificação e reiniciei o sistema que utilizei sem problemas por horas novamente com “amdgpu”, até o problema voltar, gostaria de perguntar se seria necessário instalar algum driver baixado da própria AMD ou simplesmente utilizar os repositórios dela para isso, tendo em vista que minha placa é antiga, da série R7 Cape Verde?

Estou voltando aqui para relatar que depois da minha última mensagem o problema simplesmente havia desaparecido, continuei trabalhando sem me preocupar mais com o ele, até que outro dia (justamente depois de atualização no sistema) apareceu novamente, utilizando um programa para me disponibilizar melhor o log, localizei o erro inicial nele e pesquisando, constatei se tratar de um bug mesmo e pelo que entendi, relacionado com o gnome e vi relatos semelhantes ao meu no Ubuntu, Mint, Manjaro e etc. Segue abaixo o dito cujo
“glib-gio-critical g_bus_get_sync assertion ‘error == null *error == null’ failed”

Será que alguém pode me dá uma luz sobre esse log?

14:13:32 kernel: amdgpu 0000:02:00.0: AER:   Error of this Agent is reported first
14:13:30 systemd: Failed to start Application launched by gnome-shell.
14:08:07 gdm-session-wor: GLib-GObject: g_object_unref: assertion 'G_IS_OBJECT (object)' failed
14:08:03 systemd: Failed to start Application launched by gnome-session-binary.
14:08:02 dbus-broker-lau: Ignoring duplicate name 'org.gnome.baobab' in service file '/usr/share//dbus-1/services/org.gnome.baobab.service'
14:08:02 gdm-session-wor: gkr-pam: unable to locate daemon control file
14:07:52 gnome-session-b: GLib-GIO-CRITICAL: g_bus_get_sync: assertion 'error == NULL || *error == NULL' failed
14:07:51 kernel: EDAC sbridge: Failed to register device with error -19.
14:07:49 kernel: ================================================================================
14:07:49 kernel: load of value 192 is not a valid value for type '_Bool'
14:07:49 kernel: UBSAN: invalid-load in /build/linux-IcsbHs/linux-5.19.0/drivers/gpu/drm/amd/amdgpu/../pm/amdgpu_dpm.c:1363:37
14:07:49 kernel: ================================================================================
14:07:49 kernel: kfd kfd: amdgpu: VERDE  not supported in kfd