Xeon + Linux VRM derretendo, solução e Diferentes distros

Olá, comunidade Diolinux! Salve a todos! Este é meu primeiro post aqui e quero compartilhar uma experiência de “sobrevivência” com hardware antigo que talvez ajude outros.

Saimos de um hopping de distros sinistro. Comecei no Big Linux, mas uma atualização de quase mil pacotes quebrou tudo. Usei o snapshot do btrfs, mas mesmo assim perdi toda minha config do KDE. Na sequência, passei pelo Void e pelo NixOS - quebrei duas instalações seguidas tentando gerenciar as imagens do sistema. Acabei encontrando porto seguro no openSUSE Tumbleweed.

Todas são distros excelentes, mas meu problema era específico: scripts de otimização que dependiam de pacotes que ou não existiam nessas distros ou tinham versões incompatíveis. No openSUSE, finalmente encontrei o equilíbrio entre desempenho e estabilidade - e olha que não estou falando só de jogos!

O verdadeiro desafio: hardware Xeon em placa-mãe de consumo

Uso um Xeon E5-2680 v4 numa placa-mãe “civil” (uma X99 RS9), e quem já mexeu com isso sabe - os VRMs dessas placas não foram feitos para a fome de energia desses processadores de servidor. Resultado: superaquecimento e desligamentos aleatórios sob carga.

A solução em duas etapas:

  1. BIOS primeiro: Antes de qualquer script, precisei ir na BIOS e liberar todos os limites de energia, desativar qualquer eco-mode e colocar tudo em “Performance” ou “Full Power”. Se deixar os controles automáticos ativos, o sistema continuava instável.

  2. O script do sistema operacional: Como fazer undervolt em Xeon antigo é complicado, optei pelo controle via Power Limit usando o intel-undervolt. A mágica está em uma única linha no arquivo /etc/intel-undervolt.conf:

text

power package 110 110

Isso define tanto o limite de pico (PL2) quanto o sustentado (PL1) para 110W, abaixo dos 120W padrão do processador. Assim, o VRM não entra em colapso térmico. Configurei o serviço systemd para aplicar automaticamente a cada boot.

Teste real: Para validar, nada melhor que o Cyberpunk 2077 rodando por sessões de 15-20 minutos enquanto monitorava as temperaturas com watch -n 1 sensors. Resultado: estabilidade completa, sem desligamentos.

Bônus: Essa solução é portátil - já testei com sucesso no Ubuntu, Arch, Fedora e seus derivados, tanto no X11 quanto no Wayland. O intel-undervolt é bem suportado nas principais distros.

Alguém mais aqui já enfrentou esse tipo de desafio com hardware de servidor em placas de consumo? Tem experiências ou dicas para compartilhar sobre otimização de Xeon?

Eis meu Hardware e Sistema nesse momento:

```
System:
Kernel: 6.18.0-1-default arch: x86_64 bits: 64
Desktop: KDE Plasma v: 6.5.3 Distro: openSUSE Tumbleweed 20251205
Machine:
Type: Desktop Mobo: MACHINIST model: X99-RS9 v: V2.0
serial: <superuser required> Firmware: UEFI vendor: American Megatrends
v: 5.11 date: 04/28/2021
CPU:
Info: 14-core model: Intel Xeon E5-2680 v4 bits: 64 type: MT MCP cache:
L2: 3.5 MiB
Speed (MHz): avg: 1198 min/max: 1200/3300 cores: 1: 1198 2: 1198 3: 1198
4: 1198 5: 1198 6: 1198 7: 1198 8: 1198 9: 1198 10: 1198 11: 1198 12: 1198
13: 1198 14: 1198 15: 1198 16: 1198 17: 1198 18: 1198 19: 1198 20: 1198
21: 1198 22: 1198 23: 1198 24: 1198 25: 1198 26: 1198 27: 1198 28: 1198
Graphics:
Device-1: Advanced Micro Devices [AMD/ATI] Polaris 20 XL [Radeon RX 580
2048SP] driver: amdgpu v: kernel
Display: x11 server: X.Org v: 21.1.21 with: Xwayland v: 24.1.8 driver: X:
loaded: modesetting unloaded: vesa dri: radeonsi gpu: amdgpu
resolution: 1360x768~60Hz
API: EGL v: 1.5 drivers: kms_swrast,radeonsi,swrast
platforms: gbm,x11,surfaceless,device
API: OpenGL v: 4.6 compat-v: 4.5 vendor: amd mesa v: 25.3.1 renderer: AMD
Radeon RX 580 2048SP (radeonsi polaris10 ACO DRM 3.64 6.18.0-1-default)
API: Vulkan v: 1.4.328 drivers: radv,llvmpipe surfaces: N/A
Info: Tools: api: clinfo, eglinfo, glxinfo, vulkaninfo
de: kscreen-console,kscreen-doctor wl: wayland-info
x11: xdpyinfo, xprop, xrandr
Audio:
Device-1: Intel 8 Series/C220 Series High Definition Audio
driver: snd_hda_intel
Device-2: Advanced Micro Devices [AMD/ATI] Ellesmere HDMI Audio [Radeon
RX 470/480 / 570/580/590] driver: snd_hda_intel
API: ALSA v: k6.18.0-1-default status: kernel-api
Server-1: PipeWire v: 1.5.84 status: active
Network:
Device-1: Realtek RTL8111/8168/8211/8411 PCI Express Gigabit Ethernet
driver: r8169
IF: enp5s0 state: up speed: 1000 Mbps duplex: full mac: <filter>
Drives:
Local Storage: total: 252.93 GiB used: 127.94 GiB (50.6%)
ID-1: /dev/sda model: SATA3 256GB SSD size: 238.47 GiB
ID-2: /dev/sdb model: USB DISK 2.0 size: 14.46 GiB type: USB
Partition:
ID-1: / size: 237.47 GiB used: 127.87 GiB (53.8%) fs: btrfs dev: /dev/sda2
ID-2: /boot/efi size: 1022 MiB used: 79.9 MiB (7.8%) fs: vfat
dev: /dev/sda1
ID-3: /home size: 237.47 GiB used: 127.87 GiB (53.8%) fs: btrfs
dev: /dev/sda2
ID-4: /opt size: 237.47 GiB used: 127.87 GiB (53.8%) fs: btrfs
dev: /dev/sda2
ID-5: /var size: 237.47 GiB used: 127.87 GiB (53.8%) fs: btrfs
dev: /dev/sda2
Swap:
Alert: No swap data was found.
Sensors:
System Temperatures: cpu: 44.0 C mobo: N/A gpu: amdgpu temp: 46.0 C
Fan Speeds (rpm): N/A
Info:
Memory: total: 16 GiB note: est. available: 15.44 GiB used: 9.79 GiB (63.4%)
Processes: 520 Uptime: 2h 37m Shell: Bash inxi: 3.3.40
```
5 curtidas

Olá @Psicologia_Transvers . Seu tópico me interessa. Também fui dos corajosos que montaram um setup X99 em pleno 2025 hahahahaha. Estou usando um E5 2650 V4. Estava pensando em avançar para E5 2680 V4 por conta do clock limitado do 2650 V4 (2.5GHz com todos os threads 100%). Mas diante de tantos relatos de VRM fritando, acho que vou me dar o benefício da estabilidade com o E5 2650 V4. Estou usando para simulações monte carlo. Minha carga é quase pura CPU. Coloquei um cooler de VRM, desses de impressora 3D comprado no ML. Até agora não tive nenhum problema de desligamento, sobreaquecimento ou algo do tipo. Rodo simulações que chegam a 48hs, e já emendo com outra… ele tá a 2 dias rodando quase sem parar.

Ficou assim:

  • Xeon E5 2650 V4 (usado);
  • Placa-mãe Machinist X99 B9;
  • Duas memórias Micron 16GB REG ECC (usadas)(Não estou conseguindo usar a correção de erros;
  • Cooler Gamdias Boreas 4 heat-pipes;
  • Fonte MSI A650BN 80 plus bronze;
  • Gabinete Reddragon Deflect Flow (com 4 ventoinhas);
  • Nvidia Galax GTX 1650 (usada);
  • SSD Sandisk 480 GB;
  • Cooler para VMR genérico (mercado livre).

Para quem precisa ou tem dúvidas, foi montada uma workstation DELL recentemente na Universidade que estou trabalhando. Ela traz o W3 2535 (10 cores 20 lógicos 3.5GHz). Ela faz overclock de 4.3GHz com todas as trheads a 100%. É uma máquina moderna. Ela roda cada simulação em 9min 20s aproximadamente. Meu PC está rodando em 15min. Considerando meu investimento e o investimento da universidade , estou 1000% satisfeito, e este número reflete a realidade. Mas para viajar, tanto a ferrari quanto o corolla 2003 vão chegar, cada um no seu ritmo, e no seu custo rsrsrs.

Lógico que as duas apresentarão durabilidades diferentes também.

Mais uma coisa. Se eu fosse levar em pontuação de ranking de processador para fazer o que preciso, eu teria optado por um Ryzen. Mas o custo seria outro, e eu perderia alguns recursos que só estão disponíveis em processadores para servidores. Então pense um pouco, ranking pode não ser a resposta final. Depende muito do que você vai fazer com o setup.

Sistema:

2 curtidas

Cara essa foi umas das melhores aquisições que fiz ultimamente! Compensa demais, Melhor custo beneficio!

2 curtidas

Me impressionou @tijolaum …eu esperava temperaturas bem mais altas a 100%

3 curtidas
4 curtidas

É tipo por aí… embora eu não curta games, não tem como não se emocionar assistindo rsrsrs

2 curtidas

Cara se eu te falar que o problema nem era esse todo que eu postei, eu agora só diminui de 120w pra 100w(usei o coreCTRL) e tirei TODAS as outras limitações, ta voando, 120 fps no dotinha e em jogos como Cyberpunk, eu só limito o FPS a 80 e ta fluindo! Pelo visto o que realmente fritava era o VRM da placa era a potência da placa de vídeo. Fica a dica aí, mas vou testar sua solução, comprar essa ventoinha aí e depois posto aqui! Valeu pela resposta meu amigo!

3 curtidas

Fiz a substituição do E5 2650 V4 pelo E5 2680 V4. Realmente, tanto processador quanto VRM passaram a trabalhar mais quentes. Não sei exatamente a temperatura do VRM, pois as placas chinesas não medem temperatura de VRM, mas não há throttling.

O processador opera a 2.9GHz allcore estável (2.5 GHz no 2650), agora com 28 threads contra 24 do modelo anterior, o que me rendeu em torno de 20% de ganho de tempo de simulação em relação ao modelo anterior. A temperatura do CPU não está alta (em torno de 55 graus no package) quando o ar-condicionado do quarto está desligado. O investimento foi R$ 86,00.

O E5 2650 V4 continua imbatível na relação eventos simulados por real gasto. Ele me custou R$ 56,00.

Acho que a placa-mãe é a grande limitação dos kits x99. Ter uma plataforma mais antiga não foi limitação nenhuma para mim no Linux, pois trabalho com pure computing… quanto mais núcleos , melhor. Os Xeons são imbatíveis no custo/núcleo.

Mas não faço ideia da durabilidade/confiabilidade da placa-mãe. A bios é adaptada, mal feita e algumas funções não estão disponíveis ou simplesmente não funcionam. Para mim, serviu, mas depende muito do uso. Elas são claramente feitas para serem video-games. Tipo, ligue e não mexa em nada rsrsrsrs.

Estou muito satisfeito por enquanto. Para o que resolvi fazer, não há melhor custo benefício.

2 curtidas