Será o fim dos Delta RPMs?

A proposta dos pacotes Delta RPM é viabilizar o download apenas das partes modificadas dos pacotes, numa atualização do sistema, economizando no tráfego de dados, porém penalizando o uso do CPU do usuário, uma vez que a montagem do novo pacote é feita localmente, ainda com o risco de falhas, demandando baixar o pacote completo. Entretanto, Aoife Moloney acompanhou atualizações contendo Delta RPMs, constatando que:

  • A cada 42 atualizações, apenas 25 ofereciam Delta RPMs;
  • Se não houver falhas na montagem local, a economia média de dados é de 22.5 MB;
  • Quando há falha na montagem local, há incremento médio no uso de dados de 52.7 MB, quando comparado a atualizações sem Delta RPMs;
  • Isso faz com que a média total de economia de dados para quem opta pelos Delta RPMs, seja de 7.5 MB, ou seja, 8%.

Em geral, a maioria da economia dos Delta RPMs ocorreu em um pacote, o Firefox. A existência dos Delta RPM ainda onera o armazenamento em servidores, além de inflar o tamanho dos metadados do repositório, baixados por todos os usuários.

Por isso, está proposto, a partir do Fedora 40, não empacotar mais no formato Delta RPM, indisponibilizando a todos os usuários. Apenas isso bastaria para o Fedora e seus Spins baixarem automaticamente as edições completas dos pacotes, mas as novas edições do sistema ainda virão configuradas para não mais buscá-los.

5 curtidas

Demorou!

Ótima proposta, a meu ver. – Isto deixou de fazer sentido, desde o “fim” da internet discada.

E as estatísticas oferecidas (abaixo) são muito meigas. – Em um supermercado, p.ex., não faz sentido calcular a economia em 1 caixa de fósforos. – A “economia” deve ser medida sobre “o total da compra”:

Em 3¾ anos (3 anos 9 meses), fiz 289 atualizações – e só houve alguma “economia” em 190 das vezes (65,7%):

$ cat Notes_04-Fedora.txt | grep 'dnf upgrade' | wc --lines
289

$ cat Notes_04-Fedora.txt | grep 'saved)' | wc --lines
190

Desses 190 casos, a “economia” foi de:

0% a 2%    97 casos   51.1% dos casos
2% a 5%    39 casos   20.5% dos casos
5% a 10%   27 casos   14.2% dos casos
10% +      27 casos   14.2% dos casos

Portanto, em mais de 50% dos casos, a “economia” não atingiu 2% – e em apenas 1 de cada 7 casos a “economia” superou 10%.

Quando a “economia” é “maior” – em percentagem – na maioria das vezes o “ganho” é de poucos MB:

Isso aqui me parece o ponto fundamental:

Ou seja:

  1. Um custo enorme de infraestrutura

  2. Uma perda de tempo baixando metadados inchados

8 curtidas

Seus registros são uma coisa surpreendente.

1 curtida