Por que ainda não há uma boa integração de IA em distros Linux?

Entenda os motivos pelos quais ainda não há uma boa integração de IA em distros Linux, e conheça algumas hipóteses sobre como isso poderia ser feito.

1 curtida

Pelo mesmo motivo que nao há uma boa suíte office, ou adobe para linux kk

na realidade acho q não deve ser tão difícil criar uma extensão gnome por exemplo, que linque com uma LLM local, rodando na placa de video, ou com uma LLM remota paga pelo usuario. O maior problema é, que função real isso teria? Usar o terminal com a voz? Fazer pesquisas piores que no google? Ajustar tema do sistema clicando em menos botões?

Bem sinceramente eu não vejo um mundo onde mais que 5% dos usuarios usem diariamente um feature dessas. E enquanto computadores comuns, sem placas de video dedicadas, não conseguirem rodar LLM não existe um mundo onde isso vai ser implementado

2 curtidas

Sinceramente, IA em desktop para usuário comum é no mínimo idiota, já não basta o que a Microsoft está fazendo com o Copilot e Windows 11, quero isso bem longe do meu PC. E não, não sou contra IA apenas não me entra na cabeça a ideia de sair colocando IA em praticamente tudo.

8 curtidas

Exatamente.
Ter a possibilidade de instalar, para quem quer, é uma coisa.
Mas, não faz sentido ter algo consumindo recursos, sem um pingo de necessidade.
A tal da Cortana já era um “trambolho” inútil para a maioria esmagadora dos usuários.

5 curtidas

Eu duvido que os “xiitas” quereriam alguma implementação de IA no desktop Linux, irão alegar uma série de diretrizes, violações e questões de segurança/privacidade. Imagine hoje uma Canonical, que talvez seja a empresa com mais recurso técnico para implementar isso no desktop, colocando no fórum do Ubuntu que a versão 26.04 terá IA por padrão (mesmo que possa ser desativada na instalação)… cairia o mundo encima da Canonical.

O Gentoo ja ta banindo quem utiliza ajuda de IA para contribuir com codigo, então ja era de se esperar que nunca chegue nada do genero pra Linux

Pow o Office o WPS ta tentando eheh ta quase lá =D. agora adobe tenho que concordar.

Microsoft tentando enfiar produto por causa do hype. Mas a longo prazo verá que, assim como vc disse, não faz sentido nenhum esse exagero de enfiar IA em tudo quanto é lugar

Realmente, acho o wps office muito bom apesar que sua versão para windows seja ainda mais atualizada

Mas nesse caso eles tem razão, aceitar uma contribuição que pode ter problemas de licenciamento e pior em média precisa ser refeita a cada 6 meses é bem zoado

1 curtida

Quando falam em integração com IA eu penso em tanta coisa, o que tem aí não é uma boa integração, são janelas em lugares estratégicos para conversar com uma LLM, ponto…

Eu sempre imaginei coisas como poder pedir:

  • “Agende a sincronização do google drive para quando eu for dormir” (E aqui entram dispositivos como relógio ou celular para identificar quando estiver na cama.)
  • "Sempre que eu estiver no meet, coloque o computador em modo foco enquanto durar o meet.*
  • “Pode ativar acentuação para mim? Não estou conseguindo acentuar as palavras.”

Enfim, exemplo que não falta, e assim, a IA interagiria profundamente com APIs do sistema de forma segura, com um lugar onde ficam listadas as mudanças e a própria IA descreve o que mudou do que para o que, sem poder deletar ou editar arquivos permanentemente, ainda daria para fazer muita coisa.

Algumas destas coisas na plataforma da Apple, fazemos via shortcuts, um mecanismo de automação tipo iFFF, mas é manual e demanda conhecimento apesar de ser mais simples que programar.

Mas seria muito legal e seria o fim de uma barreira enorme para a interação com um computador. Seria algo que acho que mais de 5% usariam, mas ai precisaria ser fácil e muito bem polido e ai sim eu acho que estamos falando de muito dinheiro, pois acredito que não seria uma tarefa simples.

3 curtidas

Mas isso não é nem IA nem LLM, é apenas um processador de comandos em linguagem natural (NLP), tecnicamente nem dá pra realmente fazer isso usando LLM e IA usando APIs seguras, sempre vai ter um buraco enorme na segurança devido a alucinação computacional, obrigando a ter um botão “Tem certeza disso?” com um log enorme de comandos como acontece no Copilot

Eu fiz o Idris que faz exatamente isso mas não teve interesse por parte da comunidade

A Open AI tem contornado as limitações em raciocínio matemático do GPT 4 fazendo cadeia de inferência para rodar snippets de Python em contêineres já tem algum tempo, o resultado é mais do que consistente, na minha opinião.

Questão de segurança, é mais sobre peitar o risco.

E no tocante ao shortcuts, sim, meio que é NLP, mas também é mais. Uma coisa é você controlar programas que tem interface para o terminal, outra é você controlar programas que tem uma API padronizada, com regras de permissão, em um ecosistema (celular, tablet, relógio, notebook, central de TV, etc), onde a IA pode mostrar uma tela de permissão explicar a tela, etc.

Por isso seria um desafio complexo, é uma questão de controlar toda a cadeia e pensar na experiência na totalidade. Mas eu vejo isso como inevitável, um dia isso vai ter que a acontecer se a indústria quer fazer mais do que um chat.

Na verdade o que eu quis dizer que é apenas NLP é isso:

Você não precisa de LLM e/ou IA para isso (na verdade o ideal é não usar nenhum dos dois), IAs (especialmente LLMs) são bizarramente caras e ineficientes para esse fim

O problema é que isso custa muito caro e sempre vai depender da confirmação do usuário o Copilot do Windows usa a versão final disso é legalzinho se você não conhece o potencial da tecnologia e a quantidade absurda de recursos que isso torra

Acredite ou não, a pior parte é justamente existir uma API uma vez que exista basta criar um banco de dados com elas… Isso sim é zoado manter mas não é devido a complexidade mas sim devido ao tempo necessário eu sei disso porque como está no link eu já fiz uma PoC usável

Que eles se resolvam para tornar viável, se não for possível não vai ser. A questão é, as pessoas querem isso, só poder pedir pro computador fazer, não é difícil perceber que é isso que as pessoas gostariam que acontecesse.

Talvez você não esteja escutando o que a comunidade te disse com o Idris, e se recusa a aceitar o feedback, mas as pessoas não querem isso… A apple já esteve desse lado, AppleScript meio que é isso e as pessoas não querem.

Se for para te dar uma sugestão, eu diria, aprenda com a Apple… E para tal eu te diria para dar uma olhada em linguagem visual, coisas como blockly e afins, é o segundo passo… O que eu estou dizendo, é que o terceiro passo é uma LLM. Eliminar totalmente qualquer coisa que pareça com programação.

O meu problema com isso, é enraizar em todo o ecossistema e vincular com a capacidade inerente da IA de resolver problemas genéricos, por exemplo:

“pegue o endereço da página aberta do navegador mais o texto sublinhado na página, transforme isso em uma citação dentro da norma ABNT xyz e coloque no fim do documento aberto no Word.”

Praticamente tudo isso o framework da Apple de automação já resolve, menos colocar dentro das normas, nesse momento você acaba tendo que recorrer a outra linguagem para embutir no Apple script e dai vai além do domínio da maioria.

Outra solução menos terrível do que programar, é baixar um app de um terceiro e incluir no meio da automação. Eu não duvido que tenha gente usando um Mac ou um iPhone com alguma automação desse tipo feita no shortcuts e em algum atalho do teclado ou ação rápida. É esse tipo de coisa que as pessoas costumam fazer com ele.

E dai entra outra questão, não é que shortcuts seja ótimo, é que é muito melhor programar juntando bloquinhos que meio que limitam os erros sintáticos e semânticos… Mas ainda é chatão, eu quero poder dizer “faça xyz”, porque é mais fácil ainda.

Não sei se chegou a abrir o link mas a ideia do Idris é a pessoa digitar:

Organize meus arquivos na pasta Downloads por data

E ele dispara isso no terminal:

origem="${HOME}/Downloads"
destino="${HOME}/Downloads/Organizado"
for arquivo in "${origem}"/*; do
    if [ -f "${arquivo}" ]; then
        data_modificacao=$(date -r "${arquivo}" +%Y/%m/%d)
        mkdir -p "${destino}/${data_modificacao}"
        mv "${arquivo}" "${ destino}/${data_modificacao}"
    fi
done

Ou seja, exatamente o que você disse, não tem nada a ver com Apple script, a questão é que ao contrário do que você diz, aparentemente as pessoas simplesmente NÃO querem isso (ou não querem ajudar a custear o desenvolvimento pelo menos, montar esses snippets leva tempo e tempo custa dinheiro, as pessoas (se querem) querem algo que alguém faça pra elas (o que é ok, afinal, eu concordo com você programar é chato) porém sem receber nada, querem que além de fazer, a pessoa cubra todo e qualquer custo de tempo e dinheiro do desenvolvimento… isso não vai rolar

E sim, como está no exemplo, você pode combinar “comandos”:

Baixe a página https://diolinux.com.br/tecnologia/integracao-de-ia-em-distros-linux.html, extraia o texto, abra no writer e formate como ABNT

Ele consegue entender isso, falta os snippets de código

1 curtida

Eu olhei, há meses, quando você postou. Talvez eu devesse ter tentado ser mais explicito, não é idêntico a AppleScript, mas, na prática, é o mesmo para mim. Eu não sei como te explicar de uma forma diferente, que eu não quero preencher um banco de dados com verbos e snippets te código. Se isso já estivesse pronto, e eu pudesse apenas juntar bloquinhos, seria melhor, ainda seria limitado a um conjunto x de possibilidades, mas seria usável, para o público que eu sei que precisa que isso seja assim. Eu pessoalmente escrevo as automações direto no AppleScript, porque para mim é mais prático, já que programação é meu trabalho. Agora se isso soubesse preencher por conta própria o seu banco de dados… Mas enfim te desejo sorte no seu projeto.

Falando em Adobe, na minha visão, é o produto que melhor está aproveitando o conceito de IA como uma ferramenta de resolução de problemas muitas vezes subjetivos. Nossa eu ia adorar poder abrir meu Gmail e pedir

“Você pode me dar uma lista de e-mails das Casas Bahia que são meramente propaganda? Sem incluir confirmação de compra, rastreio, etc.”

Ou ainda:

“você pode baixar os currículos que caíram na caixa de correio na última semana e dar uma nota de 0 a 10 baseado nos requisitos XYZ?”