Por que ainda não há uma boa integração de IA em distros Linux?

Diolinux · Abril 30, 2024, 11:00am

Entenda os motivos pelos quais ainda não há uma boa integração de IA em distros Linux, e conheça algumas hipóteses sobre como isso poderia ser feito.

Cleverson · Abril 30, 2024, 3:56pm

Pelo mesmo motivo que nao há uma boa suíte office, ou adobe para linux kk

freeQ · Abril 30, 2024, 4:11pm

na realidade acho q não deve ser tão difícil criar uma extensão gnome por exemplo, que linque com uma LLM local, rodando na placa de video, ou com uma LLM remota paga pelo usuario. O maior problema é, que função real isso teria? Usar o terminal com a voz? Fazer pesquisas piores que no google? Ajustar tema do sistema clicando em menos botões?

Bem sinceramente eu não vejo um mundo onde mais que 5% dos usuarios usem diariamente um feature dessas. E enquanto computadores comuns, sem placas de video dedicadas, não conseguirem rodar LLM não existe um mundo onde isso vai ser implementado

tiagoquintino · Abril 30, 2024, 8:38pm

Sinceramente, IA em desktop para usuário comum é no mínimo idiota, já não basta o que a Microsoft está fazendo com o Copilot e Windows 11, quero isso bem longe do meu PC. E não, não sou contra IA apenas não me entra na cabeça a ideia de sair colocando IA em praticamente tudo.

wmassis · Abril 30, 2024, 9:14pm

Exatamente.
Ter a possibilidade de instalar, para quem quer, é uma coisa.
Mas, não faz sentido ter algo consumindo recursos, sem um pingo de necessidade.
A tal da Cortana já era um “trambolho” inútil para a maioria esmagadora dos usuários.

Tosca16 · Abril 30, 2024, 10:16pm

Eu duvido que os “xiitas” quereriam alguma implementação de IA no desktop Linux, irão alegar uma série de diretrizes, violações e questões de segurança/privacidade. Imagine hoje uma Canonical, que talvez seja a empresa com mais recurso técnico para implementar isso no desktop, colocando no fórum do Ubuntu que a versão 26.04 terá IA por padrão (mesmo que possa ser desativada na instalação)… cairia o mundo encima da Canonical.

ruanelivelton18 · Abril 30, 2024, 11:01pm

O Gentoo ja ta banindo quem utiliza ajuda de IA para contribuir com codigo, então ja era de se esperar que nunca chegue nada do genero pra Linux

DougBane · Maio 1, 2024, 12:32am

Pow o Office o WPS ta tentando eheh ta quase lá =D. agora adobe tenho que concordar.

flavio_ux · Maio 1, 2024, 12:38am

Microsoft tentando enfiar produto por causa do hype. Mas a longo prazo verá que, assim como vc disse, não faz sentido nenhum esse exagero de enfiar IA em tudo quanto é lugar

flavio_ux · Maio 1, 2024, 12:38am

Realmente, acho o wps office muito bom apesar que sua versão para windows seja ainda mais atualizada

Natanael.755 · Maio 1, 2024, 1:12am

Mas nesse caso eles tem razão, aceitar uma contribuição que pode ter problemas de licenciamento e pior em média precisa ser refeita a cada 6 meses é bem zoado

romulopb · Maio 2, 2024, 12:09am

Quando falam em integração com IA eu penso em tanta coisa, o que tem aí não é uma boa integração, são janelas em lugares estratégicos para conversar com uma LLM, ponto…

Eu sempre imaginei coisas como poder pedir:

“Agende a sincronização do google drive para quando eu for dormir” (E aqui entram dispositivos como relógio ou celular para identificar quando estiver na cama.)
"Sempre que eu estiver no meet, coloque o computador em modo foco enquanto durar o meet.*
“Pode ativar acentuação para mim? Não estou conseguindo acentuar as palavras.”

Enfim, exemplo que não falta, e assim, a IA interagiria profundamente com APIs do sistema de forma segura, com um lugar onde ficam listadas as mudanças e a própria IA descreve o que mudou do que para o que, sem poder deletar ou editar arquivos permanentemente, ainda daria para fazer muita coisa.

Algumas destas coisas na plataforma da Apple, fazemos via shortcuts, um mecanismo de automação tipo iFFF, mas é manual e demanda conhecimento apesar de ser mais simples que programar.

Mas seria muito legal e seria o fim de uma barreira enorme para a interação com um computador. Seria algo que acho que mais de 5% usariam, mas ai precisaria ser fácil e muito bem polido e ai sim eu acho que estamos falando de muito dinheiro, pois acredito que não seria uma tarefa simples.

Natanael.755 · Maio 2, 2024, 1:57am

Mas isso não é nem IA nem LLM, é apenas um processador de comandos em linguagem natural (NLP), tecnicamente nem dá pra realmente fazer isso usando LLM e IA usando APIs seguras, sempre vai ter um buraco enorme na segurança devido a alucinação computacional, obrigando a ter um botão “Tem certeza disso?” com um log enorme de comandos como acontece no Copilot

Eu fiz o Idris que faz exatamente isso mas não teve interesse por parte da comunidade

romulopb · Maio 2, 2024, 2:20am

A Open AI tem contornado as limitações em raciocínio matemático do GPT 4 fazendo cadeia de inferência para rodar snippets de Python em contêineres já tem algum tempo, o resultado é mais do que consistente, na minha opinião.

Questão de segurança, é mais sobre peitar o risco.

E no tocante ao shortcuts, sim, meio que é NLP, mas também é mais. Uma coisa é você controlar programas que tem interface para o terminal, outra é você controlar programas que tem uma API padronizada, com regras de permissão, em um ecosistema (celular, tablet, relógio, notebook, central de TV, etc), onde a IA pode mostrar uma tela de permissão explicar a tela, etc.

Por isso seria um desafio complexo, é uma questão de controlar toda a cadeia e pensar na experiência na totalidade. Mas eu vejo isso como inevitável, um dia isso vai ter que a acontecer se a indústria quer fazer mais do que um chat.

Natanael.755 · Maio 2, 2024, 2:33am

Na verdade o que eu quis dizer que é apenas NLP é isso:

Você não precisa de LLM e/ou IA para isso (na verdade o ideal é não usar nenhum dos dois), IAs (especialmente LLMs) são bizarramente caras e ineficientes para esse fim

O problema é que isso custa muito caro e sempre vai depender da confirmação do usuário o Copilot do Windows usa a versão final disso é legalzinho se você não conhece o potencial da tecnologia e a quantidade absurda de recursos que isso torra

Acredite ou não, a pior parte é justamente existir uma API uma vez que exista basta criar um banco de dados com elas… Isso sim é zoado manter mas não é devido a complexidade mas sim devido ao tempo necessário eu sei disso porque como está no link eu já fiz uma PoC usável

romulopb · Maio 2, 2024, 2:40am

Que eles se resolvam para tornar viável, se não for possível não vai ser. A questão é, as pessoas querem isso, só poder pedir pro computador fazer, não é difícil perceber que é isso que as pessoas gostariam que acontecesse.

Talvez você não esteja escutando o que a comunidade te disse com o Idris, e se recusa a aceitar o feedback, mas as pessoas não querem isso… A apple já esteve desse lado, AppleScript meio que é isso e as pessoas não querem.

Se for para te dar uma sugestão, eu diria, aprenda com a Apple… E para tal eu te diria para dar uma olhada em linguagem visual, coisas como blockly e afins, é o segundo passo… O que eu estou dizendo, é que o terceiro passo é uma LLM. Eliminar totalmente qualquer coisa que pareça com programação.

romulopb · Maio 2, 2024, 2:50am

O meu problema com isso, é enraizar em todo o ecossistema e vincular com a capacidade inerente da IA de resolver problemas genéricos, por exemplo:

“pegue o endereço da página aberta do navegador mais o texto sublinhado na página, transforme isso em uma citação dentro da norma ABNT xyz e coloque no fim do documento aberto no Word.”

Praticamente tudo isso o framework da Apple de automação já resolve, menos colocar dentro das normas, nesse momento você acaba tendo que recorrer a outra linguagem para embutir no Apple script e dai vai além do domínio da maioria.

Outra solução menos terrível do que programar, é baixar um app de um terceiro e incluir no meio da automação. Eu não duvido que tenha gente usando um Mac ou um iPhone com alguma automação desse tipo feita no shortcuts e em algum atalho do teclado ou ação rápida. É esse tipo de coisa que as pessoas costumam fazer com ele.

E dai entra outra questão, não é que shortcuts seja ótimo, é que é muito melhor programar juntando bloquinhos que meio que limitam os erros sintáticos e semânticos… Mas ainda é chatão, eu quero poder dizer “faça xyz”, porque é mais fácil ainda.

Natanael.755 · Maio 2, 2024, 11:13am

Não sei se chegou a abrir o link mas a ideia do Idris é a pessoa digitar:

Organize meus arquivos na pasta Downloads por data

E ele dispara isso no terminal:

origem="${HOME}/Downloads"
destino="${HOME}/Downloads/Organizado"
for arquivo in "${origem}"/*; do
    if [ -f "${arquivo}" ]; then
        data_modificacao=$(date -r "${arquivo}" +%Y/%m/%d)
        mkdir -p "${destino}/${data_modificacao}"
        mv "${arquivo}" "${ destino}/${data_modificacao}"
    fi
done

Ou seja, exatamente o que você disse, não tem nada a ver com Apple script, a questão é que ao contrário do que você diz, aparentemente as pessoas simplesmente NÃO querem isso (ou não querem ajudar a custear o desenvolvimento pelo menos, montar esses snippets leva tempo e tempo custa dinheiro, as pessoas (se querem) querem algo que alguém faça pra elas (o que é ok, afinal, eu concordo com você programar é chato) porém sem receber nada, querem que além de fazer, a pessoa cubra todo e qualquer custo de tempo e dinheiro do desenvolvimento… isso não vai rolar

E sim, como está no exemplo, você pode combinar “comandos”:

Baixe a página https://diolinux.com.br/tecnologia/integracao-de-ia-em-distros-linux.html, extraia o texto, abra no writer e formate como ABNT

Ele consegue entender isso, falta os snippets de código

romulopb · Maio 2, 2024, 7:05pm

Eu olhei, há meses, quando você postou. Talvez eu devesse ter tentado ser mais explicito, não é idêntico a AppleScript, mas, na prática, é o mesmo para mim. Eu não sei como te explicar de uma forma diferente, que eu não quero preencher um banco de dados com verbos e snippets te código. Se isso já estivesse pronto, e eu pudesse apenas juntar bloquinhos, seria melhor, ainda seria limitado a um conjunto x de possibilidades, mas seria usável, para o público que eu sei que precisa que isso seja assim. Eu pessoalmente escrevo as automações direto no AppleScript, porque para mim é mais prático, já que programação é meu trabalho. Agora se isso soubesse preencher por conta própria o seu banco de dados… Mas enfim te desejo sorte no seu projeto.

romulopb · Maio 2, 2024, 7:26pm

Falando em Adobe, na minha visão, é o produto que melhor está aproveitando o conceito de IA como uma ferramenta de resolução de problemas muitas vezes subjetivos. Nossa eu ia adorar poder abrir meu Gmail e pedir

“Você pode me dar uma lista de e-mails das Casas Bahia que são meramente propaganda? Sem incluir confirmação de compra, rastreio, etc.”

Ou ainda:

“você pode baixar os currículos que caíram na caixa de correio na última semana e dar uma nota de 0 a 10 baseado nos requisitos XYZ?”