Aplicações de IA são softwares? Ou algo diferente?

ian · Outubro 19, 2024, 7:40pm

Boa tarde, pessoal.

Inteligência Artificial é minha atual linha de pesquisa. Tenho conhecimentos técnicos e práticos sobre a área mas, no final das contas, sou da área jurídica. Gostaria de compartilhar algumas conclusões e gostaria da opinião de vocês sobre o assunto.

Introdução

A minha pesquisa atual trata no sentido de aplicações de IA serem consideradas como autoras, segundo a legislação brasileira (Lei nº 9.610/98) — tendo em vista que no Google Scholar há série de coautorias indicadas ao ChatGPT e na Amazon, ao se fazer uma busca rápida por autores, mais de 6000 resultados indicam a mesma ferramenta como autora. A dúvida que resta é se, legalmente, essas ferramentas poderiam figurar como autoras.

Na minha cabeça, era óbvio que não: aplicações de IA são softwares, e pensar que poderiam ser autores de algo seria o mesmo absurdo que dizer que o Microsoft Word poderia ser autor de um texto.

Mas, conforme fui me aprofundando na legislação, minha tendência foi a entender que esses modelos não seriam softwares.

Um breve disclaimer

Pouco se escreve na academia jurídica em relação a Software e, apenas quando há um hype regulatório (como foi com Proteção de Dados e agora, IA), cria-se um interesse sobre tecnologia, de maneira geral. Esse interesse, quase sempre, vem acompanhado de um desconhecimento técnico e bastante raso, é o que diz Canalli (2021)^[1]:

Um dos principais problemas verificados na condução de processos decisórios – legislativos ou judiciais – que envolvem questões relacionadas aos programas de computador, sejam estas questões de direito tributário, comercial, autoral, consumerista, patentário ou de qualquer outro ramo, está relacionado à falta de conhecimento técnico de legisladores, advogados e magistrados sobre a teoria da computação. Não são raros os exemplos de precedentes judiciais, petições ou artigos doutrinários que apresentam definições e descrições que simplesmente não guardam nenhuma correspondência com o modo como os programas de computador funcionam, resultando em decisões que não têm conexão com a realidade. “Computadores simplesmente não funcionam do modo que alguns documentos legais e precedentes judiciais afirmam que eles operam.” Embora juristas tenham conhecimento gerais sobre eletrônica moderna e, em sua maior parte, uma compreensão básica sobre o funcionamento de computadores, ou mesmo sobre códigos e processos de compilação que transformam códigos-fonte em códigos binários executáveis, permanecem, ainda, distanciados da teoria da computação, a ciência que torna possível o funcionamento de computadores.

Esse sentimento resume minha opinião à área e reflete nas limitações que tenho encontrado para realizar essa pesquisa. E, da mesma forma, indico que essa crítica foi bastante importante para me fazer criar “vergonha na cara” e colocar a cara nos estudos para entender do que estou falando, a nível técnico.

Aproveito também para dizer que não pretendo aqui fazer uma canonização da IA nem um disparate sobre as tecnologias, o uso e sentido que aplico aqui é técnico e pragmático: tentar observar as coisas como são, na sua natureza jurídica.

IAs como software

Na minha concepção, IAs sempre foram softwares. São distribuídos por licença, possuem repositório de código e resolvem problemas definidos.

Essa afirmativa importa, tendo em vista que os softwares, por si só, são considerados obras protegidas segundo a legislação autoral e, portanto, não poderiam ser consideradas autoras^[2]. E, mesmo assim, conforme aprofundava mais no tema, parecia que essas aplicações de IA seriam, de fato, softwares.

Todavia, me prestei a me aprofundar mais no conceito de software, segundo a lei ^[3]. A Lei do Software (Lei nº 9.609/98) diz o seguinte:

Art. 1º Programa de computador é a expressão de um conjunto organizado de instruções em linguagem natural ou codificada, contida em suporte físico de qualquer natureza, de emprego necessário em máquinas automáticas de tratamento da informação, dispositivos, instrumentos ou equipamentos periféricos, baseados em técnica digital ou análoga, para fazê-los funcionar de modo e para fins determinados.

Em resumo, a legislação expressa o seguinte:

Software é um:
– Conjunto de organizado de instruções, em linguagem natural (código-fonte) ou codificada (executável)
– Expresso e contido em algum suporte físico (deve ser expresso em algum hardware) e
– Necessário para o funcionamento de máquinas automáticas (computadores)
– Para fazê-los funcionar de modo e para fins determinados.

Dito isso, outras conclusões são possíveis:

Todo software, em formato de código-fonte ou executável, consiste em um ou mais arquivos (pela necessidade de estar expresso em um hardware), mas nem todo arquivo é um software, tendo em vista que nem todo arquivo contém um conjunto organizado de instruções necessário para o funcionamento de computadores.
– Um arquivo .txt, por exemplo, não pode ser considerado software, pois consiste em um mero conjunto de caracteres e, para se acessar o conteúdo desse arquivo, utiliza-se um outro executável com essa função determinada, seja essa de imprimir o conteúdo daquele arquivo (cat), ou de editar esse arquivo (vim), esses sim que são softwares, por (1) estarem sendo executados diretamente na máquina (binários executáveis) e (2) por atingirem fins determinados (imprimir ou editar esses arquivos).
Portanto, para ser considerado um software, é necessária a figura de (1) o executável ou (2) o código fonte desse executável.
O código-fonte é, dessa maneira, um espelho, uma receita de bolo, do executável e ambos significam o mesmo software. E, para haver um software, basta a presença de um ou o outro.

Estudo de caso

Dessa definição legal que me fez partir para o estudo de caso, em que fiz um scraping dos 500 modelos de IA mais populares no Hugging Face, a fim de buscar arquivos com essas características de código-fonte ou executáveis.

Acontece que esses modelos de IA não seguem a mesma lógica de programação dos softwares tradicionais e, dessa maneira, não possuem código-fonte, pelo menos na mesma forma que se percebe em um projeto em Javascript, C, Java, etc.

Todavia, realizado o scraping, além da ausência de códigos-fonte, o que me impressionou é que também não há, necessariamente^[4], arquivos de natureza executável nesses repositórios.

O que define esses repositórios de IA é a presença dos pesos pré-treinados desses modelos, geralmente na forma de arquivos .bin, .h5 e .safetensors. Esses arquivos são, em poucas palavras, o armazenamento dos pesos do modelo e, para serem utilizados, há a necessidade da criação de um script, geralmente em Python, para se fazer o ajuste fino ou a inferência.

Todavia, esses arquivos contendo os pesos, por si só, não possuem função executável.

De toda forma, os modelos encontrados nos repositórios inegavelmente precisam de um software para interpretar e utilizar os pesos do modelo. Mas, mesmo assim, o modelo então não seria esse conjunto de pesos, em vez do executável que utiliza desse conjunto?

O que me parece, tendo em vista o observado, é que os modelos de IA estariam mais próximos dos arquivos .txt (ou de uma base de dados) do que os executáveis cat e vim e, portanto, não seriam softwares, segundo a definição legal atual.

Para todos os efeitos, respondendo a questão inicial da possibilidade de autoria, bases de dados também são obras protegidas pela legislação autoral e, estritamente o ChatGPT, na função de inferência daquele modelo, é inegavelmente um software, mesmo que seja um wrapper do modelo mas, o modelo em si, não seria um Software e sim esse conjunto de pesos, sem natureza executável.

Qual a opinião de vocês sobre o assunto? Bom fim de semana!

CANALLI, Rodrigo L. A Propriedade Intelectual do Software: análise histórica e crítica. Editora Dialética, 2021. ↩︎
Nesse sentido, analítico-jurídico, seria o mesmo que dizer que um livro poderia ser o autor de alguma obra. ↩︎
A escolha de utilizar a lei como parâmetro de estudo foi uma escolha de ordem prática, tendo em vista que software pode significar uma infinidade de classificações para diversos pesquisadores. ↩︎
Verdade é que foram encontrados, sim, arquivos .py nesses repositórios, que, pela definição legal, suprem o conceito de códigos-fonte e executáveis ao mesmo tempo. Mas esses arquivos geralmente se referem a exemplos para a utilização do modelo, não o modelo em si. ↩︎

Saulo_Ferro_Maciel · Outubro 19, 2024, 10:46pm

Caramba, tiro meu chapéu para você!!

Meu TCC de jornalismo foi sobre IA e como afeta os veículos de comunicação. E cheguei a conclusão que confirma um artigo de como a IA afeta a sociedade de um engenheiro de software, ele diz que nós precisamos entender o termo “softwares inteligentes”.

A IA é o exemplo do ápice evolutivo de um software inteligente, basicamente, enquanto a IA não tem um corpo propiamente capaz de se manter por conta própia, será um software. Isso se deve que nós Humanos cuidamos de forma pessoal dos nossos corpos, e uma IA não, ela precisa de alguém para cuidar dela.

A questão dos softwares inteligentes é que ele categoriza a capacidade de senciência dos programas, por exemplo, estruturas simples de uma página de busca que organiza os resultados por nome das páginas em ordem alfabética seria o nível mais básico de senciência, uma página de busca que organiza os resultados pela quantidade de acesso ao conteúdo seria um nível moderado, agora uma página de busca que usa IA para resumir diretamente o tema via várias fontes seria o novo ápice da inteligência computacional. Porém, nenhum dos exemplos a página faz tudo sozinha, ela precisa que tenha um filtro, esse filtro seria o paradigma “homem-máquina” onde devido às nossas necessidades acabamos influenciando na tomada de decisão, isso quer dizer que a IA não é independente pois ela não ver o mundo material e sim apenas o mundo das ideias.

Em suma, ainda é um software de computador pois ela é um espelho da nossa mente e não um individuo própio. E encontrei fontes que alegam que IA é um espelho exclusivo nosso, mas que outros animais também podem ser “espelhados” e isso já foi feito com moscas e abelhas, onde cientistas conseguiram criar uma IA que se torna um clone do individuo abelha ou mosca.

ian · Outubro 19, 2024, 11:24pm

Muito massa!

Admito que ao escolher uma análise do tema pela perspectiva jurídica acaba me limitando bastante. Essa perspectiva traz a vantagem de poder “ignorar” as mais diversas teses sobre o assunto e focar com uma moldura específica, no caso técnica. Mas essa perspectiva também traz uma espécie de alienação de outras teses interessantes para explicar o fenômeno.

Outro aspecto limitador é que a Lei do Software é de 98. É completamente defasada e os artigos que tratam de licenciamento não acompanham, necessariamente, os métodos mais modernos de comercialização (não há regulação específica em se tratando de SaaS, por exemplo). Isso pode ser contornado com precedentes, sim, mas a lei ainda é antiquada.

Ao se chegar na conclusão, especificamente pelo que indica a Lei, que esses modelos não são softwares, observa-se que não haveria proteção autoral desses modelos, nos moldes de software, ao menos.

Por fim, o que eu observo é que há necessidade de uma nova lei indicando a natureza jurídica desses modelos ou a alteração da legislação original para incluir esses modelos (na forma dos pesos contidos) como software ou como uma nova espécie, a fim de garantir a proteção autoral.

Saulo_Ferro_Maciel · Outubro 19, 2024, 11:40pm

Aí vem uma coisa que estava conversando com um amigo advogado. A lei de 98 protege as ferramentas como linguagem de programação, motores gráficos e emuladores matemáticos computacionais.

Como a lei de 98 protege essas tecnologias que, em paralelo, seriam os “átomos” da computação, a IA é construída com esses átomos, então, através da dialética o advogado poderia conseguir proteger os direitos de propriedade de uma IA perante a área jurídica.