Boa tarde, pessoal.
Inteligência Artificial é minha atual linha de pesquisa. Tenho conhecimentos técnicos e práticos sobre a área mas, no final das contas, sou da área jurídica. Gostaria de compartilhar algumas conclusões e gostaria da opinião de vocês sobre o assunto.
Introdução
A minha pesquisa atual trata no sentido de aplicações de IA serem consideradas como autoras, segundo a legislação brasileira (Lei nº 9.610/98) — tendo em vista que no Google Scholar há série de coautorias indicadas ao ChatGPT e na Amazon, ao se fazer uma busca rápida por autores, mais de 6000 resultados indicam a mesma ferramenta como autora. A dúvida que resta é se, legalmente, essas ferramentas poderiam figurar como autoras.
Na minha cabeça, era óbvio que não: aplicações de IA são softwares, e pensar que poderiam ser autores de algo seria o mesmo absurdo que dizer que o Microsoft Word poderia ser autor de um texto.
Mas, conforme fui me aprofundando na legislação, minha tendência foi a entender que esses modelos não seriam softwares.
Um breve disclaimer
Pouco se escreve na academia jurídica em relação a Software e, apenas quando há um hype regulatório (como foi com Proteção de Dados e agora, IA), cria-se um interesse sobre tecnologia, de maneira geral. Esse interesse, quase sempre, vem acompanhado de um desconhecimento técnico e bastante raso, é o que diz Canalli (2021)[1]:
Um dos principais problemas verificados na condução de processos decisórios – legislativos ou judiciais – que envolvem questões relacionadas aos programas de computador, sejam estas questões de direito tributário, comercial, autoral, consumerista, patentário ou de qualquer outro ramo, está relacionado à falta de conhecimento técnico de legisladores, advogados e magistrados sobre a teoria da computação. Não são raros os exemplos de precedentes judiciais, petições ou artigos doutrinários que apresentam definições e descrições que simplesmente não guardam nenhuma correspondência com o modo como os programas de computador funcionam, resultando em decisões que não têm conexão com a realidade. “Computadores simplesmente não funcionam do modo que alguns documentos legais e precedentes judiciais afirmam que eles operam.” Embora juristas tenham conhecimento gerais sobre eletrônica moderna e, em sua maior parte, uma compreensão básica sobre o funcionamento de computadores, ou mesmo sobre códigos e processos de compilação que transformam códigos-fonte em códigos binários executáveis, permanecem, ainda, distanciados da teoria da computação, a ciência que torna possível o funcionamento de computadores.
Esse sentimento resume minha opinião à área e reflete nas limitações que tenho encontrado para realizar essa pesquisa. E, da mesma forma, indico que essa crítica foi bastante importante para me fazer criar “vergonha na cara” e colocar a cara nos estudos para entender do que estou falando, a nível técnico.
Aproveito também para dizer que não pretendo aqui fazer uma canonização da IA nem um disparate sobre as tecnologias, o uso e sentido que aplico aqui é técnico e pragmático: tentar observar as coisas como são, na sua natureza jurídica.
IAs como software
Na minha concepção, IAs sempre foram softwares. São distribuídos por licença, possuem repositório de código e resolvem problemas definidos.
Essa afirmativa importa, tendo em vista que os softwares, por si só, são considerados obras protegidas segundo a legislação autoral e, portanto, não poderiam ser consideradas autoras[2]. E, mesmo assim, conforme aprofundava mais no tema, parecia que essas aplicações de IA seriam, de fato, softwares.
Todavia, me prestei a me aprofundar mais no conceito de software, segundo a lei [3]. A Lei do Software (Lei nº 9.609/98) diz o seguinte:
Art. 1º Programa de computador é a expressão de um conjunto organizado de instruções em linguagem natural ou codificada, contida em suporte físico de qualquer natureza, de emprego necessário em máquinas automáticas de tratamento da informação, dispositivos, instrumentos ou equipamentos periféricos, baseados em técnica digital ou análoga, para fazê-los funcionar de modo e para fins determinados.
Em resumo, a legislação expressa o seguinte:
- Software é um:
– Conjunto de organizado de instruções, em linguagem natural (código-fonte) ou codificada (executável)
– Expresso e contido em algum suporte físico (deve ser expresso em algum hardware) e
– Necessário para o funcionamento de máquinas automáticas (computadores)
– Para fazê-los funcionar de modo e para fins determinados.
Dito isso, outras conclusões são possíveis:
- Todo software, em formato de código-fonte ou executável, consiste em um ou mais arquivos (pela necessidade de estar expresso em um hardware), mas nem todo arquivo é um software, tendo em vista que nem todo arquivo contém um conjunto organizado de instruções necessário para o funcionamento de computadores.
– Um arquivo.txt
, por exemplo, não pode ser considerado software, pois consiste em um mero conjunto de caracteres e, para se acessar o conteúdo desse arquivo, utiliza-se um outro executável com essa função determinada, seja essa de imprimir o conteúdo daquele arquivo (cat
), ou de editar esse arquivo (vim
), esses sim que são softwares, por (1) estarem sendo executados diretamente na máquina (binários executáveis) e (2) por atingirem fins determinados (imprimir ou editar esses arquivos). - Portanto, para ser considerado um software, é necessária a figura de (1) o executável ou (2) o código fonte desse executável.
- O código-fonte é, dessa maneira, um espelho, uma receita de bolo, do executável e ambos significam o mesmo software. E, para haver um software, basta a presença de um ou o outro.
Estudo de caso
Dessa definição legal que me fez partir para o estudo de caso, em que fiz um scraping dos 500 modelos de IA mais populares no Hugging Face, a fim de buscar arquivos com essas características de código-fonte ou executáveis.
Acontece que esses modelos de IA não seguem a mesma lógica de programação dos softwares tradicionais e, dessa maneira, não possuem código-fonte, pelo menos na mesma forma que se percebe em um projeto em Javascript, C, Java, etc.
Todavia, realizado o scraping, além da ausência de códigos-fonte, o que me impressionou é que também não há, necessariamente[4], arquivos de natureza executável nesses repositórios.
O que define esses repositórios de IA é a presença dos pesos pré-treinados desses modelos, geralmente na forma de arquivos .bin
, .h5
e .safetensors
. Esses arquivos são, em poucas palavras, o armazenamento dos pesos do modelo e, para serem utilizados, há a necessidade da criação de um script, geralmente em Python, para se fazer o ajuste fino ou a inferência.
Todavia, esses arquivos contendo os pesos, por si só, não possuem função executável.
De toda forma, os modelos encontrados nos repositórios inegavelmente precisam de um software para interpretar e utilizar os pesos do modelo. Mas, mesmo assim, o modelo então não seria esse conjunto de pesos, em vez do executável que utiliza desse conjunto?
O que me parece, tendo em vista o observado, é que os modelos de IA estariam mais próximos dos arquivos .txt
(ou de uma base de dados) do que os executáveis cat
e vim
e, portanto, não seriam softwares, segundo a definição legal atual.
Para todos os efeitos, respondendo a questão inicial da possibilidade de autoria, bases de dados também são obras protegidas pela legislação autoral e, estritamente o ChatGPT, na função de inferência daquele modelo, é inegavelmente um software, mesmo que seja um wrapper do modelo mas, o modelo em si, não seria um Software e sim esse conjunto de pesos, sem natureza executável.
Qual a opinião de vocês sobre o assunto? Bom fim de semana!
CANALLI, Rodrigo L. A Propriedade Intelectual do Software: análise histórica e crítica. Editora Dialética, 2021. ↩︎
Nesse sentido, analítico-jurídico, seria o mesmo que dizer que um livro poderia ser o autor de alguma obra. ↩︎
A escolha de utilizar a lei como parâmetro de estudo foi uma escolha de ordem prática, tendo em vista que software pode significar uma infinidade de classificações para diversos pesquisadores. ↩︎
Verdade é que foram encontrados, sim, arquivos
.py
nesses repositórios, que, pela definição legal, suprem o conceito de códigos-fonte e executáveis ao mesmo tempo. Mas esses arquivos geralmente se referem a exemplos para a utilização do modelo, não o modelo em si. ↩︎