twitter

'ChatGPT português' Amália tem um investimento previsto de 5,5 milhões

'ChatGPT português' Amália tem um investimento previsto de 5,5 milhões
Fotografia

Agência Lusa

Agência noticiosa

Publicado em 29 de novembro de 2024, às 17:26

Segundo anunciou hoje o Ministério da Juventude e Modernização

O grande modelo de linguagem (LLM) português Amália, que tem por trás a mesma tecnologia do ChatGPT, tem "previsto um investimento de 5,5 milhões de euros", anunciou hoje o Ministério da Juventude e Modernização.

"Esta iniciativa tem previsto um investimento de 5,5 milhões de euros e um calendário de trabalho e desenvolvimento de 18 meses, do qual resultará uma primeira versão multimodal do Amália", lê-se no comunicado.

A este montante "acresce o vasto investimento já realizado em infraestrutura de computação, projetos de desenvolvimento e recursos humanos especializados que contribuirão em grande medida para o desenvolvimento do LLM", sendo que "o financiamento necessário à concretização do LLM português é assegurado no âmbito do Plano de Recuperação e Resiliência (PRR) e será desenvolvido inteiramente por entidades públicas", adianta o ministério.

"O financiamento do projeto estará exclusivamente destinado às entidades públicas envolvidas no desenvolvimento do Amália".

Na sequência do anúncio do primeiro-ministro sobre o lançamento do primeiro modelo de linguagem em grande escala de língua portuguesa de Portugal, em 11 de novembro, realizou-se hoje uma reunião interministerial entre os dois ministros que coordenam a iniciativa – a ministra da Juventude e Modernização e o ministro da Educação, Ciência e Inovação.

"É uma prioridade do Governo português o desenvolvimento e lançamento do primeiro LLM de língua portuguesa de Portugal, o Amália, 'Assistente Multimodal Automático de Linguagem com Inteligência Artificial'", uma iniciativa que "é a primeira divulgada no âmbito da Agenda Nacional de Inteligência Artificial que será apresentada de forma consolidada no primeiro trimestre de 2025".

Ao longo de ano e meio (18 meses), "serão disponibilizadas diversas versões do Amália à medida que forem desenvolvidas novas funcionalidades", refere. Assim, no final de março será disponibilizada a versão beta do Amália, no terceiro trimestre de 2025 uma versão bas e no segundo trimestre de 2026 será disponibilizado um Amália versão multimodal.

"Numa fase inicial, o Amália será criado através da conjugação dos esforços realizados no desenvolvimento do EuroLLM, do GlórIA e do v-Glória, será capaz de diferenciar as variantes da língua portuguesa e será treinado com dados do Arquivo.pt previamente curados".

Esta versão beta do Amália conseguirá receber e interpretar instruções em formato de texto e responder com base no conhecimento adquirido, também em texto escrito em português de Portugal, adianta.

"Até ao final do terceiro trimestre de 2025, serão curados novos dados sobre a língua, a cultura e história de Portugal. Estes dados serão provenientes de fontes como o Arquivo.pt, e serão utilizados para treinar o Amália na sua versão base. Só nesta versão será possível gerar respostas fiáveis e precisas sobre estas temáticas, bem como responder a questões com total segurança e sem risco para o utilizador", refere.

Nesta altura, o Amália "já poderá ser integrado noutras aplicações externas e utilizar dados dessas fontes para gerar respostas de texto".

O ministério da Juventude e Modernização salienta que "todas as versões desenvolvidas serão disponibilizadas de forma gratuita e em 'open source', para que seja utilizado por todos, incluindo Academia, centros de investigação, entidades públicas, empresas e cidadãos".

Além das versões do LLM, "todos os dados que suportam o treino serão disponibilizados em dados abertos, criando assim uma infraestrutura nacional de Inteligência Artificial que potencia o ecossistema de inovação da inteligência artificial em Portugal. O LLM português poderá ser aplicado a diversos domínios de atividade, sendo necessário afiná-lo e treiná-lo com dados específicos dos setores de atuação, como educação, saúde, serviços públicos", entre outros, prossegue.

No final dos 18 meses do primeiro projeto de desenvolvimento, a versão multimodal do Amália "já será capaz de interpretar diversos formatos de dados", como texto, imagem e vídeo.

"Esta versão final do LLM será diferenciadora na interpretação e geração de texto de língua portuguesa, no conhecimento que tem da literatura, cultura e história de Portugal. No entanto, o objetivo deste LLM não é de responder a perguntas genéricas em que o foco é a realização de raciocínios ou cálculos complexos, havendo outros LLM no mercado com bom desempenho nessas tarefas", aponta.

O Amália estará disponível "para todos de forma aberta e gratuita, para que possam utilizá-lo para concretizar os seus projetos".

Nos últimos anos tem havido iniciativas em vários países de desenvolver LLM próprios, proficientes nas línguas dos países envolvidos, nomeadamente o Alia, que fala castelhano, catalão, galego e basco, e o Viking 7B, que fala dinamarquês, finlandês, norueguês, islandês e sueco, entre outros exemplos, aponta o Governo.