Definindo a tarefa e os requisitos técnicos do sistema de IA: NIST AI RMF Map 2.1

O NIST AI Risk Management Framework (AI RMF) foi concebido como um quadro voluntário aplicável a qualquer organização envolvida na conceção, desenvolvimento, implementação ou utilização de sistemas de inteligência artificial. Não é um requisito de conformidade obrigatório da mesma forma que alguns regulamentos o são (por exemplo, a Lei de IA da UE). No entanto, oferece diretrizes muito úteis - pense nele como um guia para ajudar a sua organização a garantir que os benefícios da IA são realizados de forma responsável.

Do que trata o Map 2.1?

A tarefa do seu sistema de IA está claramente definida? Evite estas armadilhas comuns ao alinhar-se com o NIST AI RMF 2.1:

A definição é demasiado vaga

“O sistema aprenderá a melhorar a satisfação do cliente.” Como medirá a melhoria? Que ações o sistema de IA tomará?

A IA aprenderá a reduzir os tempos de espera dos clientes no suporte telefónico, prevendo o volume de chamadas e analisando o tipo de chamada esperado e otimizando o agendamento dos agentes.

O âmbito é demasiado ambicioso

“O sistema resolverá todos os nossos problemas de atendimento ao cliente.”

Sério?

Ignorar pressupostos e limitações (relacionados com os dados, ambiente ou comportamento do utilizador)

Pressupostos ocultos podem levar a falhas inesperadas. Limitações não são falhas.

Pressupostos:

O histórico médico e os sintomas do paciente são registados com precisão no registo de saúde eletrónico.
As imagens utilizadas para diagnóstico são de qualidade e resolução suficientes.
A linguagem utilizada em e-mails de spam será predominantemente as línguas em que o filtro foi treinado. Limitação: O sistema pode ter dificuldades com perguntas que exigem uma compreensão matizada de sarcasmo ou humor.

Especificações e requisitos técnicos não estão claramente definidos

A IA deve ser rápida e precisa. O sistema de deteção de fraude alimentado por IA deve atingir uma pontuação F1 mínima de X num conjunto de dados de teste reservado de pelo menos Y transações. O sistema deve ser capaz de lidar com um volume de transações de até Z transações por segundo.

Nenhuma documentação de desenvolvimento, teste, métricas e desempenho

O sistema foi treinado num grande conjunto de dados e testado extensivamente. O sistema de tradução foi desenvolvido usando a arquitetura X. Os dados de treino consistiram em textos paralelos em inglês e espanhol, provenientes de conjuntos de dados publicamente disponíveis e do nosso corpus interno. Empregámos a pontuação BLEU como a métrica de avaliação primária. O sistema alcançou uma pontuação BLEU média de 0,85 no conjunto de teste.

Nenhuma referência às suas práticas de gestão de dados baseadas na responsabilização

A nossa organização adere aos Princípios de Privacidade da OECD. Implementámos as seguintes práticas de gestão e proteção de dados: …

Nenhum alinhamento das especificações com metas e objetivos

As especificações técnicas para o sistema incluem rastreamento de inventário em tempo real com 99% de precisão e pedidos automatizados com base em limites predefinidos e otimizados para custo e tempo de entrega. Estas especificações apoiam diretamente os objetivos de reduzir as ruturas de stock e minimizar o desperdício, permitindo uma previsão de procura mais precisa, melhor visibilidade do inventário e processos de pedido otimizados.

Reveja estes pontos: ao definir clara e estritamente as tarefas do seu sistema, torna mais fácil mapear benefícios e riscos, o que melhora a gestão de risco.