Foundation Models (FMs) são a base das tecnologias de inteligência artificial generativa (GenAI) e têm atraído atenção significativa de acadêmicos e indústrias. Em particular, os modelos de linguagem de grande escala (LLMs) destacam-se pela sua capacidade de entender e gerar conteúdo humano, impulsionando o desenvolvimento de uma ampla gama de tarefas que utilizam esses modelos.
Com o crescimento do interesse em agentes autônomos baseados em FMs, como AutoGPT e BabyAGI, esses agentes podem assumir um papel proativo para alcançar metas definidas pelos usuários. No entanto, a construção e implementação de agentes baseados em FM apresentam desafios, como a dificuldade em compreender e executar tarefas complexas, a limitação de informações contextuais fornecidas pelos usuários e a falta de explicabilidade em suas arquiteturas internas.
- Catálogo de Padrões: Uma coleção de padrões arquitetônicos que oferece soluções de design para implementações práticas de agentes.
- Ecosistema de Agentes: Um guia com anotações sobre padrões arquitetônicos para auxiliar no design e desenvolvimento de agentes baseados em FM.
- Análise Curada: Cada padrão inclui contexto de aplicação, problemas abordados, benefícios e trade-offs em atributos de qualidade de software, usos conhecidos no mundo real e relações com outros padrões.
Este repositório visa ser uma fonte de referência para profissionais que desejam entender e aplicar padrões de design em agentes baseados em modelos de fundação.
Padrão | Descrição |
---|---|
Criador de meta passivo | Analisa os prompts articulados dos usuários através da interface de diálogo para preservar a interatividade, busca de metas e eficiência. |
Criador de meta proativo | Antecipar as metas dos usuários ao entender as interações humanas e capturar o contexto por meio de ferramentas relevantes, para melhorar a interatividade, a busca de metas e a acessibilidade. |
Otimizador de prompt/saídas | Otimizando os prompts/respostas de acordo com o conteúdo de entrada ou saída desejado e formato para fornecer padronização, alinhamento de metas, interoperabilidade e adaptabilidade. |
RAG-Agents | Melhora a atualizabilidade do conhecimento dos agentes enquanto mantém a privacidade dos dados de implementações de modelos/base de fundação on-premise. |
Consulta única ao LLM | Acesse o modelo de fundação em uma única instância para gerar todas as etapas necessárias do plano para eficiência de custo e simplicidade. |
Consulta incremental | Acesse o modelo de fundação em cada etapa do processo de geração de planos para fornecer contexto suplementar, melhorar a certeza do raciocínio e a explicabilidade. |
Gerador de planos de caminho único | Orquestra a geração de etapas intermediárias que levam à realização da meta do usuário para melhorar a certeza do raciocínio, coerência e eficiência. |
Gerador de planos de múltiplos caminhos | Permite a criação de múltiplas escolhas em cada etapa intermediária para alcançar as metas dos usuários, melhorando a certeza do raciocínio, coerência, alinhamento às preferências humanas e inclusividade. |
Auto-reflexão | Permite que o agente gere feedback sobre o plano e o processo de raciocínio e forneça orientações de refinamento a partir de si mesmo para melhorar a certeza do raciocínio, explicabilidade, melhoria contínua e eficiência. |
Reflexão cruzada | Usa diferentes agentes ou modelos de fundação para fornecer feedback e refinar o plano gerado e o processo de raciocínio para melhor certeza do raciocínio, explicabilidade, inclusividade e escalabilidade. |
Reflexão/feedback humana | Coleta feedback dos humanos para refinar o plano e o processo de raciocínio, para alinhar efetivamente às preferências humanas, melhorando a contestabilidade e a eficácia. |
Colaboradores por votação | Permite a expressão livre de raciocínios entre agentes e chega a um consenso por meio da submissão de seus votos para preservar justiça, responsabilidade e inteligência coletiva. |
Colaboradores por papéis | Atribui papéis diversos e finaliza decisões de acordo com os papéis dos agentes para facilitar a divisão de trabalho, tolerância a falhas, escalabilidade e responsabilidade. |
Colaboradores por debate | Fornece e recebe feedback entre múltiplos agentes que ajustam os pensamentos e comportamentos durante o debate com outros agentes até que um consenso seja alcançado, para melhorar adaptabilidade, explicabilidade e pensamento crítico. |
Guardrails multimodais | Controla as entradas e saídas dos modelos de fundação para atender a requisitos específicos, como requisitos do usuário, padrões éticos e leis, para melhorar robustez, segurança, alinhamento de padrões e adaptabilidade. |
Registro de agentes/ferramentas | Mantém uma fonte unificada e conveniente para selecionar diversos agentes e ferramentas para melhorar a descobribilidade, eficiência, adequação das ferramentas e escalabilidade. |
Adaptadores | Conecta o agente e as ferramentas aprendendo novas interfaces e convertendo interfaces incompatíveis em esperadas, garantindo interoperabilidade e adaptabilidade, além de reduzir custos de desenvolvimento. |
Avaliadores | Fornece interface para conectar o agente e ferramentas externas para a conclusão de tarefas, garantindo a adequação funcional e adaptabilidade com maior flexibilidade. |