Primeiras impressões com Amazon Bedrock Agentcore

À medida que continuamos a ver os agentes da IA ​​progredirem em suas capacidades e versatilidade, tenho ouvido os desenvolvedores de que a maioria de sua experiência em implantar agentes permanece local e experimental. Esteja você desenvolvendo agentes com ferramentas como agentes de fios, tripulação AI, Langgraph e outros, o fato do assunto está passando do POC para o pronto para produção é misturado, se não impossível em escala. Neste post, abordarei alguns princípios básicos em um novo serviço da AWS para abordar isso e minha primeira experiência o usá -lo. Agora, ao olharmos para esse desafio que mencionei com o POC → Production, não é surpreendente ver o lançamento de visualização do Amazon Bedrock Agentcore tentando preencher essa lacuna necessária para os desenvolvedores. Para aqueles que não sabem, em 16 de julho, a AWS anunciou o AgentCore para permitir que os desenvolvedores implantem agentes de IA em escala usando os ideais bem conhecidos de uma infraestrutura flexível e escalável e controles essenciais de segurança (entre outras coisas). Das muitas coisas interessantes que virão com este anúncio, é um modelo mental um tanto único para um serviço de serviço da AWS que se apresenta como uma caixa de ferramentas modular (pense em peças LEGO) de componentes, permitindo que os desenvolvedores escolham quais componentes eles precisam e usá-los juntos ou de forma independente como suas mudanças no caso de uso. Além de sua modularidade, o AgentCore está tentando se destacar oferecendo a escolha da estrutura do modelo e do agente (ou seja, você não precisa usar a Amazon Bedrock e usar estruturas de código aberto). Compreendendo os componentes do AgentCore 🧩 Aqui está uma análise simples dos 7 componentes do AgentCore que estão no Visualizar: AgentCore RunTime: um tempo de execução seguro e sem servidor para implantar e escalar agentes e ferramentas de IA usando qualquer estrutura de código aberto, qualquer protocolo e qualquer modelo. Identidade AgentCore: uma capacidade de identidade e gerenciamento de acesso segura e escalável. Compatível com os provedores de identidade existentes, eliminando as necessidades de migração de usuários ou reconstruindo os fluxos de autenticação. Memória do AgentCore: fornece suporte para memória de curto prazo para conversas com várias turnos e memória de longo prazo que podem ser compartilhadas entre agentes e sessões. Interpretador de código do AgentCore: permite que os agentes executem código com segurança em ambientes isolados de sandbox. Oferece suporte avançado de configuração e integração perfeita com estruturas populares. Browser AgentCore: fornece um tempo de execução rápido, seguro e baseado em nuvem para permitir que os agentes da IA ​​interajam com sites em escala. Gateway AgentCore: uma maneira segura para os agentes descobrirem e usarem ferramentas, juntamente com a fácil transformação de APIs, funções lambda e serviços existentes em ferramentas compatíveis com agentes. Observabilidade do AgentCore: ajuda os desenvolvedores a rastrear, depurar e monitorar o desempenho do agente na produção por meio de painéis operacionais unificados. Suporte à telemetria compatível com OpenElemetria e visualizações detalhadas de cada etapa do fluxo de trabalho do agente. A partir deste post, a pré -visualização do Bedrock AgentCore está atualmente disponível apenas no East dos EUA (N. Virgínia), US West (Oregon), Ásia -Pacífico (Sydney) e Europa (Frankfurt). Minha experiência com o tempo de execução do AgentCore 🔨 Tomei um dia para invadir o Agentcore sem saber absolutamente nada sobre isso e, embora não possa dizer que foi uma experiência completamente amigável, vou passo a passo que eu gostei e o que espero que a equipe que trabalhe nele possa melhorar à medida que se preparar para a disponibilidade geral. Comecei minha jornada do AgentCore indo para o local que achei que tinha a melhor configuração para um verdadeiro iniciante: as amostras oficiais do AWS Github, daqui havia várias opções para o que eu queria aprender: 1) Hospedando agentes de Runnime2) Hospedando um servidor MCP no primeiro tempo de execução 3) Os conceitos avançados 4) que se baseiam no MCP de Run Opted para o RunTime para o primeiro tempo de RunTime para o primeiro tempo de Run Opted para o primeiro tempo de Run Opted Ittime para o primeiro tempo de Run Opted Ittime 3). Estrutura dos agentes de Strands e queriam usar minha chave de API Antópica, então segui o exemplo do Openai para o meu hack, pois era o mais próximo do que eu queria fazer. Nota: Embora eu geralmente seja fã de notebooks Jupyter, achei este um pouco desafiador a seguir e notei que acrescenta muita complexidade ao que já é um serviço um tanto complexo de usar. Eu dei feedback à equipe, mas queria compartilhar meus 2 centavos se você também estiver usando alguns desses tutoriais de notebooks. O exemplo no notebook cria uma ferramenta para o agente que eu optei e, em vez disso, uso uma ferramenta de fios pré-existente para uso da AWS. Meu código parece um pouco diferente do que você encontrará no notebook. Para o contexto, aqui está como é o meu arquivo agente.py e como eu o preparei para uso com o tempo de execução do AgentCore. ⚠️Note: A ferramenta Use_AWS procura meu perfil da AWS localmente para autenticar usando ~/.aws/credenciais, você precisará dessa configuração antes de tentar usar essa ferramenta ou qualquer outra que exija a conta do AWS. importar os os de bedrock_agentcore.Runtime Importar BedrockAgentCoreApp do agente de importação de fios de strands.models.Antrópicos Importar antropicmodel de strands_tools import use_aws de gravação = BedrockAgentCoreApp () Model = AnthropModel (clientgs =) ** Model_config max_tokens = 1028, model_id = “Claude-Sonnet-4-20250514”, params = {“temperatura”: 0.3,}) agente = agente (modelo = modelo, ferramentas = ferramentas =[use_aws]) @app.entrypoint def strands_agent_antrópico (carga pago): “” “Invoca o agente com uma carga útil” “user_input = Payload.get (” prompt “) resposta = agente (user_input) Resposta de retorno.Message[“content”][0][‘text’].Place (‘\\ n’, ‘\ n’) se __name__ == “__Main__”: app.run () Digite o modo de tela cheia Sair do modo de tela cheia coisas principais a serem destacadas aqui estão as linhas de código que você precisa para que a importação: importar o seu agente para funcionar com o tempo de execução, eles estão listados no local, mas eu vou compartilhar aqui, para a importação. BedrockAgentCoreApp Inicialize o aplicativo em seu código com app = BedrockAgentCoreApp () Decore a função de invocação com o @app.entrypoint decorator Deixe o agente o tempo de execução controlar o funcionamento do agente com app.run () assim que estiver concluído, preciso implantar o agente para o tempo de execução. Isso pode ser feito de duas maneiras, manualmente (várias outras etapas, mais para gerenciar e requer experiência com o Docker) ou o uso do AgentCore Starter Toolkit, que é um kit de ferramentas da CLI que gerencia muitas das etapas de implantação para você. Para aqueles que desejam manter o controle total sobre a implementação de seu agente, esta seção da documentação descreve como implantar agentes para o tempo de execução sem o kit de ferramentas. Usando o kit de ferramentas iniciantes, as próximas etapas são bastante simples. 1) Configure o agente com os valores padrão usando: AgentCore Configure -e agent.py no terminal. 2) Hospedar o agente no tempo de execução usando: Launchamento do AgentCore no terminal. Se tudo corre bem no back-end, eu deveria ver uma mensagem de sucesso no terminal que se parece: para invocar o agente, posso usar o agentcore invocar ‘{“prompt”: “quantos VPCs eu tenho em US-West-2?”}’ ‘, Que é o que é o que é o que é o que é o que é o que é o que eu utiliza, como o que é o que eu utilizo, como o que eu usa uma ferramenta de que eu usa a ferramenta para extrair informações em minha conta). Cubro rapidamente os pontos de dor que descobri ao longo do caminho … desafios, pontos de dor etc. 😵‍💫 Ao usar os notebooks de amostra, não há menção de permitir a observabilidade para o agente, que é um requisito, conforme declarado na etapa 1 da documentação de início. Tldr; Você precisa ativar a pesquisa de transações do CloudWatch para que o tempo de execução do AgentCore invocar seu agente corretamente. Isso levou a vários erros difíceis de invocar/rastrear no meu terminal. Meu agente em particular estava executando uma operação de BOTO3 usando o EC2 e, portanto, exigia permissões IAM que não são padrão. Encontrar o papel de execução do IAM para o agente editar essas permissões foi particularmente complicado. FYI Você pode encontrar essa função de execução do agente de uma de três maneiras: 1) pesquisar no console do IAM AWS por “agente ‘” e trabalhar de volta para encontrar a função 2) Abra o arquivo YAML oculto gerado no momento da configuração e a renda de execução, que não é a correção za. Simonia e o kit de ferramentas de início foi valioso, no entanto, ainda há muito espaço para as pessoas se soltarem ao usar isso e, infelizmente, os próprios exemplos precisam de uma nitidez para evitar armadilhas comuns. Nas próximas semanas, estou procurando explorar outros componentes do AgentCore, como memória e gateway, então fique atento a isso. Não se esqueça de me dar um 🦄 se você chegasse tão longe e me diga o que mais gostaria de ver uma escrita nos comentários! Recursos adicionais 📚

Fonte

Você pode ter perdido