Construindo agentes de IA multimodais escaláveis com agentes fios e vetores da Amazon S3
🇻🇪🇨🇱 Dev.To LinkedIn Github Twitter Instagram YouTubelinktr Github Repositorie: Strands Agent Amostras Parte 3: Adicionando memória persistente com agentes de IA sofisticados da Amazon S3 Vector Building Agents não precisam ser complexos. Como demonstramos na minha primeira postagem no blog, a estrutura de código aberto do Strands Agent torna notavelmente simples criar agentes de IA multimodais com apenas algumas linhas de código. Esteja você processando imagens, documentos ou vídeos, a Strands mantém essa simplicidade enquanto fornece recursos poderosos. Esta postagem continua minha série de desenvolvimento de agentes de IA, construindo em nossa exploração anterior de agentes de IA multimodais com a estrutura do agente da Strands usando o FAISS para armazenamento local de memória. Agora, avançamos para os recursos de escala corporativa com os vetores da Amazon S3-o serviço de armazenamento de objetos da AWS com suporte ao vetor nativo que transforma como você cria aplicativos de IA escaláveis sem sacrificar a simplicidade que torna o agente de fios tão acessível. Da memória local à nuvem: pronta para a produção, enquanto o FAISS funciona efetivamente para o desenvolvimento e prototipagem local, os agentes da IA de produção exigem recursos escaláveis. Os vetores da Amazon S3 fornecem esses recursos com vantagens de custo em comparação com os bancos de dados de vetores tradicionais, mantendo o desempenho da consulta de subsegunda em escala. Recursos principais dos vetores da Amazon S3 Amazon S3 Oferece armazenamento de objetos em nuvem com suporte ao vetor nativo. Essa abordagem reduz a complexidade do gerenciamento da infraestrutura vetorial separada, ao mesmo tempo em que fornece: escalabilidade maciça: cada índice de vetores suporta serviço gerenciado de armazenamento vetorial em larga escala: totalmente gerenciado com a otimização automática Segurança da empresa: a AWS de Bucking Aws Better Sett (AWS IAM) Integração com o usuário SIGOT SIGATILIONABILIDADE GLOBALIBILIVAÇÃO AWS ACLOTENSTER EMPREGOT EMPRESCONTRO DO RECUPERAÇÃO DE RESPOSTRA IG (AWS) SIGAT SIGAT SIONET SOLATIONATIVABIONABIONATIVA DA ISOLATIONET Recuperação de resumo e desastre de resumo 1 Sirva como o back -end para a sua memória vetorial. Pontos importantes de configuração: verifique se o bucket está na mesma região em que você executará seu aplicativo Ative o versão para configuração adicional de segurança de segurança IAM Políticas de acesso ao IAM Buckets e Indexes Vetores S3 apresenta um tipo de balde projetado especificamente para dados vetoriais. Dentro de cada balde, você pode criar vários índices de vetores, cada um capaz de armazenar vetores com metadados anexados para filtragem sofisticada. Métricas de distância e desempenho Os vetores Amazon S3 suporta cálculos de distância cosseno e euclidiano. Agente de processamento de conteúdo multimodal aprimorado, ele está aqui neste notebook Nossos agentes de fios atualizados agora suporta vetores S3 usam nativamente a ferramenta S3_memory, fornecendo: Operações de memória do núcleo armazenamento de memória (): persiste conversas e insights de peitados com o relatório de busca (): constatação de context (): insiste as conversas com reportações com as informações de retenção com as informações sobre o contexto da consulta () e a listagem de contextos (): ENURETOREDEDORESTENS e as idéias de reletos e as idéias de contextos (): as insistidas de gestas e as idéias de gestas e as idéias relatadas com as idéias e as idéias de gestas com as informações sobre as informações sobre as dentes () e as idéias de contexto (): insiste as idéias de gestas com as informações sobre as dentes (): Auto_Context (): Continuidade dinâmica Continuidade do processamento de conteúdo multimodal Semelhante à nossa implementação do FAISS, o novo agente mantém suporte total para processamento de imagens, documentos e vídeos com memória persistente e transversal. 🛠️ Configurando o agente aprimorado primeiro, você precisa definir as variáveis: # Configuração do ambiente para S3 Vectors Vector_bucket_name = “Your-vector-Bucket” Vector_index_name = “agente-Memory-Index” User_id = “exclusivo-ususer-Identifier” # For Usuário. Modelo de configuração = BedrockModel (model_id = “US.Antrópico.CLAUDE-3-5-SONNET-20241022-V2: 0”, Region = “US-EAST-1”) # Sistema Prompt para Memonsting com Memorility com Memonsodal_sysem_prompt = “” “Você é um assistente de Memodal com multimodal. ** Análise multimodal **: Processar imagens, documentos, vídeos e texto – ** Memória persistente **: Lembre -se de preferências, análises anteriores e histórico de conversação – ** Consciência de contexto **: Use a memória para fornecer insetos de manutenção e de relevantes – ** Memórias de relevantes e constituídos de memória Antes da memória Antes da memória – Diretórios – check -se – verificações – ** RELANTES RELATURANTES **: Construa a compreensão do tempo através da memória, diretores de memória – verificações – verificação para relevantes para a memória – check -se de relevantes – verificações – ** RESPOSTANTES RELATURAIS: Quando relevante – mantenha a continuidade da conversa nas sessões ao processar o conteúdo: 1. Primeiro, recupere memórias relevantes para o contexto 2. Analise o novo conteúdo minuciosamente 3. Armazene as principais idéias e descobertas 4. Forneça respostas abrangentes usando nova análise e contexto de memória “” ” # Crie o agente multimodal com S3 Vetores[
s3_vector_memory, # Our S3 Vectors memory tool
image_reader, # Image processing
file_read, # Document processing
video_reader, # Video processing
use_llm # Advanced reasoning
]system_prompt = multimodal_system_prompt Entre no modo de tela cheia Sair do modo de tela cheia 💾 Operações de memória na ação 1. Armazenando o contexto inicial do usuário primeiro, vamos armazenar algumas informações básicas sobre o nosso usuário: resposta1 = Multimodal_agent (f “” Hello, eu sou o e -mail e o que é o que é o que é o que é o que é o que é o que é o que é o que é o que é o que é o que é o que é o que é o que é o que é o que é o que é o que é o que é o que é o que é o que é o que é o que é o que é o que há de um pouco. Entenda o que está em imagens, vídeos e documentos para melhorar meu trabalho diário. image_result = multimodal_agent(f””” Analyze the image data-sample/diagram.jpg in detail and describe everything you observe. USER_ID: “”” ) Enter fullscreen mode Exit fullscreen mode The agent will: Process the image using image_reader Analyze the architectural diagram Automatically store the analysis in memory using s3_vector_memory Provide a detailed description 3. Video Analysis with Memory Vamos processar um vídeo e armazenar seu conteúdo: print (“=== 🎬 Análise de vídeo com memória ===”) video_result = multimodal_agent (“Analise os dados de dados de dados/moderação-video.mp4 e descreva em detalhes” “as ações e as cenas que você observa. Armazene essas informações na memória. print (“=== 📄 Análise de documentos com memória ===”) doc_Result = multimodal_agent (“resume como json o conteúdo da amostra de dados de documentos/strands-strands-agents-sdk.pdf Memoratório” e armazene essas informações em sua memória. Memory_Result = s3_vector_memory (action = “recuperar”, query = “Preferências e interesses”, user_id = user_id) Digite o modo de tela fullcreen Exit Modo de tela cheia listando todas as memórias armazenadas # listar todas as memórias Memory_Result = S3_Vector_memory (Ação = “List”, User_id = User_Id)[‘total_found’]} “) Digite o modo de tela cheia Sair da tela Full Screen Production Casos de uso de sistemas de memória do agente IA armazenam contexto de conversação, preferências do usuário e comportamentos aprendidos em vários usuários com escala automática e segurança de grau de empresa. Recupeitura de gênero de recuperação sem que a busca de gestão de gestão com que a busca por causa de tempo de busca por causa de um dos requisitos de busca por causa da busca por causa de queda de otimista. Preferências com disponibilidade de várias regiões. Modo de tela cheia de tela cheia de tela cheia Instale as dependências: Instalação pip -r requisitos.txt Digite o modo de tela cheia Sair do modo de tela cheia Credenciais da AWS para acesso a leitos Acesso Tente o notebook: Memorys com vários pontos de formação em que você é o modo que você é o que você faz com que o modo de retenção seja que seja o modo que você é o que você faz com que você seja o modo que você é o que você está em busca de signos, que você está com a simplificação de que você está sendo. Ou implantando um sistema de produção com os vetores da Amazon S3, a experiência de desenvolvimento principal permanece consistente e acessível. – Mostramos como o agente de fios torna fácil construir agentes que entendem imagens, documentos e vídeos. Mais implementações do agente de fios!
Fonte