🤖 RAG na AWS: Construindo uma base de conhecimento movida a IA, com rocha da Amazon e vetores S3

🏃‍♂️ TL; Dr. AWS lançou os vetores da Amazon S3 como armazenamento de vetores nativos dentro do S3. Armazene, indexem e consultem bilhões de vetores com latência subsegunda. Até 90% mais barato que as configurações tradicionais de banco de dados do vetor. Integrado às bases de conhecimento do Bedrock, Sagemaker Studio e OpenSearch Out of the Box. Ainda em visualização! Não há suporte para CloudFormation/CDK, por isso ainda não está pronto para os sistemas de produtos principais, mas um playground perfeito para os construtores que desejam experimentar o armazenamento AI-pronto. 🚀 Repensando como armazenamos e consultamos vetores Se você leu o primeiro artigo desta série, explorei como construir um pipeline RAG com as bases de conhecimento da Amazon Bedrock usando o Pinecone. O raciocínio foi simples: o Pinecone é um banco de dados vetorial projetado para IA, integrado nativamente ao Bedrock e muito mais econômico do que executar o Amazon OpenSearch apenas para incorporação. Hoje, porém, gostaria de falar sobre algo novo que poderia mudar completamente a maneira como pensamos sobre o armazenamento vetorial: vetores da Amazon S3. Se você está construindo agentes de IA, pesquisa semântica ou qualquer coisa que dependa de incorporação, você já conhece a história: os vetores estão por toda parte. Mas armazenar, indexar e consultá -los em escala? Isso geralmente tem sido uma dor: caro, complexo e muitas vezes envolvendo infra extras que você realmente não quer lidar. É aí que entra os vetores do Amazon S3. 🔍 O que é realmente os vetores S3? Os vetores S3 são o primeiro armazenamento de objetos em nuvem com suporte ao vetor nativo. Basicamente, o Amazon S3 agora possui APIs embutidas para armazenar, acessar e consultar vetores diretamente. Por que isso é um grande negócio para os construtores? Economia de custos de 90% em comparação com os bancos de dados de vetores tradicionais (upload, armazenamento, consulta). Desempenho da consulta subsegunda, mesmo em escala maciça. S3 Durabilidade e elasticidade-nativa: Objetivo construído para agentes de IA, pesquisa semântica e pano. 💡 Construa mais rápido com o armazenamento AI-pronto para o que eu realmente amo nessa nova opção S3, é a integração fora da caixa para as bases de conhecimento da Amazon Bedrock (entre outras), que tornam a geração aumentada de recuperação (RAG) mais simples e mais barata. Uma imagem vale mais que mil palavras (créditos para um artigo impressionante “Introdução de vetores do Amazon S3) e o serviço ou solução da Amazon OpenSearch como Pinecone? Você poderia caminhar seus dados vetoriais: mantenha a“ memória de longo prazo ”barata em S3 enquanto você não pode escolher entre a memória. Os vetores-poweram com bases de conhecimento da Amazon, antes de tudo, vá para o console de bases da Amazon, clique em Criar o botão e selecionar a opção Vector como segunda etapa, dê um nome ao seu conhecimento, pois agora você deve ser o que você deve ser um dos smarts, que você deve ser o que você deve criar um store, que você deve ser o que você deve ser um dos melhores, que você deve ser o que você está fazendo com o fato de o número Base de conhecimento aqui é a seção do S3 Vector Store 🧪 Teste de que você pode simplesmente testar o seu RAG por sua loja de vetores recém -criada. As coisas a serem lembradas como os vetores S3, ainda estão em visualização. Infraestrutura como Código (IAC). Ele, brinque com ele e esteja pronto para adotar quando o suporte de ferramentas de produção completo chegar. Metadados como é super útil! As equipes de desenvolvimento para adotá-lo, assim como os clientes dividem seu monólito em API e micro-serviços usando-o.

Fonte

Você pode ter perdido