En esta página, se explica cómo puedes fundamentar las respuestas con tus datos de Vertex AI Search (versión preliminar).
Fundamenta Gemini con tus datos
Si deseas realizar la generación aumentada de recuperación (RAG), conecta tu modelo a los datos de tu sitio web o a tus conjuntos de documentos y, luego, usa Fundamentación con Vertex AI Search.
La fundamentación en tus datos admite un máximo de 10 fuentes de datos de Vertex AI Search y se puede combinar con la fundamentación con la Búsqueda de Google.
Modelos compatibles
En esta sección, se enumeran los modelos que admiten la fundamentación con tus datos.
Requisitos previos
Antes de poder fundamentar el resultado del modelo en tus datos, haz lo siguiente:
- Habilita AI Applications y activa la API.
- Crea una fuente de datos y una aplicación de aplicaciones de IA.
Consulta la Introducción a Vertex AI Search para obtener más información.
Habilita AI Applications
En la consola de Google Cloud, ve a la página AI Applications.
Lee y acepta las Condiciones del Servicio y, luego, haz clic en Continuar y activar la API.
AI Applications está disponible en la ubicación global
o en la multirregión eu
y us
. Para obtener más información, consulta Ubicaciones de AI Applications.
Crea un almacén de datos en Aplicaciones de IA
Para crear un almacén de datos en Aplicaciones de IA, puedes optar por basarte en datos o documentos del sitio web.
Sitio web
Abre la página Crear Datastore en la consola de Google Cloud.
En el cuadro Contenido del sitio web, haz clic en Seleccionar.
Se mostrará el panel Especifica los sitios web para tu almacén de datos.Si no está marcada la opción Indexación avanzada de sitios web, selecciona la casilla de verificación Indexación avanzada de sitios web para activarla.
Aparecerá el panel Configura tu almacén de datos.En la sección Especificar los patrones de URL que se indexarán, haz lo siguiente:
- Agrega URLs para los Sitios para incluir.
- Opcional: Agrega URLs para los Sitios para excluir.
Haz clic en Continuar.
En el panel Configura tu almacén de datos,
- Selecciona un valor de la lista Ubicación de tu almacén de datos.
- Ingresa un nombre en el campo Nombre de tu almacén de datos. Se genera el ID. Usa este ID cuando generes tus respuestas fundamentadas con tu almacén de datos. Para obtener más información, consulta Cómo generar respuestas fundamentadas con tu almacén de datos.
- Haz clic en Crear.
Documentos
Abre la página Crear Datastore en la consola de Google Cloud.
En el cuadro Cloud Storage, haz clic en Seleccionar.
Se mostrará el panel Importar datos desde Cloud Storage.En la sección Documentos no estructurados (PDF, HTML, TXT y más), selecciona Documentos no estructurados (PDF, HTML, TXT y más).
Selecciona una opción de Frecuencia de sincronización.
Selecciona la opción Selecciona una carpeta o un archivo que desees importar y, luego, ingresa la ruta de acceso en el campo.
Haz clic en Continuar.
Se mostrará el panel Configura tu almacén de datos.En el panel Configura tu almacén de datos,
- Selecciona un valor de la lista Ubicación de tu almacén de datos.
- Ingresa un nombre en el campo Nombre de tu almacén de datos. Se genera el ID.
- Para seleccionar opciones de análisis y división de tus documentos, expande la sección Document Processing Options. Para obtener más información sobre los diferentes analizadores, consulta Cómo analizar documentos.
- Haz clic en Crear.
Haz clic en Crear.
Genera respuestas fundamentadas con tu almacén de datos
Usa las siguientes instrucciones para fundamentar un modelo con tus datos. Se admite un máximo de 10 almacenes de datos.
Si no conoces el ID del almacén de datos, sigue estos pasos:
En la consola de Google Cloud, ve a la página AI Applications y, en el menú de navegación, haz clic en Data stores.
Haz clic en el nombre de tu almacén de datos.
En la página Datos de tu almacén de datos, obtén el ID del almacén de datos.
Console
Para fundamentar el resultado de tu modelo en aplicaciones de IA a través de Vertex AI Studio en la console de Google Cloud, sigue estos pasos:
- En la consola de Google Cloud, ve a la página Vertex AI Studio Freeform.
- Para activar la fundamentación, haz clic en el botón de activación Fundamentación: tus datos.
- Haz clic en Personalizar.
- Selecciona Vertex AI Search como fuente.
- Con este formato de ruta, reemplaza el ID de proyecto y el ID del almacén de datos:
projects/project_id/locations/global/collections/default_collection/dataStores/data_store_id.
- Haz clic en Guardar.
- Ingresa el mensaje en el cuadro de texto y haz clic en Enviar.
Tus respuestas a las instrucciones se basan en aplicaciones de IA.
Python
Antes de probar este ejemplo, sigue las instrucciones de configuración para Python incluidas en la guía de inicio rápido de Vertex AI sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de Vertex AI Python.
Para autenticarte en Vertex AI, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
REST
Para probar un mensaje de texto con la API de Vertex AI, envía una solicitud POST al extremo del modelo de publicador.
Antes de usar cualquiera de los datos de solicitud a continuación, realiza los siguientes reemplazos:
- LOCATION: La región para procesar la solicitud.
- PROJECT_ID: El ID del proyecto.
- MODEL_ID: El ID del modelo multimodal.
- TEXT: las instrucciones de texto que se incluirán en el mensaje.
Método HTTP y URL:
POST https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent
Cuerpo JSON de la solicitud:
{ "contents": [{ "role": "user", "parts": [{ "text": "TEXT" }] }], "tools": [{ "retrieval": { "vertexAiSearch": { "datastore": projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID } } }], "model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID" }
Para enviar tu solicitud, expande una de estas opciones:
Deberías recibir una respuesta JSON similar a la que se muestra a continuación:
{ "candidates": [ { "content": { "role": "model", "parts": [ { "text": "You can make an appointment on the website https://dmv.gov/" } ] }, "finishReason": "STOP", "safetyRatings": [ "..." ], "groundingMetadata": { "retrievalQueries": [ "How to make appointment to renew driving license?" ], "groundingChunks": [ { "retrievedContext": { "uri": "https://vertexaisearch.cloud.google.com/grounding-api-redirect/AXiHM.....QTN92V5ePQ==", "title": "dmv" } } ], "groundingSupport": [ { "segment": { "startIndex": 25, "endIndex": 147 }, "segment_text": "ipsum lorem ...", "supportChunkIndices": [1, 2], "confidenceScore": [0.9541752, 0.97726375] }, { "segment": { "startIndex": 294, "endIndex": 439 }, "segment_text": "ipsum lorem ...", "supportChunkIndices": [1], "confidenceScore": [0.9541752, 0.9325467] } ] } } ], "usageMetadata": { "..." } }
Comprende tu respuesta
La respuesta de ambas APIs incluye el texto generado por el LLM, que se denomina candidato. Si la instrucción de tu modelo se fundamenta correctamente en tu fuente de datos de Elasticsearch, las respuestas incluirán metadatos de fundamentación, que identifican las partes de la respuesta que se derivaron de tus datos de Elasticsearch. Sin embargo, existen varios motivos por los que es posible que no se proporcionen estos metadatos, y la respuesta a la instrucción no se basará en ellos. Entre estos motivos, se incluyen la baja relevancia de la fuente o la información incompleta en la respuesta del modelo.
A continuación, se muestra un desglose de los datos de salida:
- Rol: Indica el remitente de la respuesta fundamentada. Debido a que la respuesta siempre contiene texto basado en la realidad, el rol siempre es
model
. - Text: La respuesta fundamentada que genera el LLM.
- Metadatos de puesta a tierra: Información sobre la fuente de puesta a tierra, que contiene los siguientes elementos:
- Fragmentos de justificación: Es una lista de resultados de tu índice de Elasticsearch que respaldan la respuesta.
- Fundamentación: Es la información sobre una afirmación específica dentro de la respuesta que se puede usar para mostrar citas:
- Segmento: Es la parte de la respuesta del modelo que se justifica con un fragmento de justificación.
- Índice de fragmentos de conexión a tierra: Es el índice de los fragmentos de conexión a tierra en la lista de fragmentos de conexión a tierra que corresponde a esta declaración.
- Puntuaciones de confianza: Es un número entre 0 y 1 que indica qué tan fundamentado está el reclamo en el conjunto proporcionado de fragmentos de fundamentación.
¿Qué sigue?
- Para obtener información sobre cómo enviar solicitudes de instrucciones de chat, consulta Chat de varios turnos.
- Para obtener información sobre las prácticas recomendadas de IA responsable y los filtros de seguridad de Vertex AI, consulta Prácticas recomendadas de seguridad.