IBM Cloud Docs
Box

Box

Rastrear documentos almacenados en un origen de datos de Box.

IBM Cloud IBM Cloud solo

Esta información sólo se aplica a los despliegues gestionados. Para obtener más información sobre cómo conectarse a Box desde un despliegue instalado, consulte Box.

Qué documentos se rastrean

Durante el rastreo inicial del contenido, los documentos de todas las carpetas a las que se puede acceder desde la aplicación Box se rastrean y se añaden a la colección. Las notas de Box se almacenan en formato JSON, por lo que Discovery también incorpora cualquier nota de Box en las carpetas especificadas.

La tabla siguiente ilustra los objetos que Discovery puede rastrear.

Rastreo de fuentes de datos
Origen de datos ¿Da soporte a renovaciones de documentos planificadas? Objetos que se rastrean
Box (Acceso a la aplicación) Nee Archivos, carpetas que comparte explícitamente
Caja (acceso para empresas ) Sí (solo documentos nuevos y modificados) Archivos, carpetas

Cuando configura Box sólo con acceso de aplicación, debe crear usuarios de aplicación y compartir los archivos que desea rastrear con estos usuarios. No puede rastrear archivos de Box compartidos sólo por la cuenta de servicio.

Para obtener más información sobre el acceso, consulte estos temas de ayuda de la documentación de Box:

Los documentos que se suprimen de Box no se suprimen de la colección.

Todos los conectores de origen de datos Discovery son de sólo lectura. Independientemente de los permisos otorgados a la cuenta de rastreo, Discovery nunca graba, actualiza o suprime ningún contenido del origen de datos original.

Requisitos de orígenes de datos

Además de los requisitos de origen de datos para todos los despliegues gestionados, el origen de datos de Box debe cumplir el requisito siguiente:

Debe obtener las licencias de servicio necesarias para el origen de datos al que desea conectarse. Para obtener más información sobre las licencias, póngase en contacto con el administrador del sistema del origen de datos.

Paso previo

Debe crear una aplicación personalizada en Box para poder conectarse a Box desde Discovery.

  1. En Box, cree una app personalizada que utilice Autenticación de servidor con JWT como método de autenticación.

    Para ver los pasos detallados, consulte Configuración con JWT en la documentación de Box Developer.

Siga estas directrices al crear la aplicación:

  • Durante el procedimiento de configuración, elija utilizar el método Autenticación de servidor con JWT para verificar la identidad de la aplicación con un par de claves.

  • Al configurar la aplicación personalizada, puede elegir utilizar uno de los niveles de acceso de la aplicación:

    • Solo acceso a la aplicación
    • Acceso a aplicaciones más acceso a la empresa

    La renovación de documentos en una planificación sólo está soportada cuando elige Acceso a la aplicación más Acceso a la empresa.

    Si configura la conexión con Acceso a la app, debe crear usuarios de la app y compartir los archivos que desea rastrear con los usuarios de la app que defina. Con esta configuración, los documentos nuevos y modificados no se rastrean durante una renovación.

    • Si es un administrador, configure Acceso a la aplicación más Acceso a la empresa. De lo contrario, puede configurar la aplicación para que tenga Acceso a la aplicación. Sin embargo, debe obtener la aprobación de la aplicación de un administrador de Box.

    • Para ambos niveles de acceso de aplicación, especifique los valores siguientes:

    • Elija los ámbitos siguientes:

      • Leer todas las carpetas almacenadas en Box
      • Escribir todas las carpetas almacenadas en Box
      • Gestionar usuarios

      Sólo para apps con acceso Enterprise: añada este ámbito adicional:

      • Gestionar propiedades de la empresa
    • Habilitar las siguientes funciones avanzadas:

      • Realizar llamadas API utilizando el encabezado as-user
      • Generar tokens de acceso de usuario
  • Obtenga la aplicación personalizada autorizada por un administrador.

    Para obtener más información, consulte Aprobación de aplicaciones en la documentación de Box Developer.

  • Una vez creada, autorizada y configurada la autenticación, descargue los valores de la aplicación como un archivo JSON desde la consola dev.

    Proporcione la siguiente información de este archivo cuando se solicite más tarde:

    • client_id
    • enterprise_id
    • client_secret
    • public_key_id
    • private_key
    • passphrase

Conexión con el origen de datos de Box

En el proyecto Discovery, realice los pasos siguientes:

  1. En el panel de navegación, elija Gestionar colecciones.

  2. Haga clic en Nueva colección.

  3. Pulse el enlace situado junto a ¿Necesita conectarse a un origen de datos? pulse Recuadro y, a continuación, pulse Siguiente.

  4. Consulte los valores del archivo JSON de valores de la aplicación Box que ha descargado durante el procedimiento anterior para completar los campos siguientes:

    ID de cliente
    La clave privada que especifique al configurar su aplicación Box.
    Secreto de cliente
    El secreto de cliente que especifique al configurar su aplicación Box.
    ID de empresa
    El ID de empresa de la cuenta de Box.
    ID de clave pública
    El ID de clave pública que genera Box.
    Clave privada
    Parte del par de claves que se genera para interactuar con el sitio web de Box.
    Frase de contraseña
    La contraseña que se requiere para descifrar la clave privada si la clave privada es un archivo cifrado.
  5. Pulse Siguiente.

  6. Asigne un nombre a la colección.

  7. Si el idioma de los documentos en Box no es el inglés, seleccione el idioma apropiado.

    Para ver una lista de los idiomas admitidos, consulte Soporte de idiomas.

  8. Opcional: cambie la planificación de sincronización.

    Para obtener más información, consulte Opciones de planificación de rastreo.

  9. Elija las carpetas que desea rastrear.

  10. Si desea limitar los tipos de archivos que se van a añadir a la colección, puede listar las extensiones de archivo para los tipos de archivo que se van a incluir o excluir.

    Cuando elija listar extensiones para los tipos de archivo a excluir, debe añadir al menos una extensión de archivo.

    Para obtener una lista de los tipos de archivo soportados, consulte Tipos de archivo soportados.

  11. Si desea que el rastreo web extraiga texto de imágenes en el sitio, expanda Más valores de procesoy establezca Aplicar reconocimiento óptico de caracteres (OCR) en On.

    Cuando OCR está habilitado y los documentos contienen imágenes, el proceso tarda más tiempo. Para obtener más información, consulte Reconocimiento de caracteres ópticos.

  12. Pulse Finalizar.

La colección se crea rápidamente. Los datos tardan más tiempo en procesarse a medida que se añaden a la colección.

Si desea comprobar el progreso, vaya a la página Actividad. En el panel de navegación, pulse Gestionar colecciones y, a continuación, pulse para abrir la colección.

Actualmente, no todos los documentos se renuevan durante los rastreos planificados. Para obtener más información, consulte la nota del release.