IBM Cloud Docs
Microsoft SharePoint Online

Microsoft SharePoint Online

Rastrear documentos almacenados en un origen de datos de Microsoft SharePoint Online.

IBM Cloud IBM Cloud solo

Esta información sólo se aplica a los despliegues gestionados. Para obtener más información sobre cómo conectarse a SharePoint Online desde un despliegue instalado, consulte SharePoint Online.

Qué documentos se rastrean

Durante el rastreo inicial del contenido, los documentos de todos los objetos a los que se puede acceder desde la vía de acceso de colección del sitio que especifique se rastrean y se añaden a la colección. No puede limitar el rastreo a una biblioteca dentro de una colección de sitios, por ejemplo. Se rastrean todos los objetos de la vía de acceso de colección de sitio especificada. Los metadatos personalizados asociados con el contenido de SharePoint también se rastrean. Puede rastrear una vía de acceso de colección de sitio por colección. No puede rastrear Personal SiteCollections.

Durante los posteriores rastreos planificados, sólo se rastrean los documentos nuevos y modificados y los cambios se reflejan en la colección. Los documentos que se suprimen del origen de datos externo no se suprimen de la colección.

Todos los conectores de origen de datos Discovery son de sólo lectura. Independientemente de los permisos otorgados a la cuenta de rastreo, Discovery nunca graba, actualiza o suprime ningún contenido del origen de datos original.

Discovery puede rastrear los objetos siguientes:

  • SiteCollections
  • Sitios
  • SubSites
  • Listas
  • Elementos de la lista
  • Bibliotecas de documentos
  • Listar adjuntos de elemento

Requisitos de orígenes de datos

Además de los requisitos de origen de datos para todos los despliegues gestionados, el origen de datos de SharePoint Online debe cumplir los requisitos siguientes:

  • La colección de sitios a la que se conecta debe ser una que se haya creado con un plan de empresa. No puede ser una colección que se haya creado con un plan de trabajo de primera línea.
  • Debe tener un ID de usuario de Azure Active Directory con permiso para leer todos los objetos que desea rastrear. Por ejemplo, <admin_user>@.onmicrosoft.com. El ID de usuario no necesita el permiso SiteCollection Administrator.

Puede elegir cómo autenticarse con la cuenta de Microsoft SharePoint externa entre las opciones siguientes:

Autenticación abierta (OAuth v2)

Se autentica con el origen de datos externo utilizando una señal para que no sea necesario compartir las credenciales de usuario. Con este método de autenticación, puede iniciar la sesión en la cuenta de Microsoft directamente para generar una señal que utiliza Discovery para conectarse a los datos.

La opción Iniciar sesión con Microsoft que utiliza Open Authentication v2 para autenticarse con el origen de datos externo es una característica beta.

Antes de que alguien pueda crear conectores que utilicen este método de autenticación, un usuario con el rol Administrador global debe completar un único paso de requisito previo para autorizar la conexión para todos los proyectos en la instancia de servicio Discovery.

SAML (Security Assertion Markup Language)

Un mecanismo más antiguo para la autenticación y autorización que requiere que las credenciales de usuario se compartan con el servicio Discovery.

Si opta por utilizar este método de autenticación, la cuenta de Microsoft SharePoint debe cumplir los requisitos siguientes:

  • A menos que haya creado su cuenta en línea SharePoint antes de enero de 2020, la autenticación de dos factores está habilitada para la cuenta de forma predeterminada. Debe inhabilitar la autenticación de dos factores.

    Para ver y cambiar el estado de su autenticación multifactor, consulte Ver el estado de un usuario o Cambiar el estado de un usuario.

  • La cuenta de usuario de rastreo debe tener la autenticación heredada y los permisos de nivel de Contribute habilitados.

    Para habilitar la autenticación heredada, vaya al portal deAzure o póngase en contacto con el administrador de SharePoint.

  • El conector da soporte al método Password hash synchronization (PHS) para habilitar sólo la identidad híbrida. Utilice cualquier otro tipo (por ejemplo, autenticación de paso a través o federación) bajo su propio riesgo.

  • Debe conocer la siguiente información:

    Nombre de usuario

    El nombre de usuario de la cuenta de usuario que se debe utilizar para conectarse a SharePoint Online SiteCollection que desea rastrear.

    Por ejemplo, <janedoe>@exampledomain.onmicrosoft.com.

    Contraseña

    La contraseña para conectarse al SharePoint. El SiteCollection en línea que desea rastrear.

    Este valor nunca se devuelve y sólo se utiliza cuando se crean o modifican credenciales.

Lo que necesita antes de empezar

Debe tener preparada la siguiente información. Si no lo sabe, solicite al administrador de SharePoint que proporcione la información o consulte la documentación del desarrollador de Microsoft SharePoint:

URL de organización

La URL raíz de la fuente que desea rastrear. Especifique el nombre de dominio del URL, por ejemplo, https://<company>.<domain>.com.

Vía de acceso de colección de sitios

site_collection_path a la sección del sitio donde desea iniciar el rastreo.

Por ejemplo, si el contenido que desea rastrear está disponible en https://<company>.<domain>.com/sites/test, puede especificar https://<company>.<domain>.com como Organización URL y /sites/test como Ruta de la colección del sitio.

  • No puede especificar vías de acceso de carpeta como entrada.
  • No puede especificar una vía de acceso a un archivo ASPX (Active Server Page Extended) como, por ejemplo, URL para bibliotecas de documentos, listas y subsidiarios.
  • Si no especifica una vía de acceso, se utiliza el valor predeterminado de / y se rastrea la colección de sitios raíz.
  • ID de aplicación: ID del origen de datos que desea rastrear. Esta información sólo es necesaria si desea almacenar la información de ACL que está asociada con los documentos de origen.

Paso de requisito previo único para OAuth

Antes de que alguien pueda configurar el conector para utilizar el método de autenticación OAuth v2, un usuario con el rol Administrador global en Microsoft Azure Directory donde se encuentra el origen de datos debe completar los pasos para registrar la aplicación empresarial Discovery en Microsoft Azure. Este paso debe completarse una vez por cada instancia de servicio de Discovery.

El administrador no necesita crear la aplicación en Azure. Cuando eligen SharePoint Online como origen de datos, el servicio de descubrimiento genera la aplicación automáticamente. Tal como se describe en el procedimiento a seguir, durante la configuración del conector, el administrador debe iniciar sesión en Microsoft con credenciales para un usuario con el rol Administrador global en Microsoft Azure Directory y permitir que se registre la aplicación empresarial.

Un administrador global debe completar los pasos siguientes una sola vez por instancia de servicio:

  1. Revise los valores de acceso de usuario predeterminados que se aplicarán a la aplicación empresarial en Microsoft Azure.

    Las aplicaciones empresariales pueden manejar el acceso de usuario de muchas maneras. Compruebe los valores predeterminados para asegurarse de que son adecuados para el despliegue completando los pasos siguientes:

    1. Inicie sesión en Microsoft Azure.
    2. En la página Aplicaciones empresariales de Azure Active Directory, pulse Consentimiento y permisos.

    Azure Enterprise App Permissions user interface
    Microsoft Azure Enterprise application permissions user interface

    1. Realice una de las acciones siguientes:

      • Si se selecciona Permitir consentimiento de usuario para aplicaciones, no es necesaria ninguna otra acción.

      • Si se selecciona Permitir consentimiento de usuario para aplicaciones de publicadores verificados, para permisos seleccionados, realice los pasos siguientes:

        Pulse el enlace Clasificaciones de permisos y, a continuación, asegúrese de que los permisos siguientes estén configurados como mínimo:

        • Office 365 SharePoint Online: MyFiles.Leer
        • Office 365 SharePoint Online: AllSites.Leer
        • Gráfico de Microsoft: offline_access
        • Microsoft Graph: perfil

      La opción No permitir consentimiento del usuario no está soportada.

      Los valores que especifique se aplicarán a la aplicación empresarial creada por Discovery en los pasos siguientes.

  2. En el panel de navegación de Discovery, elija Gestionar colecciones.

  3. Haga clic en Nueva colección.

  4. Pulse SharePoint Online y, a continuación, pulse Siguiente.

  5. Añada un URL al campo Organización URL.

  6. Haga clic en Iniciar sesión con Microsoft.

    Las ventanas emergentes deben estar habilitadas para este sitio en el navegador web.

    La opción Iniciar sesión con Microsoft que utiliza Open Authentication para autenticarse con el origen de datos externo es una característica beta.

    Inicie sesión en la cuenta de Microsoft SharePoint con su nombre de usuario y contraseña y, a continuación, complete la autenticación de dos factores, si es necesario.

    Recuerde que las credenciales que utilice deben tener el rol Administrador global en Microsoft Azure Directory. Si no se le solicita un nombre de usuario y una contraseña, tome nota. Es posible que ya haya iniciado sesión en una cuenta de Microsoft Sharepoint. Si ha iniciado sesión en una cuenta que no desea utilizar para este conector, deténgalo aquí. (Cualquier cuenta en la que haya iniciado sesión se utilizará automáticamente. Y no podrá cambiar la configuración de la cuenta más adelante) Abra un navegador web en modo incógnito e inicie este procedimiento de nuevo desde el paso 1.

    El descubrimiento genera una aplicación empresarial que registrará con la organización de SharePoint que especifique. El nombre de la aplicación empresarial tiene el formato IBM App Connect_{unique name}.

  7. Revise los permisos asociados con la aplicación empresarial que registrará Discovery y, a continuación, seleccione Consentimiento en nombre de su organización.

    Diálogo de solicitud de permiso que le solicita el consentimiento en nombre de su organización para permitir que la aplicación sea 1. Leer archivos de usuario. 2. Leer elementos en todas las colecciones de sitios. 3. Mantenga el acceso a los datos a los que le ha dado acceso. 4. Ver el perfil básico de los usuarios.
    Discovery permission request dialog

  8. Haga clic en Aceptar.

  9. Si desea crear una colección, puede nombrar la colección y, a continuación, pulse Finalizar.

    De lo contrario, puede pulsar Atrás para salir del proceso de creación de la colección.

Ahora, cualquiera de su organización que trabaje en un proyecto alojado por la misma instancia de servicio de Discovery puede crear una colección utilizando el conector de SharePoint Online.

Revisiones de soporte de OAuth

El soporte para el método de autenticación OAuth se añadió con una actualización de software en febrero de 2022. Si desea actualizar un conector existente para utilizar OAuth en lugar de SAML, debe volver a crear el conector. No puede cambiar el mecanismo de autenticación para un conector existente.

El método de autenticación OAuth se actualizó en enero de 2023. La aplicación de empresa que está registrada con Microsoft Azure ahora solo requiere acceso de Lectura. Anteriormente, la aplicación empresarial requería acceso de Escritura. Si desea aprovechar este cambio, suprima la aplicación empresarial actual y vuelva a crear el conector. Para obtener más información sobre cómo suprimir una aplicación empresarial, consulte la documentación de Microsoft.

Conexión con el origen de datos

Para configurar el origen de datos de Microsoft SharePoint Online, realice los pasos siguientes en Discovery:

  1. En el panel de navegación, elija Gestionar colecciones.

  2. Haga clic en Nueva colección.

  3. Pulse el enlace situado junto a ¿Necesita conectarse a un origen de datos? , pulse SharePoint Online y, a continuación, pulse Siguiente.

  4. Añada un URL al campo Organización URL.

  5. Para habilitar el acceso al origen de datos externo, elija el método que desea utilizar para autenticarse con el origen de datos entre las opciones siguientes:

    Autenticación abierta (OAuth v2)

    Haga clic en Iniciar sesión con Microsoft.

    Las ventanas emergentes deben estar habilitadas para este sitio en el navegador web.

    La opción Iniciar sesión con Microsoft que utiliza Open Authentication para autenticarse con el origen de datos externo es una característica beta.

    Inicie sesión en la cuenta de Microsoft SharePoint con su nombre de usuario y contraseña y, a continuación, complete la autenticación de dos factores, si es necesario.

    SAML (Security Assertion Markup Language)

    Especifique un nombre de usuario y una contraseña para un usuario que tenga autorización para acceder al sitio que desea rastrear y, a continuación, pulse Siguiente.

  6. Especifique la vía de acceso que desea rastrear en el campo Vía de acceso de colección de sitios.

  7. Asigne un nombre a la colección.

  8. Si el idioma de los documentos en el sitio no es el inglés, seleccione el idioma apropiado.

    Para ver una lista de los idiomas admitidos, consulte Soporte de idiomas.

  9. Opcional: cambie la planificación de sincronización.

    Para obtener más información, consulte Opciones de planificación de rastreo.

  10. Opcional: Si desea almacenar cualquier información de control de acceso que exista en los documentos de SharePoint que rastrea, en la sección Seguridad, establezca el conmutador Incluir lista de control de acceso en On.

    Cuando habilita esta opción, la información sobre las reglas de acceso de SharePoint que se almacena en documentos de origen de SharePoint se conserva y se almacena como metadatos en los documentos que se añaden a la colección.

    Esta característica no es la misma que habilitar la seguridad a nivel de documento para la colección. La búsqueda Discovery no utiliza las reglas de acceso en los metadatos del documento. La habilitación de esta característica simplemente almacena la información para que pueda aprovechar las reglas de acceso al crear una solución de búsqueda personalizada.

    El uso de esta característica aumenta el tamaño de los documentos que se generan en la colección y aumenta el tiempo de rastreo. Solo habilite la característica si su caso de uso requiere que almacene la información de ACL de documento de SharePoint.

    Si habilita esta característica, alguien con el rol de administrador en Microsoft SharePoint debe realizar pasos adicionales para asegurarse de que los usuarios que rastrean el sitio tienen los permisos adecuados para acceder a los metadatos de ACL.

    Un administrador debe completar los siguientes pasos:

    1. Inicie sesión en Microsoft SharePoint.

    2. Abra la página del sitio de SharePoint.

    3. En el menú de valores, elija Permisos de sitio.

    4. Haga clic en Configuración avanzada de permisos.

    5. Asegúrese de que las personas que desean recopilar información de control de acceso durante un rastreo tienen o son miembros de un grupo que tiene el permiso Control completo para el sitio.

      Muestra la interfaz de usuario de SharePoint donde se definen los permisos para usuarios y grupos.
      Microsoft SharePoint permissions user interface

      Cuando no se extrae la información de la lista de control de accesos, el permiso Leer es suficiente para todos los usuarios que rastrean el contenido.

  11. Si desea limitar los tipos de archivos que se van a añadir a la colección, puede listar las extensiones de archivo para los tipos de archivo que se van a incluir o excluir.

    Cuando elija listar extensiones para los tipos de archivo a excluir, debe añadir al menos una extensión de archivo. De forma predeterminada, el Filtro de extensión sólo es aplicable a objetos SharePoint Bibliotecas de documentos y Archivos adjuntos de elemento de lista. Para aplicar el filtro a todos los tipos de objeto de SharePoint, establezca Aplicar filtro de extensión a todos los tipos de objeto de SharePoint en Activado en la interfaz de usuario.

    Para obtener una lista de los tipos de archivo soportados, consulte Tipos de archivo soportados.

  12. Si desea que el rastreador extraiga texto de imágenes en el sitio, expanda Más valores de procesoy establezca Aplicar reconocimiento óptico de caracteres (OCR) en On.

    Cuando OCR está habilitado y los documentos contienen imágenes, el proceso tarda más tiempo. Para obtener más información, consulte Reconocimiento de caracteres ópticos.

  13. Pulse Finalizar.

La colección se crea rápidamente. Los datos tardan más tiempo en procesarse a medida que se añaden a la colección.

Si desea comprobar el progreso, vaya a la página Actividad. En el panel de navegación, pulse Gestionar colecciones y, a continuación, pulse para abrir la colección.

Actualmente no puede cambiar la cuenta de usuario que está asociada con la configuración de OAuth más adelante, ni ninguno de los detalles de la cuenta de usuario existente que el conector está configurado para utilizar. Por ejemplo, no puede actualizar la contraseña que se ha utilizado para configurar la conexión después de un cambio de contraseña en SharePoint.

Información de lista de control de accesos de ejemplo

La siguiente captura de pantalla ilustra el tipo de información de ACL que se almacena en el documento cuando se incluye la lista de control de accesos.

Muestra la información de ACL de Microsoft almacenada en el objeto de origen en los metadatos del documento.
Representation of ACL information in document metadata