IBM Cloud Docs
Microsoft SharePoint On Prem

Microsoft SharePoint On Prem

Rastrea documentos almacenados en una fuente de datos local de Microsoft SharePoint.

IBM Cloud Pak for Data IBM Software Hub

Esta información sólo se aplica a las implantaciones instaladas. Para obtener más información sobre la conexión a un sitio SharePoint local desde una implementación gestionada, consulte SharePoint local.

Qué documentos se rastrean

  • Solo se rastrean los documentos que están respaldados por Discovery ; todos los demás se ignoran. Para obtener más información, consulte Tipos de archivo admitidos.
  • Se admite la seguridad a nivel de documento. Cuando esta opción está activada, sus usuarios pueden rastrear y consultar el mismo contenido al que pueden acceder cuando inician sesión en SharePoint. Para obtener más información, consulte Soporte de seguridad a nivel de documento.
  • Cuando se vuelve a rastrear una fuente, se añaden nuevos documentos, se modifican los documentos actualizados a la versión actual y se eliminan los documentos eliminados del índice de la colección.
  • Todos los conectores de fuentes de datos Discovery son de sólo lectura. Independientemente de los permisos que se concedan a la cuenta de rastreo, Discovery nunca escribe, actualiza ni elimina ningún contenido en la fuente de datos original.

Requisitos de orígenes de datos

Además de los requisitos de origen de datos para todas las implementaciones instaladas, su SharePoint On Prem debe cumplir los siguientes requisitos:

  • La conexión de origen de datos admite SharePoint 2013, 2016 o 2019.
  • Debe obtener las licencias de servicio necesarias para la fuente de datos a la que desea conectarse. Para obtener más información sobre las licencias, póngase en contacto con el administrador del sistema de la fuente de datos.

Para obtener más información sobre SharePoint On Prem, consulte Documentación para desarrolladores de Microsoft SharePoint.

Pasos de requisito previo

Antes de crear una colección SharePoint On Prem, debe hacer lo siguiente:

  1. Trabaje con el administrador de Sharepoint para coordinar la configuración del acceso de lectura total para la aplicación web.

    Para obtener más información, consulte Administrar permisos para una aplicación web en Sharepoint Server.

  2. Si desea activar la seguridad a nivel de documento, debe seguir algunos pasos para configurarla. Para obtener más información, consulte Soporte de seguridad a nivel de documento.

    Debe recopilar la siguiente información del administrador LDAP:

    URL del servidor LDAP
    El servidor LDAP al que se de URL ar para conectarse, por ejemplo ldap://<ldap_server>:<port>.
    Nombre de usuario de enlace LDAP
    El nombre de usuario utilizado para vincularse al servicio de directorio. En la mayoría de los casos, este nombre de usuario es un nombre distinguido (DN). Es posible que en ocasiones el nombre de inicio de sesión funcione con Active Directory. Pero a diferencia del inicio de sesión general de Windows, distingue entre mayúsculas y minúsculas. El nombre distinguido siempre funciona.
    Contraseña del usuario de enlace LDAP
    La contraseña utilizada para vincularse al servicio de directorio.
    DN base de LDAP
    El punto de partida para buscar entradas de usuario en LDAP, por ejemplo CN=Users,DC=example,DC=com.
    Filtro de usuarios LDAP
    El filtro de usuario para buscar entradas de usuario en LDAP. Si no se especifica, el valor predeterminado es (userPrincipalName={0}).

Si utiliza la versión 2.2.1 o anterior, deberá completar algunas tareas previas adicionales antes de poder conectarse al origen de datos. Para obtener más información, consulte SharePoint En Pasos de requisito previo de Prem para versiones anteriores.

Conexión a una fuente de datos SharePoint On Prem

Desde tu proyecto Discovery, completa los siguientes pasos:

  1. En el panel de navegación, seleccione Gestionar colecciones.

  2. Haga clic en Nueva colección.

  3. Haga clic en SharePoint On Prem, y luego haga clic en Siguiente.

  4. Nombre de la colección.

  5. Si el idioma de los documentos en SharePoint no es el inglés, seleccione el idioma adecuado.

    Para ver una lista de los idiomas admitidos, consulte Soporte de idiomas.

  6. Opcional: Cambia el horario de sincronización.

    Para obtener más información, consulte Opciones de programación de rastreo.

  7. En la sección Ingrese sus credenciales, complete los siguientes campos:

    Nombre de usuario
    El nombre de usuario del usuario de SharePoint con acceso a todos los sitios y listas que deben rastrearse e indexarse.
    Contraseña
    La contraseña del usuario de SharePoint.

    Este valor nunca se devuelve y solo se utiliza cuando se crean o modifican credenciales.

  8. Opcional: si desea utilizar la autenticación basada en reclamaciones SAML (Security Assertion Mark-up Language), configure el interruptor Habilitar autenticación SAML en On. En caso contrario, se utiliza la autenticación Windows NT LAN Manager (NTLM). Añada valores a los siguientes campos:

    Punto final del proveedor de identidades
    El URL del punto final del proveedor de identidad, por ejemplo https://adfs.server.example.com/adfs/services/trust/2005/UsernameMixed.
    Punto final de la parte de confianza
    Opcional. URL, del punto final de Relying Party Trust. Si no se especifica, se utiliza el siguiente valor: https://<sharepoint_server>:<port>/_trust/.
    Identificador de confianza de la parte de confianza
    El identificador de confianza ( URL ) del Relying Party Trust, por ejemplo, urn:sharepoint:sample. Si no se especifica, se utiliza el siguiente valor: https://<sharepoint_server>:<port>/_trust/. Esta característica está disponible en las versiones de 2013, 2016 y 2019.
  9. En la sección Especifique lo que desea rastrear, agregue el servicio web SharePoint URL al campo URL de la aplicación web. Por ejemplo, https://<host>:<port>.

  10. Opcional: Si utiliza un servidor proxy para acceder al servidor de origen de datos, en la sección Configuración proxy, active el interruptor Activar configuración proxy en On. Añada valores a los siguientes campos:

    Nombre de usuario
    Opcional. El nombre de usuario del servidor proxy para autenticar, si el servidor proxy requiere autenticación. Si no conoce su nombre de usuario, puede obtenerlo del administrador de su servidor proxy.
    Contraseña
    Opcional. La contraseña del servidor proxy para autenticarse, si el servidor proxy requiere autenticación. Si no conoce su contraseña, puede obtenerla del administrador de su servidor proxy.
    Nombre de host o dirección IP del servidor proxy
    El nombre de host o la dirección IP del servidor proxy.
    Número de puerto del servidor proxy
    El puerto de red al que desea conectarse en el servidor proxy.
  11. Opcional: Si desea activar la seguridad a nivel de documento, en la sección Seguridad, ponga el interruptor Activar seguridad a nivel de documento en On.

    Cuando esta opción está activada, sus usuarios pueden rastrear y consultar el mismo contenido al que pueden acceder cuando inician sesión en SharePoint. Completa los pasos previos para añadir soporte.

    Si activa esta opción, deberá proporcionar valores para los siguientes campos:

    URL del servidor LDAP
    El servidor LDAP al que se de URL ar para conectarse, por ejemplo ldap://<ldap_server>:<port>.
    Nombre de usuario de enlace LDAP
    El nombre de usuario utilizado para vincularse al servicio de directorio. En la mayoría de los casos, este nombre de usuario es un nombre distinguido (DN). Es posible que en ocasiones el nombre de inicio de sesión funcione con Active Directory. Pero a diferencia del inicio de sesión general de Windows, distingue entre mayúsculas y minúsculas. El nombre distinguido siempre funciona.
    Contraseña del usuario de enlace LDAP
    La contraseña utilizada para vincularse al servicio de directorio.
    DN base de LDAP
    El punto de partida para buscar entradas de usuario en LDAP, por ejemplo CN=Users,DC=example,DC=com.
    Filtro de usuarios LDAP
    El filtro de usuario para buscar entradas de usuario en LDAP. Si no se especifica, el valor predeterminado es (userPrincipalName={0}).
  12. Si desea que el rastreador extraiga texto de las imágenes del sitio, amplíe Más opciones de procesamiento, y establezca Aplicar reconocimiento óptico de caracteres (OCR) en On.

    Cuando el OCR está activado y sus documentos contienen imágenes, el procesamiento tarda más tiempo. Para obtener más información, consulte Reconocimiento óptico de caracteres.

  13. Pulse Finalizar.

La colección se crea rápidamente. Los datos tardan más tiempo en procesarse a medida que se añaden a la colección.

Si desea comprobar el progreso, vaya a la página Actividad. En el panel de navegación, haga clic en Gestionar colecciones y, a continuación, haga clic en para abrir la colección.

Pasos previos para versiones anteriores

Si utiliza la versión 2.2.1 o anterior, deberá completar estos pasos adicionales antes de poder conectarse al origen de datos:

Obtener el paquete de servicios web

Para obtener el paquete de servicios web de su clúster Discovery, complete los siguientes pasos:

  1. Inicie una sesión en el clúster de Discovery.

  2. Introduzca el siguiente comando para obtener su nombre de pod de crawler :

    oc get pods | grep crawler
    

    Es posible que vea un resultado similar al siguiente mensaje:

    wd-discovery-crawler-57985fc5cf-rxk89     1/1     Running     0          85m
    
  3. Introduzca el siguiente comando para obtener el archivo ESSPSolution.wsp, sustituyendo {crawler-pod-name} por el nombre de pod crawler que obtuvo en el paso anterior:

    oc exec {crawler-pod-name} -- ls -l /opt/ibm/wex/zing/resources/ | grep ESSPSolution
    

    Es posible que vea un resultado similar al siguiente mensaje:

    -rw-r--r--. 1 dadmin dadmin  8600 Feb  3 08:23 ESSPSolution-${build-version}.wsp
    
  4. Introduzca el siguiente comando para copiar el archivo ESSPSolution.wsp al servidor host, sustituyendo {build-version} por el número de versión de compilación del paso anterior y {crawler-pod-name} por el nombre del pod crawler :

    oc cp {crawler-pod-name}:/opt/ibm/wex/zing/resources/ESSPSolution-${build-version}.wsp ESSPSolution.wsp
    

Implementar los servicios web en el servidor SharePoint

Puede desplegar los servicios web manualmente en el servidor de SharePoint o puede ejecutar un script que los despliegue automáticamente.

Para ejecutar el script que despliega automáticamente los servicios web:

  1. Ejecute el script ESSPSolution.wsp en el servidor de SharePoint especificando el siguiente cmdlet de Windows PowerShell: Add-SPSolution -LiteralPath C:\files\ESSPSolution.wsp

  2. En SharePoint,, abra SharePoint Central Administration y, a continuación, abra System Settings.

  3. Implementar el paquete mediante el uso de soluciones de granja.

  4. Seleccione la solución esspsolution.wsp y despliegue la solución.

    Una vez finalizado el despliegue, la solución de conjunto de servidores se muestra en la consola de administración de SharePoint. Un administrador puede habilitar o inhabilitar la solución y puede planificar desencadenantes.

  5. Opcional: Independientemente del enfoque que haya utilizado para implementar los servicios web, para completar la implementación en algunos entornos, es posible que tenga que aplicar las siguientes configuraciones al servidor de Internet Information Services (IIS) que aloja el servidor SharePoint y los servicios web:

    • Permitir la suplantación de .NET en IIS
    • Cambie el nivel de confianza de ASP.NET por WSS_Medium

    Puede aplicar estas configuraciones en el Administrador de Internet Information Services.