Microsoft SharePoint On Prem
Rastrea documentos almacenados en una fuente de datos local de Microsoft SharePoint.
IBM Cloud Pak for Data IBM Software Hub
Esta información sólo se aplica a las implantaciones instaladas. Para obtener más información sobre la conexión a un sitio SharePoint local desde una implementación gestionada, consulte SharePoint local.
Qué documentos se rastrean
- Solo se rastrean los documentos que están respaldados por Discovery ; todos los demás se ignoran. Para obtener más información, consulte Tipos de archivo admitidos.
- Se admite la seguridad a nivel de documento. Cuando esta opción está activada, sus usuarios pueden rastrear y consultar el mismo contenido al que pueden acceder cuando inician sesión en SharePoint. Para obtener más información, consulte Soporte de seguridad a nivel de documento.
- Cuando se vuelve a rastrear una fuente, se añaden nuevos documentos, se modifican los documentos actualizados a la versión actual y se eliminan los documentos eliminados del índice de la colección.
- Todos los conectores de fuentes de datos Discovery son de sólo lectura. Independientemente de los permisos que se concedan a la cuenta de rastreo, Discovery nunca escribe, actualiza ni elimina ningún contenido en la fuente de datos original.
Requisitos de orígenes de datos
Además de los requisitos de origen de datos para todas las implementaciones instaladas, su SharePoint On Prem debe cumplir los siguientes requisitos:
- La conexión de origen de datos admite SharePoint 2013, 2016 o 2019.
- Debe obtener las licencias de servicio necesarias para la fuente de datos a la que desea conectarse. Para obtener más información sobre las licencias, póngase en contacto con el administrador del sistema de la fuente de datos.
Para obtener más información sobre SharePoint On Prem, consulte Documentación para desarrolladores de Microsoft SharePoint.
Pasos de requisito previo
Antes de crear una colección SharePoint On Prem, debe hacer lo siguiente:
-
Trabaje con el administrador de Sharepoint para coordinar la configuración del acceso de lectura total para la aplicación web.
Para obtener más información, consulte Administrar permisos para una aplicación web en Sharepoint Server.
-
Si desea activar la seguridad a nivel de documento, debe seguir algunos pasos para configurarla. Para obtener más información, consulte Soporte de seguridad a nivel de documento.
Debe recopilar la siguiente información del administrador LDAP:
- URL del servidor LDAP
- El servidor LDAP al que se de URL ar para conectarse, por ejemplo
ldap://<ldap_server>:<port>
. - Nombre de usuario de enlace LDAP
- El nombre de usuario utilizado para vincularse al servicio de directorio. En la mayoría de los casos, este nombre de usuario es un nombre distinguido (DN). Es posible que en ocasiones el nombre de inicio de sesión funcione con Active Directory. Pero a diferencia del inicio de sesión general de Windows, distingue entre mayúsculas y minúsculas. El nombre distinguido siempre funciona.
- Contraseña del usuario de enlace LDAP
- La contraseña utilizada para vincularse al servicio de directorio.
- DN base de LDAP
- El punto de partida para buscar entradas de usuario en LDAP, por ejemplo
CN=Users,DC=example,DC=com
. - Filtro de usuarios LDAP
- El filtro de usuario para buscar entradas de usuario en LDAP. Si no se especifica, el valor predeterminado es
(userPrincipalName={0})
.
Si utiliza la versión 2.2.1 o anterior, deberá completar algunas tareas previas adicionales antes de poder conectarse al origen de datos. Para obtener más información, consulte SharePoint En Pasos de requisito previo de Prem para versiones anteriores.
Conexión a una fuente de datos SharePoint On Prem
Desde tu proyecto Discovery, completa los siguientes pasos:
-
En el panel de navegación, seleccione Gestionar colecciones.
-
Haga clic en Nueva colección.
-
Haga clic en SharePoint On Prem, y luego haga clic en Siguiente.
-
Nombre de la colección.
-
Si el idioma de los documentos en SharePoint no es el inglés, seleccione el idioma adecuado.
Para ver una lista de los idiomas admitidos, consulte Soporte de idiomas.
-
Opcional: Cambia el horario de sincronización.
Para obtener más información, consulte Opciones de programación de rastreo.
-
En la sección Ingrese sus credenciales, complete los siguientes campos:
- Nombre de usuario
- El nombre de usuario del usuario de SharePoint con acceso a todos los sitios y listas que deben rastrearse e indexarse.
- Contraseña
- La contraseña del usuario de SharePoint.
Este valor nunca se devuelve y solo se utiliza cuando se crean o modifican credenciales.
-
Opcional: si desea utilizar la autenticación basada en reclamaciones SAML (Security Assertion Mark-up Language), configure el interruptor Habilitar autenticación SAML en
On
. En caso contrario, se utiliza la autenticación Windows NT LAN Manager (NTLM). Añada valores a los siguientes campos:- Punto final del proveedor de identidades
- El URL del punto final del proveedor de identidad, por ejemplo
https://adfs.server.example.com/adfs/services/trust/2005/UsernameMixed
. - Punto final de la parte de confianza
- Opcional. URL, del punto final de Relying Party Trust. Si no se especifica, se utiliza el siguiente valor:
https://<sharepoint_server>:<port>/_trust/
. - Identificador de confianza de la parte de confianza
- El identificador de confianza ( URL ) del Relying Party Trust, por ejemplo,
urn:sharepoint:sample
. Si no se especifica, se utiliza el siguiente valor:https://<sharepoint_server>:<port>/_trust/
. Esta característica está disponible en las versiones de 2013, 2016 y 2019.
-
En la sección Especifique lo que desea rastrear, agregue el servicio web SharePoint URL al campo URL de la aplicación web. Por ejemplo,
https://<host>:<port>
. -
Opcional: Si utiliza un servidor proxy para acceder al servidor de origen de datos, en la sección Configuración proxy, active el interruptor Activar configuración proxy en
On
. Añada valores a los siguientes campos:- Nombre de usuario
- Opcional. El nombre de usuario del servidor proxy para autenticar, si el servidor proxy requiere autenticación. Si no conoce su nombre de usuario, puede obtenerlo del administrador de su servidor proxy.
- Contraseña
- Opcional. La contraseña del servidor proxy para autenticarse, si el servidor proxy requiere autenticación. Si no conoce su contraseña, puede obtenerla del administrador de su servidor proxy.
- Nombre de host o dirección IP del servidor proxy
- El nombre de host o la dirección IP del servidor proxy.
- Número de puerto del servidor proxy
- El puerto de red al que desea conectarse en el servidor proxy.
-
Opcional: Si desea activar la seguridad a nivel de documento, en la sección Seguridad, ponga el interruptor Activar seguridad a nivel de documento en
On
.Cuando esta opción está activada, sus usuarios pueden rastrear y consultar el mismo contenido al que pueden acceder cuando inician sesión en SharePoint. Completa los pasos previos para añadir soporte.
Si activa esta opción, deberá proporcionar valores para los siguientes campos:
- URL del servidor LDAP
- El servidor LDAP al que se de URL ar para conectarse, por ejemplo
ldap://<ldap_server>:<port>
. - Nombre de usuario de enlace LDAP
- El nombre de usuario utilizado para vincularse al servicio de directorio. En la mayoría de los casos, este nombre de usuario es un nombre distinguido (DN). Es posible que en ocasiones el nombre de inicio de sesión funcione con Active Directory. Pero a diferencia del inicio de sesión general de Windows, distingue entre mayúsculas y minúsculas. El nombre distinguido siempre funciona.
- Contraseña del usuario de enlace LDAP
- La contraseña utilizada para vincularse al servicio de directorio.
- DN base de LDAP
- El punto de partida para buscar entradas de usuario en LDAP, por ejemplo
CN=Users,DC=example,DC=com
. - Filtro de usuarios LDAP
- El filtro de usuario para buscar entradas de usuario en LDAP. Si no se especifica, el valor predeterminado es
(userPrincipalName={0})
.
-
Si desea que el rastreador extraiga texto de las imágenes del sitio, amplíe Más opciones de procesamiento, y establezca Aplicar reconocimiento óptico de caracteres (OCR) en
On
.Cuando el OCR está activado y sus documentos contienen imágenes, el procesamiento tarda más tiempo. Para obtener más información, consulte Reconocimiento óptico de caracteres.
-
Pulse Finalizar.
La colección se crea rápidamente. Los datos tardan más tiempo en procesarse a medida que se añaden a la colección.
Si desea comprobar el progreso, vaya a la página Actividad. En el panel de navegación, haga clic en Gestionar colecciones y, a continuación, haga clic en para abrir la colección.
Pasos previos para versiones anteriores
Si utiliza la versión 2.2.1 o anterior, deberá completar estos pasos adicionales antes de poder conectarse al origen de datos:
- Obtenga un paquete de servicios web de su clúster Discovery. Este paquete de servicios web es un módulo personalizado que el rastreador utiliza para obtener la información necesaria para rastrear correctamente. Para obtener más información, consulte Obtener el paquete de servicios web.
- Despliegue el paquete de servicios web en el servidor SharePoint. Para obtener más información, consulte Despliegue de los servicios web en el servidor SharePoint.
Obtener el paquete de servicios web
Para obtener el paquete de servicios web de su clúster Discovery, complete los siguientes pasos:
-
Inicie una sesión en el clúster de Discovery.
-
Introduzca el siguiente comando para obtener su nombre de pod de
crawler
:oc get pods | grep crawler
Es posible que vea un resultado similar al siguiente mensaje:
wd-discovery-crawler-57985fc5cf-rxk89 1/1 Running 0 85m
-
Introduzca el siguiente comando para obtener el archivo
ESSPSolution.wsp
, sustituyendo{crawler-pod-name}
por el nombre de podcrawler
que obtuvo en el paso anterior:oc exec {crawler-pod-name} -- ls -l /opt/ibm/wex/zing/resources/ | grep ESSPSolution
Es posible que vea un resultado similar al siguiente mensaje:
-rw-r--r--. 1 dadmin dadmin 8600 Feb 3 08:23 ESSPSolution-${build-version}.wsp
-
Introduzca el siguiente comando para copiar el archivo
ESSPSolution.wsp
al servidor host, sustituyendo{build-version}
por el número de versión de compilación del paso anterior y{crawler-pod-name}
por el nombre del podcrawler
:oc cp {crawler-pod-name}:/opt/ibm/wex/zing/resources/ESSPSolution-${build-version}.wsp ESSPSolution.wsp
Implementar los servicios web en el servidor SharePoint
Puede desplegar los servicios web manualmente en el servidor de SharePoint o puede ejecutar un script que los despliegue automáticamente.
Para ejecutar el script que despliega automáticamente los servicios web:
-
Ejecute el script
ESSPSolution.wsp
en el servidor de SharePoint especificando el siguiente cmdlet de Windows PowerShell:Add-SPSolution -LiteralPath C:\files\ESSPSolution.wsp
-
En SharePoint,, abra SharePoint Central Administration y, a continuación, abra System Settings.
-
Implementar el paquete mediante el uso de soluciones de granja.
-
Seleccione la solución
esspsolution.wsp
y despliegue la solución.Una vez finalizado el despliegue, la solución de conjunto de servidores se muestra en la consola de administración de SharePoint. Un administrador puede habilitar o inhabilitar la solución y puede planificar desencadenantes.
-
Opcional: Independientemente del enfoque que haya utilizado para implementar los servicios web, para completar la implementación en algunos entornos, es posible que tenga que aplicar las siguientes configuraciones al servidor de Internet Information Services (IIS) que aloja el servidor SharePoint y los servicios web:
- Permitir la suplantación de .NET en IIS
- Cambie el nivel de confianza de ASP.NET por WSS_Medium
Puede aplicar estas configuraciones en el Administrador de Internet Information Services.