Microsoft SharePoint Online
Parcourir les documents stockés dans une source de données Microsoft SharePoint en ligne.
IBM Cloud Pak for Data IBM Software Hub
Ces informations ne s'appliquent qu'aux déploiements installés. Pour plus d'informations sur la connexion à un site en ligne SharePoint à partir d'un déploiement géré, voir SharePoint Online.
Quels sont les documents explorés ?
- Lors de l'exploration initiale du contenu, les documents de tous les objets accessibles à partir du chemin d'accès à la collection de sites que vous avez spécifié sont explorés et ajoutés à votre collection. Les métadonnées personnalisées associées au contenu de SharePoint sont également explorées.
- Vous pouvez explorer un chemin d'accès à la collection de sites par collection.
- Seuls les documents pris en charge par Discovery sont explorés ; tous les autres sont ignorés. Pour plus d'informations, voir Types de fichiers pris en charge.
- La sécurité au niveau du document est prise en charge. Lorsque cette option est activée, vos utilisateurs peuvent explorer et interroger le même contenu que celui auquel ils ont accès lorsqu'ils sont connectés à SharePoint. Pour plus d'informations, voir Supporting document-level security.
- Lorsqu'une source est réexplorée, les nouveaux documents sont ajoutés, les documents mis à jour sont modifiés dans leur version actuelle et les documents supprimés sont effacés de l'index de la collection.
- Tous les Discovery connecteurs de sources de données sont en lecture seule. Quelles que soient les autorisations accordées au compte d'exploration, Discovery n'écrit, ne met à jour et ne supprime jamais de contenu dans la source de données d'origine.
Discovery peut explorer les objets suivants :
- Collections de sites
- Sites
- SubSites
- Listes
- Liste des éléments
- Bibliothèques de documents
- Liste des pièces jointes
Configuration requise pour les sources de données
En plus des conditions requises pour la source de données pour tous les déploiements installés, votre SharePoint Online source de données doit répondre aux conditions suivantes :
-
La collection de sites à laquelle vous vous connectez doit être créée avec un plan Entreprise. Il ne peut s'agir d'une collection créée dans le cadre d'un plan pour les travailleurs de première ligne.
-
La prise en charge de l'authentification diffère en fonction du type de principal que vous spécifiez lorsque vous configurez la méthode d'authentification. Déterminez le type de principal que vous souhaitez utiliser avant de créer la collection ; vous ne pouvez pas modifier le type de principal ultérieurement. Les options suivantes sont disponibles :
-
Utilisateur: Le compte d'utilisateur crawl doit satisfaire aux exigences suivantes :
-
Le compte doit avoir un ID utilisateur Azure Active Directory avec l'autorisation d'accéder à tous les objets que vous voulez extraire. Par exemple,
admin_user@company.onmicrosoft.com
. L'ID de l'utilisateur doit avoir l'autorisationSite Collection Administrator
. -
L'authentification ancienne doit être activée pour le compte. Pour activer l'authentification héritée, allez sur le portail Azure ou contactez votre Azure Active Directory administrateur.
Le connecteur prend en charge la méthode
Password hash synchronization (PHS)
pour activer l'identité hybride uniquement. L'utilisation de tout autre type d'authentification (comme l'authentification de passage ou la Fédération) est à vos risques et périls. À moins que vous n'ayez créé votre compte SharePoint Online avant janvier 2020, l'authentification à deux facteurs est activée par défaut pour le compte. Vous devez désactiver l'authentification à deux facteurs.Pour afficher et modifier votre statut d'authentification multifacteur, consultez les sections Afficher le statut d'un utilisateur ou Modifier le statut d'un utilisateur.
-
-
Service: Lorsque vous vous connectez à vos données en tant que principal de service Azure Active Directory, vous pouvez utiliser l'authentification multifactorielle.
-
Pour plus d'informations sur l' SharePoint, consultez la documentation Microsoft SharePoint pour les développeurs.
Étapes préalables à l'utilisation d'un principal utilisateur
Si vous souhaitez activer la sécurité au niveau des documents, vous devez prendre certaines mesures pour la mettre en place. Pour plus d'informations, voir A propos de la sécurité de niveau document.
Le tableau suivant répertorie les autorisations à définir pour une méthode d'authentification principale de l'utilisateur.
-
Enregistrez votre application.
Pour plus d'informations, voir la Documentation Microsoft.
-
Configurer les autorisations de l'API.
interface de programme d"application | Droits | Type |
---|---|---|
Microsoft Graph (Groupes) | Group.Read.All ou Group.ReadWrite.All |
Délégué |
Microsoft Graph (Annuaires) | Directory.AccessAsUser.All ou Directory.Read.All ou Directory.ReadWrite.All |
Délégué |
SharePoint Online | User.Read.All ou User.ReadWrite.All |
Délégué |
Étapes préalables à l'utilisation d'un principal de service
Un principal de service est une identité de sécurité utilisée par les applications, les services et les outils d'automatisation créés par l'utilisateur pour accéder à des ressources spécifiques d'Azure. Il s'agit d'une identité d'utilisateur (vérifiée à l'aide d'un certificat) qui a un rôle spécifique et des autorisations étroitement contrôlées. Si vous vous connectez à SharePoint Online en tant qu'utilisateur principal du service, vous pouvez accéder à vos données sans désactiver l'authentification multifactorielle.
Pour vous préparer à vous connecter en tant que principal de service, suivez les étapes suivantes :
- Créer un fichier de certification.
- Enregistrer une application avec SharePoint Online.
- Ajouter un certificat.
- Configurer les autorisations API.
- Activer le Azure Service de contrôle d'accès(ACS).
- Créer une autorisation de site.
Créer un dossier de certification
Le crawler prend en charge les formats suivants pour une clé privée :
- PKCS #1
- PKCS #1 avec mot de passe
- PKCS #8
- PKCS #8 avec mot de passe
La procédure suivante vous montre comment créer une clé privée au format PKCS #1 sans mot de passe.
-
Créer une clé privée.
openssl genrsa 2048 > spo-private.key
-
Créer une clé publique.
openssl rsa -in spo-private.key -pubout -out spo-public.key
-
Créer un fichier de demande de signature de certificat (CSR).
openssl req -new -key spo-private.key > spo-request.csr
-
Créer un fichier de certification.
openssl x509 -req -in spo-request.csr -signkey spo-private.key -out spo.crt -days 3650
Enregistrer une application avec SharePoint Online
Suivez les instructions de la documentation Microsoft pour enregistrer une Azure.
Faites les choix suivants :
- Choisissez l'option Comptes dans ce répertoire organisationnel uniquement.
- Définir le type de client comme un client public.
- Notez le Azure ID de l'application (client) qui est attribué à votre application lorsque vous l'enregistrez.
Lorsque vous enregistrez une application dans le portail, un objet d'application et un objet principal de service sont automatiquement créés dans votre locataire d'origine.
Ajouter un certificat
Téléchargez le certificat que vous avez créé précédemment.
Configurer les autorisations de l'API
Suivez la documentation de Microsoft pour ajouter des autorisations API.
Le tableau suivant répertorie les autorisations à définir pour une méthode d'authentification du principal du service et la sécurité au niveau du document est activée.
interface de programme d"application | Droits | Type |
---|---|---|
Microsoft Graph (Groupes) | Group.Read.All |
Application |
Microsoft Graph (Annuaires) | Directory.Read.All |
Application |
SharePoint | Sites.FullControl.All |
Application |
Le tableau suivant répertorie les autorisations à définir pour une méthode d'authentification du principal du service et la sécurité au niveau du document est désactivée.
interface de programme d"application | Droits | Type |
---|---|---|
Microsoft Graph | Sites.Read.All |
Application |
SharePoint | Sites.Read.All |
Application |
- Après avoir configuré les autorisations API, cliquez sur Grant admin consent for {tenant-name}.
Activer le Azure Service de contrôle d'accès (ACS)
Cette procédure n'est nécessaire que si vous souhaitez configurer les autorisations d'application pour chaque collection de sites.
-
Ouvrez un shell de gestion en ligne SharePoint.
Pour plus d'informations, voir Démarrer avec SharePoint Online Management Shell.
-
Activez l'authentification basée sur l'application ACS en exécutant la commande suivante :
Set-PnPTenant -DisableCustomAppAuthentication $false
Pour plus d'informations, voir Set-PnPTenant.
-
Suivez les étapes de la documentation Microsoft pour Accorder l'accès en utilisant SharePoint App-Only.
-
Copiez les valeurs Client ID et Client Secret.
-
Définissez la demande d'autorisation appropriée pour votre déploiement.
Allez sur https://{tenant-name}.sharepoint.com/sites/{site}/_layouts/15/AppInv.aspx.
Si la sécurité au niveau du document est activée, spécifiez la demande XML suivante :
<AppPermissionRequests AllowAppOnlyPolicy="true"> <AppPermissionRequest Scope="http://sharepoint/content/sitecollection" Right="FullControl" /> </AppPermissionRequests>
Si la sécurité au niveau du document est désactivée, spécifiez la demande XML suivante :
<AppPermissionRequests AllowAppOnlyPolicy="true"> <AppPermissionRequest Scope="http://sharepoint/content/sitecollection" Right="Read" /> </AppPermissionRequests>
-
Confirmez que vous faites confiance à l'application.
Créer une autorisation de site
Ajouter une autorisation Sites.Selected
pour l'API Microsoft Graph. Requérir l'autorisation de Sites.FullControl.All
pour appeler l'API suivante :
curl -s -XPOST -H "Authorization: ${access_token}" -H "Content-Type: application/json" \
https://graph.microsoft.com/v1.0/sites/{site}/permissions -d '{
"roles": ["read"],
"grantedToIdentities": [{
"application": {
"id": "{azure_ad_app_id}",
"displayName": "{display_name}"
}
}]
}'
Pour plus d'informations, voir la Documentation Microsoft.
Se connecter à une source de données en ligne SharePoint
À partir de votre projet d' Discovery, procédez comme suit :
-
Dans le volet de navigation, choisissez Gestion des collections.
-
Cliquez sur Nouvelle collection.
-
Cliquez sur SharePoint Online, puis cliquez sur Suivant.
-
Nommez la collection.
-
Si la langue des documents dans SharePoint n'est pas l'anglais, sélectionnez la langue appropriée.
Pour obtenir la liste des langues prises en charge, voir Langues prises en charge.
-
En option: Modifier le calendrier de synchronisation.
Pour plus d'informations, voir Options de planification du ramassage.
-
Dans la section Méthode d'authentification, spécifiez le type de principal que vous souhaitez utiliser lorsque vous vous authentifiez avec SharePoint parmi les options suivantes :
-
Utilisateur: Un utilisateur de votre organisation Active Directory.
Dans la section Entrez vos données d'identification, remplissez les champs suivants :
- Nom d'utilisateur
- Le nom d'utilisateur de l'utilisateur d' SharePoint, qui a accès à tous les sites et listes à explorer et à indexer, par exemple
crawl_username@company.onmicrosoft.com
. - Mot de passe
- Le mot de passe de l'utilisateur SharePoint.
Cette valeur n'est jamais renvoyée et n'est utilisée que lorsque vous créez ou modifiez des identifiants.
-
Service: Une identité de sécurité utilisée par les applications, les services et les outils d'automatisation créés par l'utilisateur pour accéder à des ressources Azure spécifiques. Il s'agit d'une identité d'utilisateur (vérifiée à l'aide d'un certificat) qui a un rôle spécifique et des autorisations étroitement contrôlées.
La prise en charge de l'utilisation d'un service principal a été ajoutée à la version 4.0.3.
Dans la section Entrez vos données d'identification, remplissez les champs suivants :
- Nom du titulaire
-
Le locataire où résident les données. Par exemple,
ibm.onmicrosoft.com
. - ID d'application
-
L'identifiant de votre application. Par exemple,
19ce9f74-cd14-4b68-8dfc-4bcc75ed2fe9
. Téléchargez les fichiers suivants : - Dossier de certification
-
Le fichier de certification que vous avez créé dans SharePoint. Par exemple,
myinfo.crt
. - Fichier de clé privée
-
Le fichier de clé privée que vous avez créé dans SharePoint. Par exemple,
private.app.key
.Si un mot de passe pour la clé privée est requis, indiquez-le. Si ce crawler a le droit d'accéder uniquement à la collection de sites spécifiée, réglez le commutateur Azure Access Control Service sur
On
, puis fournissez les valeurs suivantes :
- ID de client
- Secret client
-
-
Dans la section Spécifiez ce que vous voulez explorer, ajoutez des valeurs aux champs suivants :
- Url de la collection de sites
- Le service web SharePoint URL. Par exemple,
https://organization_name.com
. - Principal de l'utilisateur uniquement
- Dans le champ Site Collection Name, indiquez le nom utilisé par la collection de sites. Obtenir le nom à partir des paramètres de la collection de sites.
-
Optionnel: si vous utilisez un serveur proxy pour accéder au serveur de la source de données, dans la section Paramètres proxy, réglez le commutateur Activer les paramètres proxy sur
On
. Ajoutez des valeurs aux champs suivants :- Nom d'utilisateur
- Facultatif. Le nom d'utilisateur du serveur proxy à authentifier, si le serveur proxy nécessite une authentification. Si vous ne connaissez pas votre nom d'utilisateur, vous pouvez l'obtenir auprès de l'administrateur de votre serveur proxy.
- Mot de passe
- Facultatif. Le mot de passe du serveur proxy à authentifier, si le serveur proxy nécessite une authentification. Si vous ne connaissez pas votre mot de passe, vous pouvez l'obtenir auprès de l'administrateur de votre serveur proxy.
- Nom d'hôte ou adresse IP du serveur proxy
- Le nom d'hôte ou l'adresse IP du serveur proxy.
- Numéro de port du serveur proxy
- Le port réseau auquel vous souhaitez vous connecter sur le serveur proxy.
-
Optionnel: si vous souhaitez activer la sécurité au niveau du document, dans la section Sécurité, réglez le commutateur Activer la sécurité au niveau du document sur
On
.Lorsque cette option est activée, vos utilisateurs peuvent explorer et interroger le même contenu que celui auquel ils ont accès lorsqu'ils sont connectés à SharePoint. Pour plus d'informations, voir Supporting document-level security.
Utilisateur principal uniquement: Lorsque vous activez cette option, vous devez ajouter au champ Identifiant de l'application l'identifiant Azure qui a été attribué à l'application lors de son enregistrement.
Pour activer la sécurité au niveau des documents, vous devez enregistrer votre application auprès de SharePoint. Pour plus d'informations, voir les étapes préalables pour le type de principal que vous utilisez.
-
Si vous souhaitez que le robot extraie le texte des images du site, développez Plus de paramètres de traitement, et réglez Appliquer la reconnaissance optique de caractères (OCR) sur
On
.Lorsque l'OCR est activé et que vos documents contiennent des images, le traitement prend plus de temps. Pour plus d'informations, voir Reconnaissance optique des caractères.
-
Cliquez sur Terminer.
La collection est créée rapidement. Le traitement des données prend plus de temps au fur et à mesure qu'elles sont ajoutées à la collection.
Si vous souhaitez vérifier l'état d'avancement du projet, rendez-vous sur la page Activité. Dans le volet de navigation, cliquez sur Gestion des collections, puis sur pour ouvrir la collection.