IBM Cloud Docs
Microsoft SharePoint Online

Microsoft SharePoint Online

Eseguire la ricerca per indicizzazione dei documenti memorizzati in una origine dati Microsoft SharePoint Online.

IBM Cloud IBM Cloud solo

Queste informazioni si applicano solo alle installazioni gestite. Per ulteriori informazioni sulla connessione a SharePoint Online da una distribuzione installata, vedere SharePoint Online.

Documenti sottoposti a ricerca per indicizzazione

Durante la ricerca per indicizzazione iniziale del contenuto, i documenti di tutti gli oggetti a cui è possibile accedere dal percorso di raccolta del sito specificato vengono sottoposti a ricerca per indicizzazione e aggiunti alla propria raccolta. Ad esempio, non è possibile limitare la ricerca per indicizzazione a una libreria all'interno di una raccolta di siti. Viene eseguita la ricerca per indicizzazione su tutti gli oggetti nel percorso della raccolta del sito specificato. Viene eseguita la ricerca per indicizzazione anche dei metadati personalizzati associati al contenuto SharePoint. È possibile eseguire la ricerca per indicizzazione su un percorso di raccolta sito per raccolta. Non è possibile eseguire la ricerca per indicizzazione su * SiteCollections*.

Durante le successive ricerche per indicizzazione pianificate, viene eseguita la ricerca per indicizzazione solo sui documenti nuovi e modificati e le eventuali modifiche vengono riportate nella propria raccolta. I documenti eliminati dall'origine dati esterna non vengono eliminati dalla raccolta.

Tutti i connettori dell'origine dati Discovery sono di sola lettura. Indipendentemente dalle autorizzazioni concesse all'account di ricerca per indicizzazione, Discovery non scrive, aggiorna o elimina mai alcun contenuto nell'origine dati originale.

Discovery può eseguire la ricerca per indicizzazione sui seguenti oggetti:

  • SiteCollections
  • Siti
  • SubSites
  • Elenchi
  • Elementi elenco
  • Librerie documenti
  • Allegati elemento elenco

Requisiti dell'origine dati

Oltre ai requisiti dell'origine dati per tutte le distribuzioni gestite, l'origine dati SharePoint Online deve soddisfare i seguenti requisiti:

  • La raccolta del sito a cui ti connetti deve essere una raccolta creata con un piano Enterprise. Non può essere una raccolta creata con un piano di lavoro in prima linea.
  • È necessario disporre di un ID utente Azure Active Directory con autorizzazione per leggere tutti gli oggetti su cui si desidera eseguire la ricerca per indicizzazione. Ad esempio, <admin_user>@.onmicrosoft.com. L'ID utente non necessita dell'autorizzazione SiteCollection Administrator.

È possibile scegliere come autenticare l'account Microsoft SharePoint esterno dalle seguenti opzioni:

Apri autenticazione (OAuth v2)

Esegue l'autenticazione con l'origine dati esterna utilizzando un token in modo che le credenziali dell'utente non debbano essere condivise. Con questo metodo di autenticazione, puoi accedere direttamente all'account Microsoft per generare un token utilizzato da Discovery per connetterti ai tuoi dati.

L'opzione Accedi con Microsoft che utilizza l'autenticazione aperta v2 per l'autenticazione con l'origine dati esterna è una funzione beta.

Prima che chiunque possa creare i connettori che utilizzano questo metodo di autenticazione, un utente con ruolo Amministratore globale deve completare una procedura di prerequisito una tantum per autorizzare la connessione per tutti i progetti nell'istanza del servizio Discovery.

SAML (Security Assertion Markup Language)

Un meccanismo meno recente per l'autenticazione e l'autorizzazione che richiede la condivisione delle credenziali utente con il servizio Discovery.

Se si sceglie di utilizzare questo metodo di autenticazione, l'account Microsoft SharePoint deve soddisfare i requisiti riportati di seguito:

  • A meno che l'account SharePoint Online non sia stato creato prima del gennaio 2020, l'autenticazione a due fattori è abilitata per impostazione predefinita. È necessario disabilitare l'autenticazione a due fattori.

    Per visualizzare e modificare lo stato dell'autenticazione a più fattori, vedere Visualizza lo stato di un utente o Modifica lo stato di un utente.

  • L'account utente di ricerca per indicizzazione deve avere l'autenticazione legacy e le autorizzazioni a livello Contribute abilitate.

    Per abilitare l'autenticazione legacy, andare al portaleAzure o contattare l'amministratore di SharePoint.

  • Il connettore supporta il metodo Password hash synchronization (PHS) per abilitare solo l'identità ibrida. Utilizzare qualsiasi altro tipo (come l'autenticazione Pass - through o la federazione) a proprio rischio.

  • È necessario conoscere le seguenti informazioni:

    Nome utente

    Il nome utente dell'account utente da utilizzare per connettersi a SharePoint Online SiteCollection su cui si desidera eseguire la ricerca per indicizzazione.

    Ad esempio, <janedoe>@exampledomain.onmicrosoft.com.

    Password

    La password per connettersi al sito SharePoint Online SiteCollection che si desidera analizzare.

    Questo valore non viene mai restituito e viene utilizzato solo quando le credenziali vengono create o modificate.

Cosa ti serve prima di iniziare

È necessario disporre delle seguenti informazioni pronte. Se non lo si conosce, chiedere all'amministratore di SharePoint di fornire le informazioni o consultare la documentazione per sviluppatori di Microsoft SharePoint:

URL organizzazione

La radice URL dell'origine che si vuole crawlare. Specificare il nome del dominio di URL, ad esempio https://<company>.<domain>.com.

Percorso raccolta sito

site_collection_path nella sezione del sito in cui si desidera avviare la ricerca per indicizzazione.

Ad esempio, se il contenuto che si desidera sottoporre a crawling è disponibile da https://<company>.<domain>.com/sites/test, è possibile specificare https://<company>.<domain>.com come Organizzazione URL e /sites/test come percorso della raccolta di siti.

  • Non è possibile specificare percorsi di cartella come input.
  • Non è possibile specificare un percorso per un file ASPX (Active Server Page Extended), ad esempio URL per librerie di documenti, elenchi e siti secondari.
  • Se non si specifica un percorso, viene utilizzato il valore predefinito di / e la raccolta del sito root viene sottoposta a ricerca per indicizzazione.
  • ID applicazione: ID dell'origine dati su cui si desidera eseguire la ricerca per indicizzazione. Queste informazioni sono richieste solo se si desidera memorizzare le informazioni ACL associate ai documenti di origine.

Passo prerequisito una tantum per OAuth

Prima che chiunque possa configurare il connettore per l'utilizzo del metodo di autenticazione OAuth v2, un utente con il ruolo Amministratore globale in Microsoft Azure Directory in cui si trova l'origine dati deve completare la procedura per registrare l'applicazione enterprise Discovery in Microsoft Azure. Questo passo deve essere completato una sola volta per istanza del servizio Discovery.

L'amministratore non deve creare l'applicazione in Azure. Quando scelgono SharePoint Online come origine dati, il servizio Discovery genera automaticamente l'app. Come descritto nella procedura da seguire, durante la configurazione del connettore, l'amministratore deve accedere a Microsoft con le credenziali per un utente con il ruolo Amministratore globale in Microsoft Azure Directory e consentire la registrazione dell'applicazione enterprise.

La seguente procedura deve essere completata da un amministratore globale una sola volta per istanza del servizio:

  1. Esaminare le impostazioni di accesso utente predefinite che verranno applicate all'applicazione enterprise in Microsoft Azure.

    Le applicazioni enterprise possono gestire l'accesso utente in molti modi. Controllare le impostazioni predefinite per assicurarsi che siano appropriate per la distribuzione completando la seguente procedura:

    1. Accedere a Microsoft Azure.
    2. Dalla pagina Applicazioni enterprise in Azure Active Directory, fare clic su Consenso e autorizzazioni.

    Azure Enterprise App Permissions user interface
    Microsoft Azure Enterprise application permissions user interface

    1. Effettua una delle operazioni riportate di seguito:

      • Se è selezionata l'opzione Consenti consenso utente per app, non è più necessaria alcuna azione.

      • Se è selezionato Consenti il consenso dell'utente per le app dai publisher verificati, per le autorizzazioni selezionate, completare la seguente procedura:

        Fare clic sul link Classificazioni autorizzazioni, quindi verificare che le seguenti autorizzazioni siano configurate almeno:

        • Office 365 SharePoint Online: MyFiles.Leggi
        • Office 365 SharePoint Online: AllSites.Leggi
        • Grafico Microsoft: offline_access
        • Grafico Microsoft: profilo

      L'opzione Non consentire consenso utente non è supportata.

      Le impostazioni che specifichi verranno applicate all'applicazione enterprise creata da Discovery nei passi successivi.

  2. Dal riquadro di navigazione di Discovery, scegli Manage collections.

  3. Fare clic su Nuova raccolta.

  4. Fare clic su SharePoint Online, quindi fare clic su Avanti.

  5. Aggiungere un URL al campo Organizzazione URL.

  6. Fare clic su Accedi con Microsoft.

    Le finestre a comparsa devono essere abilitate per questo sito nel browser Web.

    L'opzione Accedi con Microsoft che utilizza l'autenticazione aperta per autenticarsi con l'origine dati esterna è una funzione beta.

    Accedere all'account Microsoft SharePoint con nome utente e password, quindi completare l'autenticazione a due fattori, se necessario.

    Tenere presente che le credenziali utilizzate devono avere il ruolo Amministratore globale in Microsoft Azure Directory. Se non viene richiesto un nome utente e una password, prendere nota. È possibile che l'utente abbia già eseguito l'accesso a un account Microsoft Sharepoint. Se si è collegati a un account che non si desidera utilizzare per questo connettore, fermarsi qui. (Qualsiasi account in cui hai effettuato l'accesso verrà utilizzato automaticamente. Non è possibile modificare la configurazione dell'account in un secondo momento.) Aprire un browser Web in modalità incognito e avviare questa procedura dal passaggio 1.

    Il rilevamento genera un'applicazione enterprise che verrà registrata con l'organizzazione SharePoint specificata. Il nome dell'applicazione enterprise ha il formato IBM App Connect_{unique name}.

  7. Esaminare i permessi associati con l'applicazione enterprise che il rilevamento registrerà, quindi selezionare Consenso per conto della propria organizzazione.

    Finestra di dialogo di richiesta di autorizzazione che richiede il consenso per conto della propria organizzazione per consentire all'applicazione di 1. Leggere i file utente. 2. Leggere gli elementi in tutte le raccolte di siti. 3. Mantenere l'accesso ai dati a cui è stato fornito l'accesso. 4. Visualizza il profilo di base degli utenti.
    Discovery permission request dialog

  8. Fare clic su Accetta.

  9. Se si desidera creare una raccolta, è possibile denominarla e fare clic su Fine.

    In caso contrario, è possibile fare clic su Indietro per uscire dal processo di creazione della raccolta.

Ora, chiunque dalla tua organizzazione lavori in un progetto ospitato dalla stessa istanza del servizio Discovery può creare una raccolta utilizzando il connettore SharePoint Online.

Revisioni del supporto OAuth

Il supporto per il metodo di autenticazione OAuth è stato aggiunto con un aggiornamento software nel febbraio 2022. Se si desidera aggiornare un connettore esistente per utilizzare OAuth invece di SAML, è necessario ricreare il connettore. Non Š possibile modificare il meccanismo di autenticazione per un connettore esistente.

Il metodo di autenticazione OAuth è stato aggiornato nel gennaio 2023. L'applicazione enterprise registrata con Microsoft Azure ora richiede solo l'accesso in Lettura. In precedenza, l'applicazione enterprise richiedeva l'accesso in Scrittura. Se si desidera trarre vantaggio da questa modifica, eliminare l'applicazione enterprise corrente e ricreare il connettore. Per ulteriori informazioni su come eliminare un'applicazione enterprise, consultare la documentazione Microsoft.

Connessione all'origine dati

Per configurare l'origine dati Microsoft SharePoint Online, completa la seguente procedura in Discovery:

  1. Dal riquadro di spostamento, scegliere Gestisci raccolte.

  2. Fare clic su Nuova raccolta.

  3. Fare clic sul link accanto a È necessario connettersi a una origine dati? fare clic su SharePoint Online, quindi fare clic su Next.

  4. Aggiungere un URL al campo Organizzazione URL.

  5. Per abilitare l'accesso all'origine dati esterna, scegliere il metodo che si desidera utilizzare per l'autenticazione con l'origine dati dalle seguenti opzioni:

    Apri autenticazione (OAuth v2)

    Fare clic su Accedi con Microsoft.

    Le finestre a comparsa devono essere abilitate per questo sito nel browser Web.

    L'opzione Accedi con Microsoft che utilizza l'autenticazione aperta per autenticarsi con l'origine dati esterna è una funzione beta.

    Accedere all'account Microsoft SharePoint con nome utente e password, quindi completare l'autenticazione a due fattori, se necessario.

    SAML (Security Assertion Markup Language)

    Specificare un nome utente e una password per un utente autorizzato ad accedere al sito su cui si desidera eseguire la ricerca per indicizzazione, quindi fare clic su Avanti.

  6. Specificare il percorso su cui eseguire la ricerca per indicizzazione nel campo Percorso raccolta siti.

  7. Denominare la raccolta.

  8. Se la lingua dei documenti sul sito non è l'inglese, selezionare la lingua appropriata.

    Per un elenco delle lingue supportate, vedi Supporto linguistico.

  9. Facoltativo: modificare la pianificazione della sincronizzazione.

    Per ulteriori informazioni, vedi Opzioni di pianificazione della ricerca per indicizzazione.

  10. Facoltativo: se si desidera memorizzare le informazioni di controllo accessi presenti nei documenti SharePoint su cui si esegue la ricerca per indicizzazione, nella sezione Sicurezza, impostare l'opzione Includi elenco di controllo accessi su On.

    Quando si abilita questa opzione, le informazioni sulle regole di accesso SharePoint archiviate nei documenti di origine SharePoint vengono conservate e archiviate come metadati nei documenti aggiunti alla raccolta.

    Questa funzione non è uguale all'abilitazione della sicurezza a livello di documento per la raccolta. Le regole di accesso nei metadati del documento non vengono utilizzate dalla ricerca Discovery. L'abilitazione di questa funzione memorizza semplicemente le informazioni in modo da poter sfruttare le regole di accesso quando si crea una soluzione di ricerca personalizzata.

    L'utilizzo di questa funzione aumenta la dimensione dei documenti generati nella raccolta e aumenta il tempo di ricerca per indicizzazione. Abilitare la funzione solo se il proprio caso d'uso richiede la memorizzazione delle informazioni ACL del documento SharePoint.

    Se si abilita questa funzione, qualcuno con il ruolo di amministratore in Microsoft SharePoint deve eseguire delle operazioni aggiuntive per garantire che gli utenti che eseguono la ricerca per indicizzazione sul sito dispongano delle autorizzazioni appropriate per accedere ai metadati ACL.

    Un amministratore deve completare la seguente procedura:

    1. Accedere a Microsoft SharePoint.

    2. Aprire la pagina per il sito SharePoint.

    3. Scegliere Autorizzazioni sitodal menu delle impostazioni.

    4. Fare clic su Impostazioni di autorizzazione avanzate.

    5. Assicurarsi che le persone che desiderano raccogliere le informazioni di controllo accessi durante una ricerca per indicizzazione abbiano o siano membri di un gruppo che dispone dell'autorizzazione Controllo completo per il sito.

      Mostra l'interfaccia utente di SharePoint in cui si definiscono le autorizzazioni per utenti e gruppi.
      Microsoft SharePoint permissions user interface

      Quando le informazioni dell'elenco di controllo accessi non vengono estratte, l'autorizzazione Lettura è sufficiente per tutti gli utenti che eseguono la ricerca per indicizzazione del contenuto.

  11. Se si desidera limitare i tipi di file da aggiungere alla raccolta, è possibile elencare le estensioni file per i tipi di file da includere o escludere.

    Quando si sceglie di elencare le estensioni per i tipi di file da escludere, è necessario aggiungere almeno un'estensione file. Per impostazione predefinita, il Filtro estensione è applicabile solo agli oggetti SharePoint Librerie documenti e Allegati elemento dell'elenco. Per applicare il filtro a tutti i tipi di oggetti SharePoint, impostare Applica filtro di estensione a tutti i tipi di oggetti SharePoint su Su nell'interfaccia utente.

    Per un elenco dei tipi di file supportati, vedere Tipi di file supportati.

  12. Se si desidera che il crawler estragga il testo dalle immagini sul sito, espandere Ulteriori impostazioni di elaborazionee impostare Applica OCR (optical character recognition) su On.

    Quando OCR è abilitato e i tuoi documenti contengono immagini, l'elaborazione richiede più tempo. Per ulteriori informazioni, consultare Riconoscimento dei caratteri ottici.

  13. Fai clic su Finish.

La raccolta viene creata rapidamente. È necessario più tempo per l'elaborazione dei dati man mano che vengono aggiunti alla raccolta.

Se si desidera controllare l'avanzamento, andare alla pagina Attività. Dal riquadro di navigazione, fare clic su Gestisci raccolte, quindi fare clic per aprire la raccolta.

Attualmente non è possibile modificare l'account utente associato alla configurazione OAuth in un secondo momento, né i dettagli dell'account utente esistente che il connettore è configurato per utilizzare. Ad esempio, non è possibile aggiornare la parola d'ordine utilizzata per configurare la connessione dopo una modifica della parola d'ordine in SharePoint.

Informazioni sull'elenco di controllo accessi di esempio

La seguente schermata illustra il tipo di informazioni ACL memorizzate nel documento quando si include l'elenco di controllo accessi.

Mostra le informazioni Microsoft ACL memorizzate nell'oggetto di origine nei metadati del documento.
Representation of ACL information in document metadata