Microsoft SharePoint Online
Microsoft SharePoint Online 데이터 소스에 저장된 문서를 크롤링합니다.
IBM Cloud IBM Cloud 오직
이 정보는 관리 배치에만 적용됩니다. 설치된 배치에서 SharePoint Online에 연결하는 방법에 대한 자세한 정보는 SharePoint Online 을 참조하십시오.
크롤링되는 문서
컨텐츠의 초기 크롤링 중에 사용자가 지정하는 사이트 콜렉션 경로에서 액세스할 수 있는 모든 오브젝트의 문서가 크롤링되어 콜렉션에 추가됩니다. 예를 들어, 크롤링을 사이트 콜렉션 내의 한 라이브러리로 제한할 수 없습니다. 지정된 사이트 콜렉션 경로의 모든 오브젝트가 크롤링됩니다. SharePoint 컨텐츠와 연관된 사용자 정의 메타데이터도 크롤링됩니다. 콜렉션당 하나의 사이트 콜렉션 경로를 크롤링할 수 있습니다. 개인 SiteCollections를 크롤링할 수 없습니다.
후속 스케줄된 리크롤링 중에는 새 문서 및 수정된 문서만 크롤링되고 변경사항이 콜렉션에 반영됩니다. 외부 데이터 소스에서 삭제된 문서는 콜렉션에서 삭제되지 않습니다.
모든 Discovery 데이터 소스 커넥터는 읽기 전용입니다. 크롤링 계정에 부여된 권한에 관계없이 Discovery 는 원래 데이터 소스의 컨텐츠를 쓰거나 업데이트하거나 삭제하지 않습니다.
Discovery 는 다음 오브젝트를 크롤링할 수 있습니다.
- SiteCollections
- 사이트
- SubSites
- 목록
- 목록 항목
- 문서 라이브러리
- 항목 첨부 파일 나열
데이터 소스 요구사항
모든 관리 배치에 대한 데이터 소스 요구사항 외에도 SharePoint Online 데이터 소스는 다음 요구사항을 충족해야 합니다.
- 연결하는 사이트 콜렉션은 엔터프라이즈 플랜으로 작성된 것이어야 합니다. 전방 작업자 계획으로 작성된 콜렉션일 수 없습니다.
- 크롤링할 모든 오브젝트를 읽을 수 있는 권한이 있는 Azure Active Directory 사용자 ID가 있어야 합니다. 예를 들어,
<admin_user>@.onmicrosoft.com
입니다. 사용자 ID에는SiteCollection Administrator
권한이 필요하지 않습니다.
다음 옵션에서 외부 Microsoft SharePoint 계정으로 인증하는 방법을 선택할 수 있습니다.
- 인증 열기 (OAuth v2)
-
사용자 신임 정보를 공유할 필요가 없도록 토큰을 사용하여 외부 데이터 소스를 인증합니다. 이 인증 방법을 사용하면 Microsoft 계정에 직접 로그인하여 데이터에 연결하기 위해 Discovery 에서 사용하는 토큰을 생성할 수 있습니다.
외부 데이터 소스를 사용하여 인증하기 위해 Open Authentication v2 를 사용하는 Microsoft를 사용하여 로그인 옵션은 베타 기능입니다.
이 인증 방법을 사용하는 커넥터를 작성하려면 글로벌 관리자 역할을 가진 사용자가 일회성 전제조건 단계 를 완료하여 Discovery 서비스 인스턴스의 모든 프로젝트에 대한 연결에 권한을 부여해야 합니다.
- 보안 어설션 마크업 언어(SAML, Security Assertion Markup Language)
-
Discovery 서비스와 사용자 신임 정보를 공유해야 하는 인증 및 권한 부여를 위한 이전 메커니즘입니다.
이 인증 방법을 사용하도록 선택하는 경우 Microsoft SharePoint 계정은 다음 요구사항을 충족해야 합니다.
-
2020년 1월 이전에 SharePoint 온라인 계정을 생성하지 않은 경우, 해당 계정에 대해 2단계 인증이 기본적으로 활성화됩니다. 이중 요인 인증을 사용 안함으로 설정해야 합니다.
-
크롤링 사용자 계정에는 레거시 인증 및
Contribute
레벨 권한이 사용으로 설정되어 있어야 합니다.레거시 인증을 사용하려면 Azure 포털 로 이동하거나 SharePoint 관리자에게 문의하십시오.
-
커넥터는 하이브리드 ID를 사용으로 설정하기 위한
Password hash synchronization (PHS)
메소드만 지원합니다. 다른 유형 (예: Pass-through 인증 또는 연합) 을 사용하면 사용자가 위험을 감수해야 합니다. -
다음 정보를 알아야 합니다
- 사용자 이름
-
크롤링할 SharePoint Online SiteCollection 에 연결하는 데 사용할 사용자 계정의 사용자 이름입니다.
예를 들어,
<janedoe>@exampledomain.onmicrosoft.com
입니다. - 비밀번호
-
크롤링하려는 SharePoint 온라인 SiteCollection 에 접속하기 위한 비밀번호입니다.
이 값은 리턴되지 않으며 신임 정보가 작성되거나 수정될 때에만 사용됩니다.
-
시작하기 전에 필요한 사항
다음 정보가 준비되어 있어야 합니다. 모르는 경우 SharePoint 관리자에게 정보를 제공하도록 요청하거나 Microsoft SharePoint 개발자 문서를 참조하십시오.
- 조직 URL
-
크롤링하려는 소스의 루트 URL. URL 의 도메인 이름을 지정하십시오(예:
https://<company>.<domain>.com
). - 사이트 콜렉션 경로
-
크롤링을 시작할 사이트의 섹션에 대한
site_collection_path
입니다.예를 들어, 크롤링하려는 콘텐츠가
https://<company>.<domain>.com/sites/test
에서 제공되는 경우, 조직 URL 으로https://<company>.<domain>.com
을 지정하고 사이트 모음 경로로/sites/test
을 지정할 수 있습니다.- 폴더 경로를 입력으로 지정할 수 없습니다.
- 문서 라이브러리, 목록 및 하위 사이트에 대한 URL과 같은 활성 서버 페이지 확장 (ASPX) 파일에 대한 경로를 지정할 수 없습니다.
- 경로를 지정하지 않으면
/
의 기본값이 사용되고 루트 사이트 콜렉션이 크롤링됩니다.
- 애플리케이션 ID: 크롤링할 데이터 소스의 ID입니다. 이 정보는 소스 문서와 연관된 ACL 정보를 저장하려는 경우에만 필요합니다.
OAuth에 대한 일회성 전제조건 단계
OAuth v2 인증 방법을 사용하도록 커넥터를 구성하려면 먼저 데이터 소스가 있는 Microsoft Azure 디렉토리에서 글로벌 관리자 역할을 가진 사용자가 Microsoft Azure에서 Discovery 엔터프라이즈 애플리케이션을 등록하는 단계를 완료해야 합니다. 이 단계는 Discovery 서비스 인스턴스마다 한 번씩 완료해야 합니다.
관리자는 Azure에서 애플리케이션을 작성할 필요가 없습니다. SharePoint Online을 데이터 소스로 선택하면 Discovery 서비스가 자동으로 앱을 생성합니다. 수행할 프로시저에 설명된 대로, 커넥터 설정 중에 관리자는 Microsoft Azure 디렉토리에서 글로벌 관리자 역할이 있는 사용자의 신임 정보를 사용하여 Microsoft에 로그인하고 엔터프라이즈 애플리케이션을 등록할 수 있도록 허용해야 합니다.
다음 단계는 서비스 인스턴스당 한 번만 글로벌 관리자가 완료해야 합니다.
-
Microsoft Azure에서 엔터프라이즈 애플리케이션에 적용될 기본 사용자 액세스 설정을 검토하십시오.
엔터프라이즈 애플리케이션은 여러 가지 방법으로 사용자 액세스를 처리할 수 있습니다. 다음 단계를 완료하여 기본 설정이 배치에 적합한지 확인하십시오.
- Microsoft Azure에 로그인하십시오.
- Azure Active Directory의 엔터프라이즈 애플리케이션 페이지에서 동의 및 권한을 클릭하십시오.
Microsoft Azure Enterprise application permissions user interface -
다음 중 하나를 수행하십시오.
-
앱에 대한 사용자 동의 허용 을 선택하면 더 이상 조치가 필요하지 않습니다.
-
선택된 권한에 대해 확인된 공개자의 앱에 대한 사용자 동의 허용 이 선택된 경우 다음 단계를 완료하십시오.
권한 분류 링크를 클릭한 후 최소한 다음 권한이 구성되어 있는지 확인하십시오.
- Office 365 SharePoint 온라인: MyFiles.읽기
- Office 365 SharePoint 온라인: AllSites.읽기
- Microsoft 그래프: offline_access
- Microsoft Graph: 프로파일
사용자 승인 허용 안함 옵션 은 지원되지 않습니다.
사용자가 지정하는 설정은 후속 단계에서 Discovery 에 의해 작성되는 엔터프라이즈 애플리케이션에 적용됩니다.
-
-
Discovery의 탐색 분할창에서 콜렉션 관리를 선택하십시오.
-
새 컬렉션을 클릭합니다.
-
SharePoint 온라인을 클릭한 후 다음을 클릭하십시오.
-
조직 URL 필드 에 추가( URL )를 추가합니다.
-
Microsoft로 로그인을 클릭합니다.
웹 브라우저에서 이 사이트에 대해 팝업을 사용으로 설정해야 합니다.
외부 데이터 소스를 인증하기 위해 Open Authentication을 사용하는 Microsoft를 사용하여 로그인 옵션은 베타 기능입니다.
사용자 이름 및 비밀번호를 사용하여 Microsoft SharePoint 계정에 로그인한 후 필요한 경우 이중 인증을 완료하십시오.
사용하는 신임 정보에는 Microsoft Azure Directory의 글로벌 관리자 역할이 있어야 합니다. 사용자 이름 및 비밀번호를 입력하라는 프롬프트가 표시되지 않으면 기록해 두십시오. Microsoft Sharepoint 계정에 이미 로그인되어 있을 수 있습니다. 이 커넥터에 사용하지 않을 계정에 로그인한 경우 여기에서 중지하십시오. (사용자가 로그인한 모든 계정이 자동으로 사용됩니다. 그리고 나중에 계정 설정을 변경할 수 없습니다.) 익명 모드에서 웹 브라우저를 열고 1단계에서이 프로시저를 시작하십시오.
감지는 사용자가 지정하는 SharePoint 조직에 등록할 엔터프라이즈 애플리케이션을 생성합니다. 엔터프라이즈 애플리케이션 이름의 형식은 *IBM App Connect_{unique name}*입니다.
-
Discovery가 등록할 엔터프라이즈 애플리케이션과 연관된 권한을 검토한 후 조직 대신 동의를 선택하십시오.
Discovery permission request dialog -
동의하기를 클릭합니다.
-
콜렉션을 작성하려면 콜렉션의 이름을 지정한 후 완료를 클릭하십시오.
그렇지 않으면 이전 을 클릭하여 콜렉션 작성 프로세스를 종료할 수 있습니다.
이제 동일한 Discovery 서비스 인스턴스에서 호스팅되는 프로젝트에서 작업하는 조직의 모든 사용자가 SharePoint 온라인 커넥터를 사용하여 콜렉션을 작성할 수 있습니다.
OAuth 지원 개정판
OAuth 인증 방법에 대한 지원이 2022년 2월에 소프트웨어 업데이트와 함께 추가되었습니다. SAML 대신 OAuth를 사용하도록 기존 커넥터를 업데이트하려면 커넥터를 다시 작성해야 합니다. 기존 커넥터의 인증 메커니즘을 변경할 수 없습니다.
인증의 OAuth 메소드가 2023년 1월에 업데이트되었습니다. Microsoft Azure 에 등록된 엔터프라이즈 애플리케이션에는 이제 읽기 액세스 권한만 필요합니다. 이전에는 엔터프라이즈 애플리케이션에 쓰기 액세스가 필요했습니다. 이 변경사항을 이용하려면 현재 엔터프라이즈 응용프로그램을 삭제하고 커넥터를 다시 작성하십시오. 엔터프라이즈 애플리케이션을 삭제하는 방법에 대한 자세한 정보는 Microsoft 문서를 참조하십시오.
데이터 소스에 연결
Microsoft SharePoint Online 데이터 소스를 구성하려면 Discovery에서 다음 단계를 완료하십시오.
-
탐색 분할창에서 콜렉션 관리를 선택하십시오.
-
새 컬렉션을 클릭합니다.
-
데이터 소스에 연결해야 함옆에 있는 링크를 클릭하십시오. 필드에서 SharePoint 온라인을 클릭한 후 다음을 클릭하십시오.
-
조직 URL 필드 에 추가( URL )를 추가합니다.
-
외부 데이터 소스에 대한 액세스를 사용으로 설정하려면 다음 옵션에서 데이터 소스를 사용하여 인증하는 데 사용할 방법을 선택하십시오.
- 인증 열기 (OAuth v2)
-
Microsoft로 로그인을 클릭합니다.
웹 브라우저에서 이 사이트에 대해 팝업을 사용으로 설정해야 합니다.
외부 데이터 소스를 인증하기 위해 Open Authentication을 사용하는 Microsoft를 사용하여 로그인 옵션은 베타 기능입니다.
사용자 이름 및 비밀번호를 사용하여 Microsoft SharePoint 계정에 로그인한 후 필요한 경우 이중 인증을 완료하십시오.
- 보안 어설션 마크업 언어(SAML, Security Assertion Markup Language)
-
크롤링할 사이트에 액세스할 수 있는 권한이 부여된 사용자의 사용자 이름 및 비밀번호를 지정한 후 다음을 클릭하십시오.
-
사이트 콜렉션 경로 필드에 크롤링할 경로를 지정하십시오.
-
콜렉션의 이름을 지정하십시오.
-
사이트에 있는 문서의 언어가 영어가 아닌 경우 적절한 언어를 선택하십시오.
지원되는 언어 목록은 언어 지원을 참조하십시오.
-
선택사항: 동기화 스케줄을 변경하십시오.
자세한 정보는 크롤링 스케줄 옵션 을 참조하십시오.
-
선택사항: 크롤링하는 SharePoint 문서에 있는 액세스 제어 정보를 저장하려면 보안 섹션에서 액세스 제어 목록 포함 스위치를
On
로 설정하십시오.이 옵션을 사용으로 설정하면 SharePoint 소스 문서에 저장된 SharePoint 액세스 규칙에 대한 정보가 보유되고 콜렉션에 추가된 문서에 메타데이터로 저장됩니다.
이 기능은 콜렉션에 대한 문서 레벨 보안을 사용 가능하게 하는 것과 동일하지 않습니다. 문서 메타데이터의 액세스 규칙은 Discovery 검색에서 사용되지 않습니다. 이 기능을 사용하면 사용자 정의 검색 솔루션을 빌드할 때 액세스 규칙을 활용할 수 있도록 정보가 저장됩니다.
이 기능을 사용하면 콜렉션에서 생성되는 문서의 크기가 증가하고 크롤링 시간이 증가합니다. 유스 케이스에서 SharePoint 문서 ACL 정보를 저장해야 하는 경우에만 이 기능을 사용으로 설정하십시오.
이 기능을 사용으로 설정하면 Microsoft SharePoint 에서 관리자 역할을 가진 사용자가 추가 단계를 수행하여 사이트를 크롤링하는 사용자에게 ACL 메타데이터에 액세스할 수 있는 올바른 권한이 있는지 확인해야 합니다.
관리자는 다음 단계를 완료해야 합니다
-
Microsoft SharePoint에 로그인하십시오.
-
SharePoint 사이트의 페이지를 여십시오.
-
설정 메뉴에서 사이트 권한을 선택하십시오.
-
고급 권한 설정을 클릭합니다.
-
크롤링 중에 액세스 제어 정보를 수집하려는 사용자가 사이트에 대한 전체 제어 권한이 있는 그룹의 구성원인지 확인하십시오.
Microsoft SharePoint permissions user interface 액세스 제어 목록 정보가 추출되지 않으면 컨텐츠를 크롤링하는 모든 사용자에게 읽기 권한이 충분합니다.
-
-
콜렉션에 추가할 파일 유형을 제한하려는 경우 포함 또는 제외할 파일 유형의 파일 확장자를 나열할 수 있습니다.
제외할 파일 유형의 확장자를 나열하도록 선택하는 경우 하나 이상의 파일 확장자를 추가해야 합니다. 기본적으로 확장 필터 는 SharePoint 문서 라이브러리 및 항목 첨부 나열 오브젝트에만 적용할 수 있습니다. 모든 SharePoint 오브젝트 유형에 필터를 적용하려면 사용자 인터페이스에서 모든 SharePoint 오브젝트 유형에 확장 필터 적용 을 On 으로 설정하십시오.
지원되는 파일 유형 목록은 지원되는 파일 유형 을 참조하십시오.
-
크롤러가 사이트의 이미지에서 텍스트를 추출하도록 하려면 추가 처리 설정을 펼치고 OCR (Optical Character Recognition) 적용 을
On
로 설정하십시오.OCR이 사용 가능하고 문서에 이미지가 포함되어 있으면 처리 시간이 더 오래 걸립니다. 자세한 정보는 OCR(Optical Character Recognition) 을 참조하십시오.
-
** 완료**를 누르십시오.
콜렉션이 빠르게 작성됩니다. 콜렉션에 추가될 때 데이터를 처리하는 데 더 많은 시간이 소요됩니다.
진행상태를 확인하려면 활동 페이지로 이동하십시오. 탐색 분할창에서 콜렉션 관리를 클릭한 후 클릭하여 콜렉션을 여십시오.
현재 나중에 OAuth 설정과 연관된 사용자 계정을 변경할 수 없으며 커넥터가 사용하도록 구성된 기존 사용자 계정의 세부사항도 변경할 수 없습니다. 예를 들어, SharePoint에서 비밀번호 변경 후 연결을 설정하는 데 사용된 비밀번호를 업데이트할 수 없습니다.
샘플 액세스 제어 목록 정보
다음 화면 캡처는 액세스 제어 목록을 포함할 때 문서에 저장되는 ACL 정보의 유형을 보여줍니다.
