데이터 분석 방법
컨텐츠 마이닝 애플리케이션의 도구를 사용하여 데이터를 분석하십시오.
다음과 같은 방법으로 데이터를 분석할 수 있습니다
분석 결과를 검토할 때 나중에 추가로 조사할 문서에 플래그를 지정할 수 있습니다. 자세한 정보는 문서 플래그 지정 을 참조하십시오.
중요한 통찰을 찾으면 보기의 스냅샷을 작성한 후 보고서에 추가하여 다른 사용자와 공유할 수 있습니다. 자세한 정보는 보고서 작성 을 참조하십시오.
분석 시작
문서 텍스트 및 문서에 저장된 어노테이션 또는 인리치먼트를 기반으로 콜렉션의 문서를 분석하려면 컨텐츠 마이닝 애플리케이션을 사용하십시오.
분석을 시작하려면 다음 단계를 완료하십시오
- 검색 용어를 입력하거나, 문서를 필터링할 패싯을 클릭하거나, 모든 문서를 리턴하려면 검색 필드를 공백으로 두십시오.
- 검색을 클릭합니다.
결과의 안내 모드 보기는 데이터를 추가로 분석하기 위해 수행할 수 있는 제안된 다음 단계를 표시합니다. 제안사항을 보지 않으려면 전문가 모드로 전환할 수 있습니다. 전문가 모드에서는 검색을 제출할 때마다 검색 결과를 나열하는 문서 보기가 리턴됩니다.
이 주제의 태스크는 안내 모드에서 애플리케이션을 사용하는 방법을 설명합니다.
관련 키워드 찾기
키워드 관련성을 분석하려면 다음 단계를 완료하십시오.
-
초기 검색 페이지에서 키워드 검색을 제출하여 문서를 필터링하십시오.
-
안내 모드의 검색 결과 페이지에서 원인 또는 특성 분석을 클릭하십시오.
특성 단어 분할창 뒤에 각 패싯 유형에 대한 관련성 정보가 있는 분할창이 표시됩니다.
caption-side=bottom" 각 관련성 분할창은 패싯 유형과 일치하는 문서에서 발생하는 키워드 목록을 표시합니다.
계수 열은 키워드를 포함하는 현재 결과 세트의 문서 수를 표시합니다. 관련성 열은 조회와 일치하는 다른 문서와 비교하여 빈도 수의 고유성 레벨을 표시합니다. 높은 관련성 값은 강도가 증가하는 색상의 음영으로 표시됩니다. 색상은 노란색에서 시작하여 주황색으로 증가한 후 빨간색으로 증가합니다.
경향 찾기
추세 분석을 사용하여 데이터의 추세를 찾을 수 있습니다. 예를 들어, 새 제품 릴리스가 고객 관심의 증가와 일치하는 것을 볼 수 있습니다. 또는 새로운 고객 관리 접근 방식에 따라 고객 만족도가 높아지고 있습니다.
추세 정보를 사용하려면 문서에 하나 이상의 날짜 필드가 있어야 합니다.
추세를 찾으려면 다음 단계를 완료하십시오
-
초기 검색 페이지에서 키워드를 입력하거나 숫자 값이 있는 패싯을 선택하여 문서를 필터링하십시오.
-
안내 모드 보기에 표시되는 제안된 다음 단계 목록에서 경향 및 이상 항목 찾기 를 클릭하십시오.
결과 막대 그래프는 시간 경과에 따라 검색 쿼리에서 지정한 용어 또는 패싯 값을 언급하는 문서 수를 표시합니다.
트렌드 시간 시리즈 차트는 히트 맵으로 표시됩니다. 각 셀 색상은 관련성의 레벨을 나타냅니다.
-
패싯을 클릭하여 보다 자세히 조사할 수 있습니다. 패싯은 막대 그래프로 표시됩니다.
* 막대 각 개별 막대 그래프는 증가 표시기를 표시하여 정규 분포에서 벗어나는 데이터의 추세를 강조표시합니다.
증가 표시기는 특정 날짜 또는 특정 시간 간격에서 패싯 값의 빈도가 예상 평균 빈도에서 벗어나는 정도를 측정합니다. 평균은 지난 시간 간격 빈도의 변경사항을 기반으로 계산됩니다.
시각화에서 개별 항목을 클릭하거나 커서를 클릭하고 끌어서 연속 항목을 선택할 수 있습니다.
순환 데이터는 컬렉션의 현재 시간대 설정에서 계산됩니다. 그래프에서 사용되는 시간대를 변경하려면 시간대 변경 을 참조하십시오.
순환 패턴에서 이상 항목 식별
주제 분석을 사용하여 데이터에 있는 계절별, 월별 또는 일일 패턴에서 이상 항목을 찾을 수 있습니다.
주제 정보를 사용하려면 문서에 하나 이상의 날짜 또는 시간 필드가 있어야 합니다.
주제 분석은 키워드의 빈도가 특정 기간의 예상 평균 빈도와 얼마나 차이가 있는지에 초점을 맞춥니다. 예상 평균은 동일한 기간에 다른 키워드에 대한 빈도 계수의 모든 평균을 사용합니다. 이 분석 방법은 주기적으로 발생하는 패턴을 식별하고 이러한 주기적 패턴에서 발생할 수 있는 예기치 않은 변경사항을 강조표시하는 데 유용합니다.
이상 징후를 찾기 위해 다음 단계를 완료하십시오
-
초기 검색 페이지에서 키워드를 입력하거나 숫자 값이 있는 패싯을 선택하여 문서를 필터링하십시오.
-
안내 모드의 검색 결과 페이지에서 원인 또는 특성 분석을 클릭하십시오.
-
패싯 분석 분할창에서 주제를 선택하십시오.
-
분석에 맞게 다음 값을 조정하십시오.
- 결과 수
- 날짜 패싯
- 시간 스케일
- 기간
-
대상 패싯 또는 서브패싯을 선택한 후 분석을 클릭하십시오.
결과 시계열 그래프는 시간 경과에 따른 키워드 멘션 빈도의 변경사항을 표시합니다.
분석 시계열 색상 코딩은 멘션 수가 예상 빈도에서 벗어날 때 강조표시하는 데 사용됩니다. 편차가 높을수록 색상이 더 강합니다. 노란색에서 주황색, 빨간색으로 표시됩니다. 평균은 동일한 기간에 있는 다른 키워드의 발생 빈도를 기반으로 계산됩니다.
순환 데이터는 컬렉션의 현재 시간대 설정에서 계산됩니다. 그래프에서 사용되는 시간대를 변경하려면 시간대 변경 을 참조하십시오.
중요한 용어 찾기
데이터 세트에서 특성 단어를 찾으십시오. 특성 단어 보기는 분석 중인 문서에서 자주 언급되는 용어를 표시하는 단어 클라우드입니다.
단어 클라우드에서 단어를 클릭하여 기존 조회에 추가하고 지정된 단어도 언급하는 문서만 포함하도록 현재 문서 세트를 필터링할 수 있습니다.
중요한 용어를 찾으려면 다음 단계를 완료하십시오
-
안내 모드의 검색 결과 페이지에서 원인 또는 특성 분석을 클릭하십시오.
특성 단어 보기가 표시됩니다.
단어 클라우드 다른 글꼴 색상은 단어를 서로 구별하는 데 도움이 되며 통계적 의미가 없습니다.
-
단어를 언급하는 문서만 포함하도록 문서 세트를 제한하려면 클라우드에서 단어를 클릭하십시오.
두 패싯 간의 관계 분석
쌍 분석을 사용하여 두 개의 패싯이 서로 관련되는 방식을 확인하십시오.
두 가지 측면을 비교하려면 다음 단계를 완료하십시오
-
패싯 분석 분할창에서 쌍을 선택하십시오.
-
목록에서 비교할 첫 번째 패싯을 찾으십시오. 패싯과 연관된 X축 또는 Y축 아이콘을 클릭하여 패싯 값을 2차원 그래프에 표시할 위치를 표시하십시오.
-
두 번째 패싯을 찾은 후 나머지 축 아이콘을 클릭하십시오. 예를 들어, 이전에 X축 아이콘을 선택한 경우 두 번째 패싯에 대해 Y축 아이콘을 선택하십시오.
두 패싯의 데이터가 그래프로 표시됩니다.
비교
그래프는 두 개의 숫자를 표시합니다. 첫 번째 숫자는 빈도 계수이고 두 번째 숫자는 관련성 값입니다. 빈도 계수는 문서에서 두 데이터 점이 함께 발견되는 횟수를 측정합니다. 관련성은 조회와 일치하는 다른 문서와 비교하여 빈도 수의 고유성 레벨을 측정합니다. 관련성이 2.0을 표시하는 경우 이는 두 데이터 점이 교차하는 횟수가 예상보다 2배더 큰 것을 의미합니다. 보다 심층적인 분석이 필요할 수 있는 이상 항목을 식별하는 데 도움을 주기 위해 높은 관련성 값이 노란색에서 주황색, 빨간색으로 농도가 증가하는 색상의 음영으로 표시됩니다.
여러 패싯 간의 관계 분석
연결 분석을 사용하여 여러 패싯이 서로 관련되는 방법을 확인하십시오.
둘 이상의 패싯을 비교하려면 다음 단계를 완료하십시오.
-
패싯 분석 분할창에서 연결을 선택하십시오.
-
먼저 다른 패싯과 비교할 루트 패싯을 선택하십시오.
-
목록에서 최대 4개의 패싯을 추가로 선택한 후 분석을 클릭하십시오.
쌍 분석은 첫 번째 패싯과 다른 각 패싯 사이에서 차례로 수행됩니다.
네트워크 결과 네트워크 그래프는 관련성이 높고 빈도가 높은 쌍만 표시합니다. 각 노드는 패싯 값을 나타냅니다. 노드 색상은 패싯 유형을 반영합니다. 노드 간의 실선 연결은 관련성이 높은 쌍을 식별합니다. 점선 연결은 높은 빈도 쌍을 식별합니다.
숫자 범위 변경
그래프의 스케일이 데이터에 대해 최적화되지 않은 경우 이를 변경할 수 있습니다. 예를 들어, 차량 속도를 도표화하기 위해 수천 단위가 아닌 수십 또는 20단위로 증가하는 범위가 필요할 수 있습니다.
패싯에 대한 그래프의 스케일을 변경하려면 다음 단계를 완료하십시오.
-
페이지 헤더에서 콜렉션 링크를 클릭하십시오.
-
콜렉션의 타일에서 옵션 목록 열기 및 닫기 아이콘을 클릭한 후 콜렉션 편집을 선택하십시오.
-
패싯 탭에서 숫자 범위를 변경할 패싯을 찾으십시오.
-
범위 필드에서 편집을 클릭하십시오.
-
JSON 오브젝트로 사용할 각 범위를 정의하십시오. 오브젝트를 추가하거나 제거하여 범위에 있는 데이터 점의 수를 변경할 수 있습니다.
예를 들어, 차량 속도의 범위를 식별하는 JSON 오브젝트는 다음과 같습니다.
[ { "query": "[1, 20)", "label": "1 - 19" }, { "query": "[20, 40)", "label": "20 - 39" }, { "query": "[40, 60)", "label": "40 - 59" }, { "query": "[60, 80)", "label": "60 - 79" }, { "query": "[80, 100000)", "label": "80+" } ]
-
적용을 클릭하십시오.
-
저장을 클릭한 다음 닫기를 클릭하십시오.
-
콜렉션 타일을 클릭하여 콜렉션으로 돌아가서 분석을 계속하십시오.
차량 속도의 숫자 범위가 변경되면 강조표시될 데이터의 관계 또는 이상 항목에 더 많은 기회가 발생합니다.

맵 시각화에 결과 표시
지리적 위치를 나타내는 패싯은 맵 시각화에 표시될 수 있습니다. 예를 들어, 미국 상태 패싯이 있는 콜렉션이 있는 경우 사용자가 맵에서 각 상태를 선택할 수 있도록 하는 시각화에서 상태별 데이터를 표시할 수 있습니다.

기본적으로 미국 맵을 사용할 수 있습니다. GeoJSON 형식으로 빌드된 사용자 정의 맵을 추가할 수 있습니다. 자세한 정보는 RFC7946의 내용을 참조하십시오.
정의한 맵을 사용하려면 다음 단계를 완료하여 맵 정의를 가져오십시오.
- 컨텐츠 마이닝 애플리케이션 홈 페이지의 페이지 헤더에 있는 이동 경로에서 콜렉션 을 클릭하십시오.
- 페이지 시작 부분의 설정 아이콘을 클릭합니다.
- 사용자 지정 리소스 관리를 클릭 합니다.
- 리소스 추가를 클릭하십시오.
- 리소스 이름을 입력한 다음, 다음을 클릭합니다.
- 맵 파일을 추가한 후 저장을 클릭하십시오.
추가한 맵을 패싯에 대한 시각화 옵션으로 사용 가능하게 하려면 패싯을 편집해야 합니다.
- 페이지 헤더의 이동 경로에서 홈 을 클릭하십시오.
- 콜렉션의 오버플로우 메뉴를 마우스 오른쪽 단추로 클릭한 후 콜렉션 편집 을 선택하십시오.
- 패싯 탭을 열고 맵 시각화를 연관시킬 패싯을 찾으십시오.
- 시각화 유형 값을 맵으로 변경한 후 자원 필드의 목록에서 추가한 맵을 선택하십시오.
- 저장을 클릭한 다음 닫기를 클릭하십시오.
관심있는 문서 플래그 지정
문서 플래그를 사용하여 분류, 내보내기 또는 추가 분석을 위해 문서 또는 문서 그룹에 사용자 지정 플래그를 할당합니다.
문서에 플래그를 지정하는 것은 나중에 추가로 검사할 문서를 강조표시하는 유용한 방법입니다.
문서에 플래그를 지정하기 전에 콜렉션에 대한 플래그를 작성해야 합니다. 자세한 정보는 문서 플래그 추가 를 참조하십시오.
플래그를 적용하려면 다음 단계를 완료하십시오
-
콜렉션의 분석 보기에서 특정 특성이 있는 문서 세트를 리턴하는 조회를 작성하십시오.
-
문서 보기에서 문서 플래그 아이콘을 클릭하십시오.
-
플래그를 선택하십시오.
-
모든 조회 결과 또는 선택된 문서에 플래그를 적용하도록 선택한 후 적용을 클릭할 수 있습니다.
콜렉션당 문서 플래그를 50번이상 설정할 수 없습니다. 개별적으로 선택하는 하나의 문서에 플래그를 지정하거나 조회에 플래그를 지정하여 많은 문서를 리턴할 수 있는 경우 각 조치는 플래그를 한 번 설정하는 것으로 계수됩니다.
플래그 지정된 문서 세트는 콜렉션이 업데이트될 때 동적으로 변경됩니다. 플래그가 지정된 문서 세트는 인덱스에 조회로 저장됩니다. 각 플래그에는 연관된 문서 세트를 표시하는 조회가 있습니다. 예를 들어, 문서 플래그를 작성하고 ice cream
이라는 용어를 검색하고 이 단어가 있는 모든 문서에 빨간색 플래그를 적용하면 ice cream
이 플래그를 표시하는 조회로 저장됩니다. 그런 다음,
용어 ' coffee
'를 검색하고 해당 단어가 포함된 모든 문서에 빨간색 플래그를 적용하면 내부 플래그 쿼리가 ' (ice cream) OR coffee
'로 변경됩니다. 따라서 coffee
라는 단어가 포함된 새 문서가 수집되면 빨간색 플래그가 해당 문서에 자동으로 적용됩니다.
플래그 지정된 문서 보기
플래그가 적용되는 문서를 보려면 다음 단계를 완료하십시오.
- 패싯 분석 패널에서 문서 플래그 패싯까지 아래로 스크롤하십시오.
- 패싯을 선택한 후 분석 을 클릭하여 문서 플래그 대시보드를 여십시오.
- 플래그 중 하나를 클릭하고 추가 분석을 클릭한 후 문서 표시를 클릭하십시오.
문서 플래그 조회에서 문서 플래그 제거
문서 플래그를 제거하려면 다음 단계를 완료하십시오
-
무엇을 분석하시겠습니까? 페이지에서 검색을 클릭하여 빈 쿼리를 제출하십시오.
비어 있는 조회는 콜렉션의 모든 문서를 리턴합니다.
-
문서 표시를 클릭하십시오.
-
툴바의 문서 플래그 아이콘 을 클릭하고, 문서 플래그의 체크박스를 지운 다음, 적용을 클릭합니다.
문서 플래그가 문서에서 제거됩니다.