Méthodes d'analyse des données
Utilisez les outils de l'application Content Mining pour analyser vos données.
Vous pouvez analyser vos données de la manière suivante :
- Rechercher des mots clés pertinents
- Rechercher des tendances
- Identifier les anomalies dans les modèles cycliques
- Rechercher des mots caractéristiques
- Analyser les relations
- Analyse des relations entre plusieurs facettes
Lorsque vous passez en revue les résultats de votre analyse, vous pouvez marquer les documents que vous souhaitez rechercher ultérieurement. Pour plus d'informations, voir Marquetage de documents.
Lorsque vous trouvez des informations importantes, vous pouvez prendre un instantané de la vue, puis l'ajouter à un rapport à partager avec les autres. Pour plus d'informations, voir Création d'un rapport.
Commencez votre analyse
Utilisez l'application d'exploration de contenu pour analyser les documents de votre collection en fonction du texte du document et des annotations ou enrichissements stockés dans les documents.
Pour commencer votre analyse, suivez les étapes suivantes :
- Entrez un terme de recherche, cliquez sur une facette avec laquelle filtrer les documents ou laissez la zone de recherche vide pour renvoyer tous vos documents.
- Cliquez sur Recherche.
La vue en mode guidé des résultats indique les prochaines étapes que vous pouvez suivre pour analyser davantage vos données. Si vous ne souhaitez pas voir de suggestions, vous pouvez passer en mode Expert. En mode Expert, la vue Documents qui répertorie les résultats de la recherche est renvoyée chaque fois que vous soumettez une recherche.
Les tâches de cette rubrique décrivent comment utiliser l'application en mode guidé.
Rechercher les mots clés appropriés
Pour analyser la pertinence des mots clés, procédez comme suit:
-
Dans la page de recherche initiale, soumettez une recherche par mot clé pour filtrer les documents.
-
Dans la page des résultats de la recherche en mode guidé, cliquez sur Analyser la cause ou les caractéristiques.
Après la sous-fenêtre des mots caractéristiques, une sous-fenêtre contenant des informations de pertinence pour chaque type de facette s'affiche.
de pertinence des Chaque panneau de pertinence affiche une liste des mots clés qui apparaissent dans les documents correspondant au type de facette.
La colonne Nombre indique le nombre de documents de l'ensemble de résultats en cours qui contiennent le mot clé. La colonne Relevancy affiche le niveau d'unicité du nombre de fréquences par rapport à d'autres documents correspondant à votre requête. Les valeurs de pertinence élevées sont affichées dans des nuances de couleur avec une intensité croissante. La couleur commence au jaune, puis augmente à l'orange, puis au rouge.
Rechercher des tendances
Utilisez l'analyse Tendances pour rechercher des tendances dans vos données. Par exemple, vous pouvez voir qu'une nouvelle édition de produit s'aligne avec une hausse dans l'intérêt du client. Ou qu'une nouvelle approche du service à la clientèle soit suivie d'une augmentation de la satisfaction de la clientèle.
Vos documents doivent contenir au moins une zone de date pour que les informations de tendance soient disponibles.
Pour trouver des tendances, suivez les étapes suivantes :
-
Dans la page de recherche initiale, entrez un mot clé ou sélectionnez une facette avec des valeurs numériques pour filtrer les documents.
-
Cliquez sur Rechercher des tendances et des anomalies dans la liste des étapes suivantes suggérées qui s'affiche dans la vue en mode guidé.
Le diagramme à barres qui en résulte indique le nombre de documents qui mentionnent le terme ou la valeur de facette que vous avez spécifié dans la requête de recherche dans le temps.
thermique des tendances des Le graphique de la série temporelle est affiché sous forme de carte thermique. Chaque couleur de cellule indique un niveau de pertinence.
-
Vous pouvez cliquer sur une facette pour l'examiner de plus près. La facette est affichée dans un diagramme à barres.
dans un Chaque diagramme à barres met en évidence les tendances de vos données qui s'écartent de la distribution normale en affichant des indicateurs d'augmentation.
Les indicateurs d'augmentation mesurent dans quelle mesure la fréquence d'une valeur de facette à une date spécifique ou dans un intervalle de temps particulier s'écarte de la fréquence moyenne attendue. La moyenne est calculée en fonction des changements dans les intervalles de temps passés.
Vous pouvez cliquer sur des éléments individuels dans une visualisation ou cliquer et faire glisser le curseur pour sélectionner des éléments contigus.
Les données cycliques sont calculées à partir du fuseau horaire actuel de votre collection. Si vous souhaitez modifier le fuseau horaire utilisé par le graphique, voir Modification du fuseau horaire.
Identifier les anomalies dans les modèles cycliques
Utilisez l'analyse Rubrique pour rechercher des anomalies dans les modèles saisonniers, mensuels ou même quotidiens présents dans vos données.
Vos documents doivent contenir au moins une zone de date ou d'heure pour que les informations de rubrique soient disponibles.
L'analyse de sujet se concentre sur la mesure dans laquelle la fréquence d'un mot clé s'écarte de la fréquence moyenne attendue sur une période spécifique. La moyenne attendue utilise toutes les moyennes des nombres de fréquences pour d'autres mots clés au cours de la même période. Cette méthode d'analyse est utile pour identifier les modèles qui se produisent de façon cyclique et met en évidence les changements inattendus qui peuvent se produire dans ces modèles cycliques.
Pour trouver des anomalies, suivez les étapes suivantes :
-
Dans la page de recherche initiale, entrez un mot clé ou sélectionnez une facette avec des valeurs numériques pour filtrer les documents.
-
Dans la page des résultats de la recherche en mode guidé, cliquez sur Analyser la cause ou les caractéristiques.
-
Dans le panneau Analyse de facette, sélectionnez Rubrique.
-
Ajustez les valeurs suivantes en fonction de votre analyse:
- Nombre de résultats
- Facette de date
- Echelle de temps
- Plage de dates
-
Choisissez une facette cible ou une sous-facette, puis cliquez sur Analyser.
Le graphique de série temporelle qui en résulte montre les changements dans la fréquence des mentions de mots clés dans le temps.
'été*Topic analysis time series Le codage par couleur est utilisé pour mettre en évidence lorsque le nombre de mentions s'écarte de la fréquence attendue. Plus la déviation est élevée, plus la couleur est intense, du jaune à l'orange en passant par le rouge. La moyenne est calculée en fonction de la fréquence d'occurrence d'autres mots clés dans la même période.
Les données cycliques sont calculées à partir du fuseau horaire actuel de votre collection. Si vous souhaitez modifier le fuseau horaire utilisé par le graphique, voir Modification du fuseau horaire.
Rechercher des termes significatifs
Recherchez des mots caractéristiques dans votre jeu de données. La vue des mots caractéristiques est un nuage de mots qui affiche les termes fréquemment mentionnés dans les documents que vous analysez.
Vous pouvez cliquer sur un mot du nuage de mots pour l'ajouter à la requête existante et filtrer le jeu de documents en cours pour inclure uniquement les documents qui mentionnent également le mot spécifié.
Pour trouver les termes significatifs, suivez les étapes suivantes :
-
Dans la page des résultats de la recherche en mode guidé, cliquez sur Analyser la cause ou les caractéristiques.
La vue des mots caractéristiques s'affiche.
{: caption="
Les différentes couleurs de police permettent de distinguer les mots les uns des autres ; ils n'ont pas de signification statistique.
-
Cliquez sur un mot dans le cloud pour limiter le jeu de documents à inclure uniquement les documents qui le mentionnent.
Analyser les relations entre deux facettes
Utilisez l'analyse Pairs pour voir comment deux facettes sont liées l'une à l'autre.
Pour comparer deux facettes, suivez les étapes suivantes :
-
Dans le panneau Analyse de facette, sélectionnez Paires.
-
Recherchez la première facette à comparer dans la liste. Cliquez sur l'icône de l'axe des X ou de l'axe des Y associée à la facette pour indiquer où vous souhaitez que les valeurs de facette soient affichées dans un graphique à deux dimensions.
-
Recherchez la deuxième facette, puis cliquez sur l'icône de l'axe restant. Par exemple, si vous avez précédemment sélectionné l'icône de l'axe des X, sélectionnez l'icône de l'axe des Y pour la deuxième facette.
Les données des deux facettes sont affichées dans un graphique.
{: caption="
Le graphique montre deux nombres. Le premier nombre est un effectif de fréquence et le second est une valeur de pertinence. Le nombre de fréquences mesure le nombre de fois où les deux points de données sont trouvés ensemble dans un document. La pertinence mesure le niveau d'unicité du nombre de fréquences par rapport aux autres documents qui correspondent à votre requête. Si la pertinence indique 2.0, cela signifie que le nombre de fois où les deux points de données se croisent est 2 fois plus grand que prévu. Pour vous aider à identifier les anomalies qui peuvent nécessiter une analyse plus approfondie, les valeurs de pertinence élevées sont affichées dans des nuances de couleur avec une intensité croissante, du jaune à l'orange au rouge.
Analyser les relations entre plusieurs facettes
Utilisez l'analyse Connexions pour voir comment plusieurs facettes sont liées les unes aux autres.
Pour comparer deux facettes ou plus, procédez comme suit:
-
Dans le panneau Analyse de facette, sélectionnez Connexions.
-
Sélectionnez d'abord la facette racine que vous souhaitez comparer à d'autres facettes.
-
Sélectionnez jusqu'à 4 facettes supplémentaires dans la liste, puis cliquez sur Analyser.
L'analyse des paires est effectuée entre la première facette et l'autre facette à son tour.
Facet network graph Le graphique de réseau qui en résulte n'affiche que des paires hautement pertinentes et à haute fréquence. Chaque noeud représente une valeur de facette. La couleur du noeud reflète le type de facette. Une connexion en trait plein entre les noeuds identifie des paires très pertinentes. Une connexion en pointillés identifie les paires à haute fréquence.
Modification des plages de nombres
Si l'échelle d'un graphique n'est pas optimisée pour vos données, vous pouvez la modifier. Par exemple, pour tracer les vitesses du véhicule, vous pouvez vouloir une plage qui s'incrémente de dizaines ou de vingt plutôt que de milliers.
Pour modifier l'échelle d'un graphique pour une facette, procédez comme suit:
-
Cliquez sur le lien Collections dans l'en-tête de la page.
-
Dans la vignette de votre collection, cliquez sur l'icône Ouvrir et fermer la liste des options, puis choisissez Editer la collection.
-
Dans l'onglet Facette, recherchez la facette pour laquelle vous souhaitez modifier la plage numérique.
-
Dans la zone Plage, cliquez sur Editer.
-
Définissez chaque plage que vous souhaitez utiliser en tant qu'objet JSON. Vous pouvez ajouter ou supprimer des objets pour modifier le nombre de points de données de la plage.
Par exemple, les objets JSON qui identifient les plages de vitesses du véhicule peuvent se présenter comme suit:
[ { "query": "[1, 20)", "label": "1 - 19" }, { "query": "[20, 40)", "label": "20 - 39" }, { "query": "[40, 60)", "label": "40 - 59" }, { "query": "[60, 80)", "label": "60 - 79" }, { "query": "[80, 100000)", "label": "80+" } ]
-
Cliquez sur Appliquer.
-
Cliquez sur Save, puis sur Close.
-
Cliquez sur la vignette de votre collection pour revenir à la collection et poursuivre votre analyse.
Les modifications apportées aux plages de numéros pour les vitesses des véhicules introduisent davantage de possibilités de relations ou d'anomalies dans les données à mettre en évidence.

Affichage des résultats dans une visualisation de carte
Les facettes qui représentent des emplacements géographiques peuvent être affichées dans une visualisation de carte. Par exemple, si vous disposez d'une collection avec une facette Etats américains, vous pouvez afficher des données par état à partir d'une visualisation qui permet aux utilisateurs de sélectionner chaque état à partir d'une carte.

Une carte US est disponible par défaut. Vous pouvez ajouter une mappe personnalisée qui est générée au format GeoJSON. Pour plus d'informations, voir RFC7946.
Pour utiliser une mappe que vous définissez, procédez comme suit pour importer la définition de mappe:
- Dans la page d'accueil de l'application Content Mining, cliquez sur Collections dans l'élément de navigation de l'en-tête de la page.
- Cliquez sur l'icône Paramètres au début de la page.
- Cliquez sur Gérer les ressources de personnalisation.
- Cliquez sur Ajouter des ressources.
- Nommez la ressource, puis cliquez sur Suivant.
- Ajoutez votre fichier carte, puis cliquez sur Sauvegarder.
Pour rendre la carte que vous avez ajoutée disponible en tant qu'option de visualisation pour une facette, vous devez éditer la facette.
- Cliquez sur Accueil dans l'élément de navigation de l'en-tête de la page.
- Cliquez avec le bouton droit de la souris sur le menu déroulant dynamique de votre collection, puis sélectionnez Editer la collection.
- Ouvrez l'onglet Facette, puis recherchez la facette à laquelle vous souhaitez associer la visualisation de carte.
- Remplacez la valeur Type de visualisation par Carte, puis sélectionnez la carte que vous avez ajoutée dans la liste de la zone Ressource.
- Cliquez sur Save, puis sur Close.
Marquer les documents qui vous intéressent
Les indicateurs de documents permettent d'attribuer un indicateur personnalisé à un document ou à un groupe de documents à des fins de classification, d'exportation ou d'analyse approfondie.
Le marquage de documents est un moyen utile de mettre en évidence les documents que vous souhaitez examiner ultérieurement.
Avant de pouvoir marquer des documents, vous devez créer des indicateurs pour votre collection. Pour plus d'informations, voir Ajouter des indicateurs de document.
Pour appliquer les drapeaux, suivez les étapes suivantes :
-
Dans la vue d'analyse de votre collection, créez une requête qui renvoie un ensemble de documents avec des caractéristiques spécifiques.
-
Dans la vue des documents, cliquez sur l'icône Indicateurs de document.
-
Sélectionnez un indicateur.
-
Vous pouvez choisir d'appliquer l'indicateur à tous les résultats de requête ou aux documents sélectionnés, puis cliquer sur Appliquer.
Vous ne pouvez pas définir un indicateur de document plus de 50 fois par collection. Que vous marquez un document que vous sélectionnez individuellement ou que vous marquez une requête, qui peut renvoyer de nombreux documents, chaque action compte comme la définition d'un indicateur une fois.
Un jeu de documents marqué change dynamiquement à mesure que la collection est mise à jour. Les jeux de documents auxquels des indicateurs ont été appliqués sont stockés en tant que requêtes dans l'index. Chaque indicateur comporte une requête
qui représente le jeu de documents auquel il est associé. Par exemple, après que vous avez créé l'indicateur de document, recherché le terme ice cream
et appliqué un indicateur rouge à tous les documents contenant ce mot, ice cream
est stocké en tant que requête représentant l'indicateur. Ensuite, si vous recherchez le terme coffee
et que vous appliquez le drapeau rouge à tous les documents contenant ce mot, la requête du drapeau interne devient (ice cream) OR coffee
.
Par conséquent, si de nouveaux documents contenant le mot coffee
sont ingérés, l'indicateur rouge est appliqué automatiquement à ces documents.
Affichage des documents marqués
Pour afficher les documents auxquels un indicateur est appliqué, procédez comme suit:
- Dans le panneau Analyse de facette, faites défiler l'écran jusqu'à la facette Indicateurs de document.
- Sélectionnez la facette, puis cliquez sur Analyser pour ouvrir le tableau de bord Indicateurs de document.
- Cliquez sur l'un des indicateurs, cliquez sur Analyser plus, puis sur Afficher les documents.
Retrait d'indicateurs de document d'une requête Document Flags
Pour supprimer un indicateur de document, procédez comme suit :
-
Dans la page Que voulez-vous analyser?, soumettez une requête vide en cliquant sur Rechercher.
La requête vide renvoie tous les documents de votre collection.
-
Cliquez sur Afficher les documents.
-
Cliquez sur l'icône Drapeaux de documents dans la barre d'outils, décochez la case du drapeau de document, puis cliquez sur Appliquer.
Les indicateurs de document sont retirés de vos documents.