この文書は、IBM Watson® Knowledge Studio 上の IBM Cloud® に関するものです。以前のバージョンの Knowledge Studio on IBM Marketplace 向けの資料を参照するには、このリンクをクリックしてください。

機械学習モデルのトレーニング

IBM Watson® Knowledge Studio における機械学習モデルの作成には、機械学習モデルのトレーニングと、テスト・データおよびブラインド・データに対してアノテーションを付けたときのモデルのパフォーマンス評価が含まれます。

機械学習モデルの作成

機械学習モデルを作成するときは、モデルのトレーニングに使用する文書セットを選択し、トレーニング・データ、テスト・データ、およびブラインド・データとして使用する文書のパーセンテージを指定します。

このタスクについて

パフォーマンス・メトリックを検討することで、モデルの精度を高めるための方法を識別できます。

制限: Knowledge Studio インスタンスごとに一度にトレーニングできる機械学習モデルは 3 つに制限されます。インスタンスに複数のワークスペースが含まれており、他のワークスペース内でトレーニング中の機械学習モデルの数が既に合計で 3 つある場合、ワークスペース内で機械学習モデルをトレーニングする要求は、他のトレーニング・プロセスが完了するまでキューに入れられます。

手順

機械学習モデルを作成するには、以下のようにします。

Knowledge Studio 管理者としてログインし、ワークスペースを選択します。
「機械学習モデル」 > **「パフォーマンス」**を選択します。
すべての文書セットが承認済みであること、およびすべてのアノテーションの競合が判定によって解決済みであることを確認してください。判定または承認によってグランドトゥルースになった文書のみをモデルのトレーニングに使用できます。
**「トレーニングと評価 (Train and evaluate)」**をクリックします。
オプション: システム・レベルのトレーニング・セット、テスト・セット、またはブラインド・セットで使用する文書を文書セットから割り振る方法を指定するには、**「設定の編集 (Edit settings)」**をクリックします。

適用する比率について詳しくは、文書セット管理を参照してください。
「Train」 をクリックしてモデルをトレーニングするか、「Train & Evaluate」 をクリックしてモデルをトレーニングし、機械学習モデルによって追加されたアノテーションを評価して、パフォーマンス統計を分析します。

機械学習モデルのトレーニングには、人間によるアノテーションの数と、すべての文書にわたる単語の総数に応じて、数分から数時間かかる可能性があります。
モデルのトレーニングに使用する文書セットを選択します。

文書セットには、アノテーションが付けられた、少なくとも 10 個の文書が含まれている必要があります。
モデルが作成されたら、以下のいずれかのアクションを選択します。

オプション	説明
ログ	ログ・ファイルを表示して、問題が発生したかどうかを確認します。
詳細	アノテーションのパフォーマンス統計を表示し、モデルのトレーニングとテストに

          使用する文書セットを変更し、モデル成果物のスナップショット・バージョンを
          作成します。 |

| エクスポート | 標準プランまたはプレミアム・プランを使用している場合は、WatsonExplorerなどの機械学習ランタイム環境でモデルを実行するために必要なコンポーネントが含まれているローカル・システムに、ZIPファイルをエクスポートできます。 |

モデルによって追加されたアノテーションの評価

ヒューマン・アノテーターによって追加されたアノテーションのグランドトゥルース・ビューを、モデルによって追加されたアノテーションと比較できます。

手順

モデルによって追加されたアノテーションを評価するには、以下のようにします。

「機械学習モデル (Machine Learning Model)」>「パフォーマンス (Performance)」>**「トレーニングと評価 (Train and evaluate)」**を選択します。「トレーニング/テスト/ブラインド・セット (Training/Test/Blind Sets)」ページが表示されます。
トレーニング・セットまたはテスト・セットの**「グランドトゥルースの表示 (View Ground Truth)」**をクリックして、事前アノテーションおよびヒューマン・アノテーターによって追加されたアノテーションを表示します。グランドトゥルース・エディターが開きます。個々の文書をクリックして開き、メンション、関係、および同一指示されたメンションにどのようにアノテーションが付けられたかを確認します。
**「パフォーマンス (Performance)」ページで、「デコード結果の表示 (View Decoding Results)」**をクリックして、テスト・セット内の文書に機械学習モデルが追加したアノテーションを表示します。このボタンは、モデルを評価して初めて使用可能になります。結果を表示することにより、機械学習モデルがテスト・データ内のメンション、関係、および同一指示されたメンションにどの程度正しくラベルを付けることができたかを確認できます。
トレーニング・データ・セット、テスト・データ・セット、およびブラインド・データ・セットの間で文書を分割する方法を変更する場合は、「パフォーマンス (Performance)」 > 「トレーニングと評価 (Train and evaluate)」 > **「設定の編集 (Edit settings)」**をクリックします。例えば、初期の結果が受け入れ可能と思われる場合は、機械学習モデルの結果をさらにテストするために、テスト・セット内の文書の数を増やすことができます。異なる目的に応じて文書を自動的に分割する比率を変更したり、トレーニング・データ、テスト・データ、およびブラインド・データとして使用する特定の文書セットを選択したりできます。
変更を加えた場合は、**「Train_train & Evaluate」**をクリックしてモデルをリトレーニングし、アノテーションを再評価してください。

機械学習モデルの削除

機械学習モデルは削除できません。

モデルを開発するために使用したワークスペースは削除できますが、モデル自体を削除することはできません。モデルの削除は最良の方法ではありません。代わりに、モデルのトレーニングに使用される成果物を更新または置換してください。モデルが期待どおりの結果を生成していない場合でも、モデルの改良を続行できます。新規バージョンを作成するたび、モデルは新たに構築されます。辞書やタイプ・システムなどの成果物を編集し、次のバージョンをトレーニングするときは、別のアノテーション・セットを使用するように選択できます。