此文件適用於 IBM Watson® Knowledge Studio on IBM Cloud®。 若要查看舊版 Knowledge Studio on IBM Marketplace 的文件,請按一下此鏈結。
預先註釋文件
本指導教學協助您瞭解如何預先註釋文件,這可引導人工註釋的註釋程序。
學習目標
在完成本指導教學之後,您將知道如何使用機器學習模型來預先註釋文件。
完成本指導教學大約需要 5 分鐘。 如果您要探索與本指導教學相關的其他概念,將需要更多時間才能完成。
開始之前
- 您使用受支援的瀏覽器。 如需相關資訊,請參閱瀏覽器需求。
- 您已順利完成開始使用 Knowledge Studio,其中介紹建立工作區、建立類型系統,以及新增字典。
- 您已順利完成建立機器學習模型。
- 您必須至少有一個使用者 ID 為「管理者」或「專案經理」角色。 如需使用者角色的相關資訊,請參閱 Knowledge Studio 中的使用者角色。
結果
在完成本指導教學之後,您將會有一組局部註釋的文件。 然後,您可以將這些文件指派給註釋人員,以完成註釋工作。
課程 1:使用機器學習模型預先註釋新文件
在本課程中,您將學習如何使用機器學習模型在 Knowledge Studio 中預先註釋文件。
關於此作業
訓練機器學習模型之後,您可使用此模型來預先註釋您新增至語料庫的新文件。
請不要對已由人工註釋但尚未新增至基準的文件,執行預先註釋程式。 如果這樣做,將會刪除文件中的所有現行註釋。
在本指導教學中,您可以使用 documents-ml.csv
檔案來新增第二組文件。 請不要再次新增 documents-new.csv
檔案,因為此新增會導致基準中出現重複文件。 重複會造成下列問題:
- 如果每一個文件上的註釋不符,它們會降低機器學習模型的品質。
- 如果每一個文件上的註釋相符,它們會根據重複的檔案過度訓練機器學習模型。
如需預先註釋文件的相關資訊,請參閱引導註釋。 您也可以閱讀其他預先註釋方法。
程序
-
以管理者身分登入 Knowledge Studio。
-
將更多文件上傳至工作區。 您可以使用
documents-ml.csv
檔案。如需將文件新增至工作區的相關資訊,請參閱新增註釋的文件。
-
建立一個使用
documents-ml.csv
檔案作為基礎集的註釋集,並將它指派給自己(管理者)。在完成下列步驟來預先註釋新文件之後,您可以檢視註釋集,以查看機器學習模型如何註釋文件。 一般而言,您可以將註釋集指派給一個以上註釋人員。 如需建立及指派註釋集的相關資訊,請參閱新增註釋的文件。
-
若要預先註釋新文件,請執行下列動作:
- 在機器學習模型 > 預先註釋頁面上,按一下執行預先註釋程式。
- 選取機器學習模型,然後按下一步。
- 選取您已新增至語料庫的文件集 (
documents-ml.csv
),然後按一下執行。
-
在預先註釋完成之後,建立一個人工註釋作業,包括您已建立的註釋集。
如需建立註釋作業的相關資訊,請參閱註釋設定。
-
若要檢視機器學習模型套用至新文件的註釋,請開啟註釋作業。
因為已使用機器學習模型預先註釋新文件,所以人工註釋需要較少的時間。 如需透過註釋人員新增註釋的相關資訊,請參閱註釋文件。
結果
使用您的機器學習模型來預先註釋新文件集,您可以加快那些文件的人工註釋作業。