다음 대상에 대한 교육 모델 InstructLab

생성된 데이터로 모델을 학습시킨 다음 모델을 테스트하여 결과를 확인합니다. 교육이 무엇인지 자세히 알아보세요.

미세 조정을 위해 구성 정보나 파일을 모델에 전달할 수 없습니다.

전제조건

  1. 분류 체계를 준비하세요
  2. Object Storage 버킷에 분류( tar.gz )를 추가합니다. CLI 또는 UI를 사용할 수 있습니다.
  3. 분류 체계에서 데이터를 생성합니다.

콘솔을 사용하여 모델 정렬하기

  1. InstructLab 프로젝트 페이지에서 프로젝트 > 정렬된 모델 > 정렬을 클릭합니다.

  2. 모델의 영숫자 이름을 입력하고 사용할 학습 데이터를 선택합니다.

  3. 선택 사항입니다: 정렬 프로세스를 시작하기 전에 제공된 예상 비용을 검토합니다.

  4. 정렬을 클릭합니다. 상태는 ' queued, ' running 입니다. 상태가 ' completed'이 될 때까지 기다립니다. 이 과정은 몇 분 또는 몇 시간이 걸릴 수 있습니다. 정렬이 완료되면 Object Storage 버킷에 문제 해결을 위한 로그가 포함된 trained_models 디렉터리가 만들어집니다.

CLI를 사용한 모델 학습

  1. 사용할 데이터의 ID를 가져옵니다.

    ibmcloud ilab data list
    
  2. 명령을 실행하여 생성된 데이터로 모델 학습을 시작합니다. ID를 기록해 두세요.

    ibmcloud ilab model train --name testmodel --data-id <data_id>
    
  3. 데이터 생성에 대한 세부 정보를 확인하세요. 모델의 ID를 포함합니다. 상태는 ' queued, ' running 입니다. 상태가 ' completed'이 될 때까지 기다립니다. 이 과정은 몇 분 또는 몇 시간이 걸릴 수 있습니다. 상태가 completed 인 경우 Object Storage 버킷에 문제 해결을 위한 로그가 포함된 trained_models 디렉터리가 만들어집니다.

    ibmcloud ilab model get --id <model_id>
    
  4. 선택 사항: 상태가 다음과 같은 경우 completed 토큰 추정치 등의 측정 항목을 검토하여 예상 비용을 계산할 수 있습니다.

    ' --output json ' 옵션이 있는 ' model get 명령 예시.

    ibmcloud ilab model get --id daef9836-631f-4686-ad18-e0e6a0910f5d --output json
    

    JSON 출력 예시

    {
      "base_model": "granite-3.1-8b-starter-v2.1",
      "created_at": "2026-02-18T16:06:05.000Z",
      "data_id": "8b1433c0-e375-4b00-b36d-2ad00697014e",
      "id": "daef9836-631f-4686-ad18-e0e6a0910f5d",
      "last_signal_at": "2026-02-18T17:20:32.000Z",
      "model_metrics": {
        "mmlu": {
          "overall_average": 0.51,
          "scores": {
            "mmlu_abstract_algebra": 0.3,
            "mmlu_anatomy": 0.43,
            "mmlu_astronomy": 0.49
          }
        },
        "mt_bench": {
          "error_rate": 0.01,
          "overall_average": 6.86,
          "scores": {
            "turn_one": 7.25,
            "turn_two": 6.47
          }
        },
        "mt_bench_branch": {
          "error_rate": 0.01,
          "improvements": {
            "compositional_skills/STEM/math/time_series/qna.yaml": 8.67,
            "compositional_skills/extraction/invoice/csv/qna.yaml": 8.4
          },
          "no_change": {
            "compositional_skills/roleplay/explain_like_i_am/primary_schooler/qna.yaml": 0,
            "compositional_skills/writing/freeform/technical/proposal/qna.yaml": 0
          },
          "regressions": {
            "compositional_skills/extraction/inference/qualitative/sentiment/qna.yaml": -9,
            "compositional_skills/extraction/information/named_entities/places/qna.yaml": -9
          }
        },
        "tokens": {
          "training_phases": {}
        }
      },
      "name": "test",
      "state": "completed",
      "status": "completed",
      "taxonomy_id": "e62ccea5-97e6-4568-86bf-2f359987b115"
    }
    

API를 이용한 훈련 모델

  1. 사용할 데이터의 ID를 가져옵니다.

    명령 예.

    curl -X 'GET' \
      'https://us-east.instructlab.ibm.com/v1/data' \
      -H 'accept: application/json'
    

    출력 예.

    {
      "data": [
        {
          "id": "add785e6-a8c3-4f5f-ab89-c506a3f115da",
          "name": "example-data-1",
          "state": "",
          "status": "queued",
          "created_at": "2024-10-23T02:58:50.000Z",
          "taxonomy_id": "202a03c4-dcf1-432a-82b7-abecb2e019f7",
          "last_signal_at": "2026-02-18T17:20:32.000Z"
        }
      ]
    }
    
  2. 명령을 실행하여 생성된 데이터로 모델 학습을 시작합니다. ID를 기록해 두세요.

    명령 예.

    curl -X 'POST' \
      'https://us-east.instructlab.ibm.com/v1/models' \
      -H 'accept: application/json' \
      -H 'Content-Type: application/json' \
      -d '{
      "name": "example-model-1",
      "data_id": "add785e6-a8c3-4f5f-ab89-c506a3f115da"
    }'
    

    출력 예.

    {
      "id": "baa8cfb5-e306-4e15-869d-735b74b1919d",
      "name": "example-model-1",
      "state": "",
      "status": "queued",
      "created_at": "2024-10-23T02:58:50.000Z",
      "last_signal_at": "2026-02-18T17:20:32.000Z",
      "data_id": "add785e6-a8c3-4f5f-ab89-c506a3f115da",
      "base_model": "granite-7b",
      "taxonomy_id": "202a03c4-dcf1-432a-82b7-abecb2e019f7",
      "model_metrics": {
        "mmlu": {
          "overall_average": 0.3,
          "scores": {
            "additionalProp1": 1,
            "additionalProp2": 2,
            "additionalProp3": 3
          }
        },
        "mmlu_branch": {
          "error_rate": 0.4,
          "improvements": {
            "additionalProp1": 1,
            "additionalProp2": 2,
            "additionalProp3": 3
          },
          "regressions": {
            "additionalProp1": 1,
            "additionalProp2": 2,
            "additionalProp3": 3
          },
          "no_change": {
            "additionalProp1": 1,
            "additionalProp2": 2,
            "additionalProp3": 3
          }
        },
        "mt_bench": {
          "overall_average": 0.8,
          "error_rate": 0.6,
          "scores": {
            "additionalProp1": 1,
            "additionalProp2": 2,
            "additionalProp3": 3
          }
        },
        "mt_bench_branch": {
          "error_rate": 0.4,
          "improvements": {
            "additionalProp1": 1,
            "additionalProp2": 2,
            "additionalProp3": 3
          },
          "regressions": {
            "additionalProp1": 1,
            "additionalProp2": 2,
            "additionalProp3": 3
          },
          "no_change": {
            "additionalProp1": 1,
            "additionalProp2": 2,
            "additionalProp3": 3
          }
        }
      }
    }
    
  3. 데이터 생성에 대한 세부 정보를 확인하세요. 모델의 ID를 포함합니다. 상태는 ' queued, ' running 입니다. 상태가 ' completed'이 될 때까지 기다립니다. 이 과정은 몇 분 또는 몇 시간이 걸릴 수 있습니다.

    명령 예.

    curl -X 'GET' \
      'https://us-east.instructlab.ibm.com/v1/models/baa8cfb5-e306-4e15-869d-735b74b1919d' \
      -H 'accept: application/json'
    

    출력 예.

    {
      "id": "baa8cfb5-e306-4e15-869d-735b74b1919d",
      "name": "example-model-1",
      "state": "",
      "status": "queued",
      "created_at": "2024-10-23T02:58:50.000Z",
      "last_signal_at": "2026-02-18T17:20:32.000Z",
      "data_id": "add785e6-a8c3-4f5f-ab89-c506a3f115da",
      "base_model": "granite-7b",
      "taxonomy_id": "202a03c4-dcf1-432a-82b7-abecb2e019f7",
      "model_metrics": {
        "mmlu": {
          "overall_average": 0.3,
          "scores": {
            "additionalProp1": 1,
            "additionalProp2": 2,
            "additionalProp3": 3
          }
        },
        "mmlu_branch": {
          "error_rate": 0.4,
          "improvements": {
            "additionalProp1": 1,
            "additionalProp2": 2,
            "additionalProp3": 3
          },
          "regressions": {
            "additionalProp1": 1,
            "additionalProp2": 2,
            "additionalProp3": 3
          },
          "no_change": {
            "additionalProp1": 1,
            "additionalProp3": 3,
            "additionalProp2": 2
          }
        },
        "mt_bench": {
          "overall_average": 0.8,
          "error_rate": 0.6,
          "scores": {
            "additionalProp1": 1,
            "additionalProp2": 2,
            "additionalProp3": 3
          }
        },
        "mt_bench_branch": {
          "error_rate": 0.4,
          "improvements": {
            "additionalProp1": 1,
            "additionalProp2": 2,
            "additionalProp3": 3
          },
          "regressions": {
            "additionalProp1": 1,
            "additionalProp2": 2,
            "additionalProp3": 3
          },
          "no_change": {
            "additionalProp1": 1,
            "additionalProp2": 2,
            "additionalProp3": 3
          }
        }
      }
    }
    

상태가 completed 인 경우 Object Storage 버킷에 문제 해결을 위한 로그가 포함된 trained_models 디렉터리가 만들어집니다.

교육 후 Object Storage 버킷에는 무엇이 있나요?

모델을 학습한 후 Object Storage 버킷에는 다음 파일이 포함된 trained models 디렉터리가 포함됩니다.

Artifacts
이 파일에는 1단계 및 2단계 체크포인트 데이터와 각 시대별 모델이 포함되어 있습니다.
Eval
이 파일에는 ' mmlu, ' mmlu_branch' , ' mt_bench ' 및 ' mt_bench_branch ' 벤치마크에 대한 평가 지표가 포함되어 있습니다.
Logs
이 파일에는 Red Hat AI InstructLab 실행 로그와 시스템 세부 정보가 포함되어 있습니다.
Model
이 파일에는 ' safetensors ' 형식의 최종 출력 모델이 포함되어 있습니다. 이 디렉토리의 콘텐츠는 모델에서 사용됩니다.

다음에 수행할 작업

선택 사항: 모델을 배포할 수 있습니다.