다음 대상에 대한 교육 모델 InstructLab

생성된 데이터로 모델을 학습시킨 다음 모델을 테스트하여 결과를 확인합니다. 교육이 무엇인지 자세히 알아보세요.

미세 조정을 위해 구성 정보나 파일을 모델에 전달할 수 없습니다.

전제조건

분류 체계를 준비하세요
Object Storage 버킷에 분류( tar.gz )를 추가합니다. CLI 또는 UI를 사용할 수 있습니다.
분류 체계에서 데이터를 생성합니다.

콘솔을 사용하여 모델 정렬하기

InstructLab 프로젝트 페이지에서 프로젝트 > 정렬된 모델 > 정렬을 클릭합니다.
모델의 영숫자 이름을 입력하고 사용할 학습 데이터를 선택합니다.
선택 사항입니다: 정렬 프로세스를 시작하기 전에 제공된 예상 비용을 검토합니다.
정렬을 클릭합니다. 상태는 ' queued, ' running 입니다. 상태가 ' completed'이 될 때까지 기다립니다. 이 과정은 몇 분 또는 몇 시간이 걸릴 수 있습니다. 정렬이 완료되면 Object Storage 버킷에 문제 해결을 위한 로그가 포함된 trained_models 디렉터리가 만들어집니다.

CLI를 사용한 모델 학습

사용할 데이터의 ID를 가져옵니다.
```
ibmcloud ilab data list
```
명령을 실행하여 생성된 데이터로 모델 학습을 시작합니다. ID를 기록해 두세요.
```
ibmcloud ilab model train --name testmodel --data-id <data_id>
```
데이터 생성에 대한 세부 정보를 확인하세요. 모델의 ID를 포함합니다. 상태는 ' queued, ' running 입니다. 상태가 ' completed'이 될 때까지 기다립니다. 이 과정은 몇 분 또는 몇 시간이 걸릴 수 있습니다. 상태가 completed 인 경우 Object Storage 버킷에 문제 해결을 위한 로그가 포함된 trained_models 디렉터리가 만들어집니다.
```
ibmcloud ilab model get --id <model_id>
```

선택 사항: 상태가 다음과 같은 경우 completed 토큰 추정치 등의 측정 항목을 검토하여 예상 비용을 계산할 수 있습니다.

' --output json ' 옵션이 있는 ' model get 명령 예시.

ibmcloud ilab model get --id daef9836-631f-4686-ad18-e0e6a0910f5d --output json

JSON 출력 예시

{
  "base_model": "granite-3.1-8b-starter-v2.1",
  "created_at": "2026-02-18T16:06:05.000Z",
  "data_id": "8b1433c0-e375-4b00-b36d-2ad00697014e",
  "id": "daef9836-631f-4686-ad18-e0e6a0910f5d",
  "last_signal_at": "2026-02-18T17:20:32.000Z",
  "model_metrics": {
    "mmlu": {
      "overall_average": 0.51,
      "scores": {
        "mmlu_abstract_algebra": 0.3,
        "mmlu_anatomy": 0.43,
        "mmlu_astronomy": 0.49
      }
    },
    "mt_bench": {
      "error_rate": 0.01,
      "overall_average": 6.86,
      "scores": {
        "turn_one": 7.25,
        "turn_two": 6.47
      }
    },
    "mt_bench_branch": {
      "error_rate": 0.01,
      "improvements": {
        "compositional_skills/STEM/math/time_series/qna.yaml": 8.67,
        "compositional_skills/extraction/invoice/csv/qna.yaml": 8.4
      },
      "no_change": {
        "compositional_skills/roleplay/explain_like_i_am/primary_schooler/qna.yaml": 0,
        "compositional_skills/writing/freeform/technical/proposal/qna.yaml": 0
      },
      "regressions": {
        "compositional_skills/extraction/inference/qualitative/sentiment/qna.yaml": -9,
        "compositional_skills/extraction/information/named_entities/places/qna.yaml": -9
      }
    },
    "tokens": {
      "training_phases": {}
    }
  },
  "name": "test",
  "state": "completed",
  "status": "completed",
  "taxonomy_id": "e62ccea5-97e6-4568-86bf-2f359987b115"
}

API를 이용한 훈련 모델

사용할 데이터의 ID를 가져옵니다.

명령 예.

curl -X 'GET' \
  'https://us-east.instructlab.ibm.com/v1/data' \
  -H 'accept: application/json'

출력 예.

{
  "data": [
    {
      "id": "add785e6-a8c3-4f5f-ab89-c506a3f115da",
      "name": "example-data-1",
      "state": "",
      "status": "queued",
      "created_at": "2024-10-23T02:58:50.000Z",
      "taxonomy_id": "202a03c4-dcf1-432a-82b7-abecb2e019f7",
      "last_signal_at": "2026-02-18T17:20:32.000Z"
    }
  ]
}

명령을 실행하여 생성된 데이터로 모델 학습을 시작합니다. ID를 기록해 두세요.

명령 예.

curl -X 'POST' \
  'https://us-east.instructlab.ibm.com/v1/models' \
  -H 'accept: application/json' \
  -H 'Content-Type: application/json' \
  -d '{
  "name": "example-model-1",
  "data_id": "add785e6-a8c3-4f5f-ab89-c506a3f115da"
}'

출력 예.

{
  "id": "baa8cfb5-e306-4e15-869d-735b74b1919d",
  "name": "example-model-1",
  "state": "",
  "status": "queued",
  "created_at": "2024-10-23T02:58:50.000Z",
  "last_signal_at": "2026-02-18T17:20:32.000Z",
  "data_id": "add785e6-a8c3-4f5f-ab89-c506a3f115da",
  "base_model": "granite-7b",
  "taxonomy_id": "202a03c4-dcf1-432a-82b7-abecb2e019f7",
  "model_metrics": {
    "mmlu": {
      "overall_average": 0.3,
      "scores": {
        "additionalProp1": 1,
        "additionalProp2": 2,
        "additionalProp3": 3
      }
    },
    "mmlu_branch": {
      "error_rate": 0.4,
      "improvements": {
        "additionalProp1": 1,
        "additionalProp2": 2,
        "additionalProp3": 3
      },
      "regressions": {
        "additionalProp1": 1,
        "additionalProp2": 2,
        "additionalProp3": 3
      },
      "no_change": {
        "additionalProp1": 1,
        "additionalProp2": 2,
        "additionalProp3": 3
      }
    },
    "mt_bench": {
      "overall_average": 0.8,
      "error_rate": 0.6,
      "scores": {
        "additionalProp1": 1,
        "additionalProp2": 2,
        "additionalProp3": 3
      }
    },
    "mt_bench_branch": {
      "error_rate": 0.4,
      "improvements": {
        "additionalProp1": 1,
        "additionalProp2": 2,
        "additionalProp3": 3
      },
      "regressions": {
        "additionalProp1": 1,
        "additionalProp2": 2,
        "additionalProp3": 3
      },
      "no_change": {
        "additionalProp1": 1,
        "additionalProp2": 2,
        "additionalProp3": 3
      }
    }
  }
}

데이터 생성에 대한 세부 정보를 확인하세요. 모델의 ID를 포함합니다. 상태는 ' queued, ' running 입니다. 상태가 ' completed'이 될 때까지 기다립니다. 이 과정은 몇 분 또는 몇 시간이 걸릴 수 있습니다.

명령 예.

curl -X 'GET' \
  'https://us-east.instructlab.ibm.com/v1/models/baa8cfb5-e306-4e15-869d-735b74b1919d' \
  -H 'accept: application/json'

출력 예.

{
  "id": "baa8cfb5-e306-4e15-869d-735b74b1919d",
  "name": "example-model-1",
  "state": "",
  "status": "queued",
  "created_at": "2024-10-23T02:58:50.000Z",
  "last_signal_at": "2026-02-18T17:20:32.000Z",
  "data_id": "add785e6-a8c3-4f5f-ab89-c506a3f115da",
  "base_model": "granite-7b",
  "taxonomy_id": "202a03c4-dcf1-432a-82b7-abecb2e019f7",
  "model_metrics": {
    "mmlu": {
      "overall_average": 0.3,
      "scores": {
        "additionalProp1": 1,
        "additionalProp2": 2,
        "additionalProp3": 3
      }
    },
    "mmlu_branch": {
      "error_rate": 0.4,
      "improvements": {
        "additionalProp1": 1,
        "additionalProp2": 2,
        "additionalProp3": 3
      },
      "regressions": {
        "additionalProp1": 1,
        "additionalProp2": 2,
        "additionalProp3": 3
      },
      "no_change": {
        "additionalProp1": 1,
        "additionalProp3": 3,
        "additionalProp2": 2
      }
    },
    "mt_bench": {
      "overall_average": 0.8,
      "error_rate": 0.6,
      "scores": {
        "additionalProp1": 1,
        "additionalProp2": 2,
        "additionalProp3": 3
      }
    },
    "mt_bench_branch": {
      "error_rate": 0.4,
      "improvements": {
        "additionalProp1": 1,
        "additionalProp2": 2,
        "additionalProp3": 3
      },
      "regressions": {
        "additionalProp1": 1,
        "additionalProp2": 2,
        "additionalProp3": 3
      },
      "no_change": {
        "additionalProp1": 1,
        "additionalProp2": 2,
        "additionalProp3": 3
      }
    }
  }
}

상태가 completed 인 경우 Object Storage 버킷에 문제 해결을 위한 로그가 포함된 trained_models 디렉터리가 만들어집니다.

교육 후 Object Storage 버킷에는 무엇이 있나요?

모델을 학습한 후 Object Storage 버킷에는 다음 파일이 포함된 trained models 디렉터리가 포함됩니다.

Artifacts: 이 파일에는 1단계 및 2단계 체크포인트 데이터와 각 시대별 모델이 포함되어 있습니다.
Eval: 이 파일에는 ' mmlu, ' mmlu_branch' , ' mt_bench ' 및 ' mt_bench_branch ' 벤치마크에 대한 평가 지표가 포함되어 있습니다.
Logs: 이 파일에는 Red Hat AI InstructLab 실행 로그와 시스템 세부 정보가 포함되어 있습니다.
Model: 이 파일에는 ' safetensors ' 형식의 최종 출력 모델이 포함되어 있습니다. 이 디렉토리의 콘텐츠는 모델에서 사용됩니다.

다음에 수행할 작업

선택 사항: 모델을 배포할 수 있습니다.