다음 대상에 대한 교육 모델 InstructLab
생성된 데이터로 모델을 학습시킨 다음 모델을 테스트하여 결과를 확인합니다. 교육이 무엇인지 자세히 알아보세요.
미세 조정을 위해 구성 정보나 파일을 모델에 전달할 수 없습니다.
전제조건
- 분류 체계를 준비하세요
- Object Storage 버킷에 분류(
tar.gz)를 추가합니다. CLI 또는 UI를 사용할 수 있습니다. - 분류 체계에서 데이터를 생성합니다.
콘솔을 사용하여 모델 정렬하기
-
InstructLab 프로젝트 페이지에서 프로젝트 > 정렬된 모델 > 정렬을 클릭합니다.
-
모델의 영숫자 이름을 입력하고 사용할 학습 데이터를 선택합니다.
-
선택 사항입니다: 정렬 프로세스를 시작하기 전에 제공된 예상 비용을 검토합니다.
-
정렬을 클릭합니다. 상태는 '
queued, 'running입니다. 상태가 'completed'이 될 때까지 기다립니다. 이 과정은 몇 분 또는 몇 시간이 걸릴 수 있습니다. 정렬이 완료되면 Object Storage 버킷에 문제 해결을 위한 로그가 포함된trained_models디렉터리가 만들어집니다.
CLI를 사용한 모델 학습
-
사용할 데이터의 ID를 가져옵니다.
ibmcloud ilab data list -
명령을 실행하여 생성된 데이터로 모델 학습을 시작합니다. ID를 기록해 두세요.
ibmcloud ilab model train --name testmodel --data-id <data_id> -
데이터 생성에 대한 세부 정보를 확인하세요. 모델의 ID를 포함합니다. 상태는 '
queued, 'running입니다. 상태가 'completed'이 될 때까지 기다립니다. 이 과정은 몇 분 또는 몇 시간이 걸릴 수 있습니다. 상태가completed인 경우 Object Storage 버킷에 문제 해결을 위한 로그가 포함된trained_models디렉터리가 만들어집니다.ibmcloud ilab model get --id <model_id> -
선택 사항: 상태가 다음과 같은 경우
completed토큰 추정치 등의 측정 항목을 검토하여 예상 비용을 계산할 수 있습니다.'
--output json' 옵션이 있는 'model get명령 예시.ibmcloud ilab model get --id daef9836-631f-4686-ad18-e0e6a0910f5d --output jsonJSON 출력 예시
{ "base_model": "granite-3.1-8b-starter-v2.1", "created_at": "2026-02-18T16:06:05.000Z", "data_id": "8b1433c0-e375-4b00-b36d-2ad00697014e", "id": "daef9836-631f-4686-ad18-e0e6a0910f5d", "last_signal_at": "2026-02-18T17:20:32.000Z", "model_metrics": { "mmlu": { "overall_average": 0.51, "scores": { "mmlu_abstract_algebra": 0.3, "mmlu_anatomy": 0.43, "mmlu_astronomy": 0.49 } }, "mt_bench": { "error_rate": 0.01, "overall_average": 6.86, "scores": { "turn_one": 7.25, "turn_two": 6.47 } }, "mt_bench_branch": { "error_rate": 0.01, "improvements": { "compositional_skills/STEM/math/time_series/qna.yaml": 8.67, "compositional_skills/extraction/invoice/csv/qna.yaml": 8.4 }, "no_change": { "compositional_skills/roleplay/explain_like_i_am/primary_schooler/qna.yaml": 0, "compositional_skills/writing/freeform/technical/proposal/qna.yaml": 0 }, "regressions": { "compositional_skills/extraction/inference/qualitative/sentiment/qna.yaml": -9, "compositional_skills/extraction/information/named_entities/places/qna.yaml": -9 } }, "tokens": { "training_phases": {} } }, "name": "test", "state": "completed", "status": "completed", "taxonomy_id": "e62ccea5-97e6-4568-86bf-2f359987b115" }
API를 이용한 훈련 모델
-
사용할 데이터의 ID를 가져옵니다.
명령 예.
curl -X 'GET' \ 'https://us-east.instructlab.ibm.com/v1/data' \ -H 'accept: application/json'출력 예.
{ "data": [ { "id": "add785e6-a8c3-4f5f-ab89-c506a3f115da", "name": "example-data-1", "state": "", "status": "queued", "created_at": "2024-10-23T02:58:50.000Z", "taxonomy_id": "202a03c4-dcf1-432a-82b7-abecb2e019f7", "last_signal_at": "2026-02-18T17:20:32.000Z" } ] } -
명령을 실행하여 생성된 데이터로 모델 학습을 시작합니다. ID를 기록해 두세요.
명령 예.
curl -X 'POST' \ 'https://us-east.instructlab.ibm.com/v1/models' \ -H 'accept: application/json' \ -H 'Content-Type: application/json' \ -d '{ "name": "example-model-1", "data_id": "add785e6-a8c3-4f5f-ab89-c506a3f115da" }'출력 예.
{ "id": "baa8cfb5-e306-4e15-869d-735b74b1919d", "name": "example-model-1", "state": "", "status": "queued", "created_at": "2024-10-23T02:58:50.000Z", "last_signal_at": "2026-02-18T17:20:32.000Z", "data_id": "add785e6-a8c3-4f5f-ab89-c506a3f115da", "base_model": "granite-7b", "taxonomy_id": "202a03c4-dcf1-432a-82b7-abecb2e019f7", "model_metrics": { "mmlu": { "overall_average": 0.3, "scores": { "additionalProp1": 1, "additionalProp2": 2, "additionalProp3": 3 } }, "mmlu_branch": { "error_rate": 0.4, "improvements": { "additionalProp1": 1, "additionalProp2": 2, "additionalProp3": 3 }, "regressions": { "additionalProp1": 1, "additionalProp2": 2, "additionalProp3": 3 }, "no_change": { "additionalProp1": 1, "additionalProp2": 2, "additionalProp3": 3 } }, "mt_bench": { "overall_average": 0.8, "error_rate": 0.6, "scores": { "additionalProp1": 1, "additionalProp2": 2, "additionalProp3": 3 } }, "mt_bench_branch": { "error_rate": 0.4, "improvements": { "additionalProp1": 1, "additionalProp2": 2, "additionalProp3": 3 }, "regressions": { "additionalProp1": 1, "additionalProp2": 2, "additionalProp3": 3 }, "no_change": { "additionalProp1": 1, "additionalProp2": 2, "additionalProp3": 3 } } } } -
데이터 생성에 대한 세부 정보를 확인하세요. 모델의 ID를 포함합니다. 상태는 '
queued, 'running입니다. 상태가 'completed'이 될 때까지 기다립니다. 이 과정은 몇 분 또는 몇 시간이 걸릴 수 있습니다.명령 예.
curl -X 'GET' \ 'https://us-east.instructlab.ibm.com/v1/models/baa8cfb5-e306-4e15-869d-735b74b1919d' \ -H 'accept: application/json'출력 예.
{ "id": "baa8cfb5-e306-4e15-869d-735b74b1919d", "name": "example-model-1", "state": "", "status": "queued", "created_at": "2024-10-23T02:58:50.000Z", "last_signal_at": "2026-02-18T17:20:32.000Z", "data_id": "add785e6-a8c3-4f5f-ab89-c506a3f115da", "base_model": "granite-7b", "taxonomy_id": "202a03c4-dcf1-432a-82b7-abecb2e019f7", "model_metrics": { "mmlu": { "overall_average": 0.3, "scores": { "additionalProp1": 1, "additionalProp2": 2, "additionalProp3": 3 } }, "mmlu_branch": { "error_rate": 0.4, "improvements": { "additionalProp1": 1, "additionalProp2": 2, "additionalProp3": 3 }, "regressions": { "additionalProp1": 1, "additionalProp2": 2, "additionalProp3": 3 }, "no_change": { "additionalProp1": 1, "additionalProp3": 3, "additionalProp2": 2 } }, "mt_bench": { "overall_average": 0.8, "error_rate": 0.6, "scores": { "additionalProp1": 1, "additionalProp2": 2, "additionalProp3": 3 } }, "mt_bench_branch": { "error_rate": 0.4, "improvements": { "additionalProp1": 1, "additionalProp2": 2, "additionalProp3": 3 }, "regressions": { "additionalProp1": 1, "additionalProp2": 2, "additionalProp3": 3 }, "no_change": { "additionalProp1": 1, "additionalProp2": 2, "additionalProp3": 3 } } } }
상태가 completed 인 경우 Object Storage 버킷에 문제 해결을 위한 로그가 포함된 trained_models 디렉터리가 만들어집니다.
교육 후 Object Storage 버킷에는 무엇이 있나요?
모델을 학습한 후 Object Storage 버킷에는 다음 파일이 포함된 trained models 디렉터리가 포함됩니다.
Artifacts- 이 파일에는 1단계 및 2단계 체크포인트 데이터와 각 시대별 모델이 포함되어 있습니다.
Eval- 이 파일에는 '
mmlu, 'mmlu_branch' , 'mt_bench' 및 'mt_bench_branch' 벤치마크에 대한 평가 지표가 포함되어 있습니다. Logs- 이 파일에는 Red Hat AI InstructLab 실행 로그와 시스템 세부 정보가 포함되어 있습니다.
Model- 이 파일에는 '
safetensors' 형식의 최종 출력 모델이 포함되어 있습니다. 이 디렉토리의 콘텐츠는 모델에서 사용됩니다.
다음에 수행할 작업
선택 사항: 모델을 배포할 수 있습니다.