Red Hat® AI InstructLab on IBM Cloud® è una soluzione di intelligenza artificiale generativa pronta per l'uso, privata e sicura, basata su Red Hat Enterprise Linux AI.
Introduzione a Red Hat AI InstructLab on IBM Cloud
Preparatevi a tuffarvi nell'IALa capacità di acquisire, elaborare, creare e applicare la conoscenza sotto forma di modello per fare previsioni, raccomandazioni o decisioni. con Red Hat® AI InstructLab on IBM Cloud®!
InstructLab è un progetto open source di IBM e Red Hat che vuole essere un punto di ingresso economico nel mondo dell'apprendimento automaticoUn ramo dell'intelligenza artificiale (AI) e dell'informatica che si concentra sull'uso di dati e algoritmi per imitare il modo in cui gli esseri umani imparano, migliorando gradualmente l'accuratezza dei modelli di AI.. È possibile utilizzare InstructLab per contribuire a un modello linguistico di grandi dimensioni senza dover possedere e gestire un'infrastruttura hardware.
Per saperne di più su InstructLab.
Che cos'è Red Hat AI InstructLab?
Per utilizzare InstructLab non è necessario avere conoscenze preesistenti. Non è necessario avere già un'idea di cosa creare. Cominciamo a familiarizzare con i concetti.
InstructLab è un progetto per migliorare i modelli linguistici di grandi dimensioni (LLM), che sono modelli di intelligenza artificiale che utilizzano tecniche di apprendimento automatico per generare il linguaggio umano. Si inizia fornendo le conoscenze e le competenze più importanti per l'azienda in una cosiddetta tassonomia, o directory di dati. La tassonomia viene utilizzata per generare dati sintetici, che vengono poi utilizzati per addestrare il modello attraverso diverse fasi di messa a punto. Questo processo allinea il vostro LLM ai vostri obiettivi, fornendo non solo conoscenze generali, ma le competenze e i contesti specifici più importanti per le vostre esigenze aziendali.
Per ulteriori informazioni, vedere Come funziona. In alternativa, potete iniziare a preparare e caricare la vostra prima tassonomia.
Configurare l'account IBM Cloud®
Prima di continuare, accertatevi di disporre di quanto segue.
-
Un conto Pay-As-You-Go o Subscription IBM Cloud®. Gli account di prova non sono supportati. Per ulteriori informazioni o per aggiornare il proprio account, vedere Tipi di account.
-
Facoltativo: se si usa un repo privato per archiviare i documenti di conoscenza della tassonomia, creare un'istanza Secrets Manager.
Facoltativo: Preparare una tassonomia
-
Utilizzate la tassonomia di IBM Cloud o createne una vostra.
-
Se non si ha già una tassonomia, si può creare un fork del repo delle tassonomie di IBM Cloud e clonarlo sulla propria macchina locale. Questa tassonomia ha la struttura di file corretta già creata per voi. È possibile aggiungere conoscenze e competenze nelle directory corrispondenti.
-
Per creare invece una propria tassonomia, vedere Preparazione delle tassonomie per maggiori informazioni.
Per creare la tassonomia si può anche utilizzare il notebook Jupyter della comunità IBM Cloud. Per ulteriori informazioni, consultare il repo redhat-ai-instructlab-jupyter-notebooks GitHub
-
-
Aggiornare la tassonomia. L'esempio seguente aggiunge le domande in rima alla directory linguistica.
a. Nel vostro fork, nella cartella
compositional_skills/linguistics, create un fileqna.yaml.b. Nel file
qna.yml, aggiungere una domanda relativa alle parole che fanno rima.- answer: 'Here are two rhyming words for "cave": 1\. Brave 2\. Gave' question: 'Give me two words that rhyme with cave'c. Se le aggiunte includono documenti di riferimento, come articoli web o file in Github, è possibile fare riferimento al repository pubblico GitHub e alla SHA di un file, come in questo esempio.
document: repo: https://github.com/<organization>/<repository> commit: <commit_sha> patterns: - <filename>.mdd. Salvare le modifiche e trasferirle alla forcella.
f. Opzionale: convalida la tassonomia aggiornata.
-
In un browser, apri la pagina Releases per il tuo repository Github. Ad esempio:
https://github.com/<my-org>/taxonomy/releases. -
Fare clic su Crea una release.
-
Creare un tag, selezionare un ramo di destinazione e inserire un nome per il rilascio.
-
Fare clic su Pubblica un comunicato.
-
Scaricate il file
tar.gzgenerato automaticamente dalla release facendo clic su Codice sorgente ( tar.gz ). -
Facoltativo: se si utilizza un repository privato per i documenti di conoscenza della tassonomia, completare i passaggi seguenti.
-
Seguire la documentazione di GitHub per creare un token di accesso personale classico (PAT).
-
Nella sezione di accesso al repository, si deve estendere il PAT al repository della tassonomia.
-
Nella sezione Autorizzazioni del repository, selezionare Contenuti >
read-onlye Metadati >read-only.
-
Caricare la tassonomia utilizzando la console
Completare i seguenti passaggi per memorizzare la tassonomia in Object Storage.
-
Dalla pagina Progetti, selezionare il progetto.
-
Fare clic su Tassonomie.
-
Fare clic su Upload e inserire i seguenti dati.
- File di tassonomia
- Selezionare il file
.tar.gz. - Nome della tassonomia
- Assegnare alla tassonomia un nome alfanumerico.
- Accesso al repository privato
-
- Attivare questa opzione se i documenti di conoscenza della tassonomia sono in un repo privato.
- Secrets Manager istanza di servizio: Selezionare un'istanza esistente o crearne una.
- Secrets Manager segreto: selezionare un segreto esistente o crearne uno. Se si sta creando un segreto, selezionare il tipo di segreto chiave-valore e aggiungere il token di accesso personale nel formato
seguente. Si noti che il valore di
github_urldeve contenerehttps://. URL è lo stesso URL utilizzato nella sezionerepodel documento di riferimento della tassonomia.
{ "github_url": "https://...", "github_pat": "xxxxx" }Per ulteriori informazioni, vedere Creazione di segreti chiave-valore.
- Storage cloud
- Selezionare un'istanza e un bucket Object Storage da utilizzare o creare un'istanza e un bucket.
- Autorizzazione del servizio
- Selezionate la casella per consentire a InstructLab di scrivere la vostra tassonomia su Object Storage
- Impostazioni di memorizzazione opzionali
- Specificare il percorso in cui si vuole memorizzare la tassonomia
tar.gzin Object Storage.
-
Fare clic su Carica
Aggiungere la tassonomia a Object Storage utilizzando la CLI
Completare i seguenti passaggi per memorizzare la tassonomia in Object Storage.
È possibile utilizzare il comando set per salvare i dettagli e le credenziali del bucket Object Storage e altro ancora. Questo può semplificare i vostri comandi in futuro. Si noti che quando si utilizza il comando set,
è necessario impostare ogni valore singolarmente. Per ulteriori informazioni, vedere la guida di riferimento al comando Config.
-
Accedere all'account IBM Cloud dalla CLI.
ibmcloud login -a https://cloud.ibm.com --sso -r us-east -
Se si intende consentire a InstructLab di creare risorse di istanza IBM Cloud® Object Storage per l'utente, è necessario puntare a un gruppo di risorse.
ibmcloud target -g <resource_group>Esempio:
ibmcloud target -g Default
-
Creare il criterio di autorizzazione per InstructLab e Object Storage.
ibmcloud iam authorization-policy-create Writer --source-service-name instructlab --target-service-name cloud-object-storage -
Facoltativo: se si utilizza un repo privato per archiviare i documenti di conoscenza della tassonomia, completare i passaggi seguenti.
-
Creare un'autorizzazione di servizio per consentire a InstructLab di accedere all'istanza Secrets Manager e ai segreti.
ibmcloud iam authorization-policy-create Reader --source-service-name instructlab --target-service-name secrets-manager -
Aggiungere il token di accesso personale (PAT) a Secrets Manager creando un segreto chiave-valore. Assicurarsi che i dettagli chiave-valore siano memorizzati nel seguente formato.
{ "github_url": "https://...", "github_pat": "xxxxx" }Esempio di comando per la creazione di un segreto chiave-valore.
ibmcloud secrets-manager secret-create --secret-prototype='{"name": "my-secret","description": "Description of my key-value secret.","secret_type": "kv","secret_group_id": "67d025e1-0248-418f-83ba-deb0ebfb9b4a","labels": ["dev","us-south"],"data": {"github_url": "https://...","github_pat": "xxxxx"},"custom_metadata": {"metadata_custom_key": "metadata_custom_value"},"version_custom_metadata": {"custom_version_key": "custom_version_value"}}'Per ulteriori informazioni, vedere Creazione di segreti chiave-valore.
-
Elencare le istanze di Secrets Manager.
ibmcloud resource service-instances --service-name secrets-manager -
Ottenere i dettagli dell'istanza.
ibmcloud resource service-instance INSTANCE
-
-
Eseguite il comando
taxonomy add --helped esaminate le opzioni del comando.ibmcloud ilab taxonomy add --help -
Opzionale Se si dispone di un'istanza Object Storage esistente che si desidera utilizzare, ottenere i dettagli dell'istanza del servizio.
- Elencare le istanze di Object Storage.
ibmcloud resource service-instances --service-name cloud-object-storage - Ottenere i dettagli dell'istanza.
ibmcloud resource service-instances INSTANCE
- Elencare le istanze di Object Storage.
-
Aggiungere la tassonomia al bucket Object Storage. Esaminate i seguenti esempi di comandi.
Avvio rapido Comando di esempio per creare automaticamente un'istanza e un bucket Object Storage nel proprio account e caricarvi una tassonomia dalla cartella
./taxonomy.ibmcloud ilab taxonomy add \ --name example-taxonomy-1 \ --taxonomy-path "./taxonomy"Esempio di comando per caricare una tassonomia da una cartella
taxonomysul proprio computer a un'istanza e a un bucket Object Storage esistenti.ibmcloud ilab taxonomy add \ --name example-taxonomy-name-1 \ --taxonomy-path-cos "taxonomies/taxonomy.tar.gz" \ --taxonomy-path "./taxonomy" \ --cos-bucket example-cloud-object-storage-bucket-1 \ --cos-endpoint https://s3.us-east.cloud-object-storage.appdomain.cloudEsempio di comando per utilizzare un'istanza e un bucket Object Storage esistenti e le credenziali Secrets Manager.
ibmcloud ilab taxonomy add \ --name example-taxonomy-1 \ --taxonomy-path-cos taxonomies/taxonomy.tar.gz \ --taxonomy-path "./taxonomy" \ --cos-endpoint https://s3.us-east.cloud-object-storage.appdomain.cloud \ --secrets-manager-git-id SEC-MGR-ID --secrets-manager-git-url https://URLEsempio di comando per caricare una tassonomia dalla cartella
/Users/USER/instructlab-taxonomya un nuovo bucket creato automaticamente.ibmcloud ilab taxonomy add \ --name test \ --taxonomy-path "/Users/USER/instructlab-taxonomy" \ --cos-endpoint https://s3.us-east.cloud-object-storage.appdomain.cloud \ --cos-id 628e4348-2183-42fa-a03a-6f0f78453530
Operazioni successive
Dopo aver caricato una tassonomia, il passo successivo è generare dati dalla tassonomia.