Installazione del componente aggiuntivo Red Hat OpenShift AI
Seguire i passaggi per installare il componente aggiuntivo AI ( OpenShift ) su un cluster esistente.
Vuoi distribuire l'operatore AI ( OpenShift ) su un nuovo cluster? Prova l'architettura distribuibile (OpenShift)AI su IBM Cloud.
Considerazioni
Prima di configurare il componente aggiuntivo, è necessario tenere conto delle seguenti considerazioni.
- Il cluster deve avere la versione 4.16 e successive.
- Il cluster deve avere almeno 2 nodi worker. Ogni nodo worker deve avere almeno 8vCPU e 32GB memoria.
- I nodi worker devono utilizzare il sistema operativo RHCOS.
- Per utilizzare tutte le funzionalità offerte da OpenShift AI, si consiglia almeno 1 GPU.
- Il cluster può avere un mix di nodi GPU e non GPU. Tuttavia, se si utilizza questa configurazione, assicurarsi di distribuire l'applicazione su un nodo GPU per sfruttarne le risorse.
Prima di iniziare
-
Facoltativo: se non ne avete già uno, create un VPC Public Gateway.
-
Se si desidera utilizzare gli operatori OpenShift Pipelines, Node Feature Discovery o NVIDIA GPU con il componente aggiuntivo OpenShift AI, è necessario disabilitare la protezione del traffico in uscita. Se non si desidera utilizzare questi operatori, saltare questo passaggio.
Disattivando la protezione del traffico in uscita, si possono consentire tutte le connessioni di rete esterne. Per ulteriori informazioni, vedere Gestione della protezione del traffico in uscita nei cluster VPC.
ibmcloud oc vpc outbound-traffic-protection disable --cluster CLUSTER
-
Abilitare OperatorHub sul cluster.
oc patch operatorhub cluster --type json -p '[{"op": "add", "path": "/spec/disableAllDefaultSources", "value": false}]'
Passo 1: Scegliere le opzioni di personalizzazione
È possibile migliorare i progetti di AI di Red Hat OpenShift specificando diverse opzioni da includere nell'installazione del componente aggiuntivo, come le pipeline di dati per la creazione di flussi di lavoro di apprendimento automatico portatili o gli strumenti per la gestione e la scalabilità delle risorse. È inoltre possibile personalizzare i criteri di aggiornamento e di eliminazione.
Eseguire il comando per elencare tutte le opzioni. Per la descrizione di ciascuna opzione disponibile, vedere OpenShift Opzioni di personalizzazione AI. Se non si include un'opzione specifica quando si installa il componente aggiuntivo, si applica il valore predefinito.
ibmcloud oc cluster addon options --addon openshift-ai
Fase 2: Esaminare gli operatori raccomandati
È possibile scegliere di installare anche operatori aggiuntivi consigliati per l'utilizzo di alcune funzioni di OpenShift AI. Se non sono già installati sul cluster, si può scegliere di includerli nell'installazione del componente aggiuntivo. In alternativa, è possibile installarli in qualsiasi momento utilizzando il sito OperatorHub o seguendo la procedura di installazione specifica per l'operatore. Per utilizzare questi operatori, è necessario disabilitare la protezione del traffico in uscita per il cluster.
L'utente è responsabile della gestione di questi operatori, compresi, ma non solo, l'aggiornamento, il monitoraggio, il ripristino e la reinstallazione.
Si consigliano i seguenti operatori.
Alcuni di questi operatori possono includere personalizzazioni aggiuntive che l'utente può scegliere di specificare quando installa il componente aggiuntivo. Esaminare l'elenco delle personalizzazioni disponibili per gli operatori consigliati.
Passo 3: installare il componente aggiuntivo nella CLI
Eseguire il comando per installare il componente aggiuntivo Red Hat OpenShift AI. Specificare le personalizzazioni con il formato --parameter PARAM=VALUE
.
Ad esempio, per includere l'opzione Data Science Pipelines, specificare --parameter oaiDataSciencePipelines=Managed
.
Per includere gli operatori consigliati quando si installa il componente aggiuntivo con la CLI, specificare le seguenti opzioni quando si esegue il comando di installazione.
- OpenShift Condotte:
--parameter pipelineEnabled=true
- Node Scoperta delle caratteristiche:
--parameter nfdEnabled=true
- NVIDIA Operatore GPU:
--parameter nvidiaEnabled=true
Comando di installazione.
ibmcloud oc cluster addon enable openshift-ai --cluster CLUSTER [-f] [--param PARAM] [-q] [--version VERSION]
Comando di esempio per installare il componente aggiuntivo con gli aggiornamenti automatici di minor e patch, Codeflare e Kserve abilitati.
ibmcloud oc cluster addon enable openshift-ai --cluster CLUSTER --param oaiInstallPlanApproval=Automatic --param oaiCodeflare=Managed --param oaiKserve=Managed
Fase 1: Esaminare gli operatori raccomandati
È possibile scegliere di installare anche operatori aggiuntivi consigliati per l'utilizzo di alcune funzioni di OpenShift AI. Se non sono già installati sul cluster, si può scegliere di includerli nell'installazione del componente aggiuntivo. In alternativa, è possibile installarli in qualsiasi momento utilizzando il sito OperatorHub o seguendo la procedura di installazione specifica per l'operatore. Per utilizzare questi operatori, è necessario disabilitare la protezione del traffico in uscita per il cluster.
L'utente è responsabile della gestione di questi operatori, compresi, ma non solo, l'aggiornamento, il monitoraggio, il ripristino e la reinstallazione.
Si consigliano i seguenti operatori.
Alcuni di questi operatori possono includere personalizzazioni aggiuntive che l'utente può scegliere di specificare quando installa il componente aggiuntivo. Esaminare l'elenco delle personalizzazioni disponibili per gli operatori consigliati.
Passo 2: installare il componente aggiuntivo nell'interfaccia utente
Installare il componente aggiuntivo Red Hat OpenShift AI con l'interfaccia utente.
-
Vai alla pagina del cluster e clicca sul cluster pertinente.
-
Nella pagina dei dettagli del cluster, si trova la sezione Componenti aggiuntivi. Individuare l'opzione Red Hat OpenShift AI e fare clic su Installa.
-
Nella sezione Capacità, esaminare la descrizione delle opzioni di personalizzazione dei componenti aggiuntivi disponibili e abilitare le opzioni che si desidera includere nell'installazione.
-
Nella sezione Operatori aggiuntivi consigliati, fare clic per espandere ciascun operatore e selezionare le opzioni di personalizzazione che si desidera includere. Questi operatori aggiuntivi e queste personalizzazioni sono consigliati per alcune funzioni di Red Hat OpenShift AI. È possibile scegliere di installare queste opzioni in un secondo momento utilizzando il sito OperatorHub o seguendo i passaggi di installazione specifici per l'operatore.
L'utente è responsabile della gestione di questi operatori, compresi, ma non solo, l'aggiornamento, il monitoraggio, il ripristino e la reinstallazione.
-
Fai clic su Install.
OpenShift Opzioni di personalizzazione dell'intelligenza artificiale
Esaminare le opzioni di personalizzazione disponibili per il componente aggiuntivo OpenShift AI.
Per includere un'opzione quando si installa il componente aggiuntivo OpenShift AI con la CLI, includere l'opzione con il formato --parameter PARAM=VALUE
quando si esegue il programma ibmcloud oc cluster addon enable openshift-ai
. Ad esempio, per installare il componente aggiuntivo con l'opzione Data Science Pipelines, specificare --parameter oaiDataSciencePipelines=Managed
.
Per includere un'opzione quando si installa il componente aggiuntivo OpenShift AI con l'interfaccia utente, fare clic su per abilitare l'opzione quando richiesto.
Personalizzazione | Parametro CLI | Descrizione | Valori CLI | Valore predefinito |
---|---|---|---|---|
OpenShift Politica di approvazione dell'IA | oaiInstallPlanApproval |
Applicare aggiornamenti minori e patch automaticamente o manualmente. | Automatic oppure Manual |
Automatic |
OpenShift Politica di cancellazione dell'IA | oaiDeletePolicy |
Conservare o eliminare gli operatori o i componenti installati dal componente aggiuntivo se questo viene rimosso. | Retain oppure Delete |
Retain |
Cruscotto Open Data Hub | oaiDashboard |
Abilita o disabilita il componente. Se abilitata, è gestita dalla piattaforma OpenShift AI. | Managed per abilitareRemoved per disabilitare |
Managed (abilitato) |
Kueue | oaiKueue |
Abilita o disabilita il componente. Se abilitata, è gestita dalla piattaforma OpenShift AI. | Managed per abilitareRemoved per disabilitare |
Managed (abilitato) |
Codeflare | oaiCodeflare |
Abilita o disabilita il componente. Se abilitata, è gestita dalla piattaforma OpenShift AI. | Managed per abilitareRemoved per disabilitare |
Managed (abilitato) |
ModelMesh Servire | oaiModelmeshserving |
Abilita o disabilita il componente. Se abilitata, è gestita dalla piattaforma OpenShift AI. | Managed per abilitareRemoved per disabilitare |
Managed (abilitato) |
Workbench | oaiWorkbenches |
Abilita o disabilita il componente. Se abilitata, è gestita dalla piattaforma OpenShift AI. | Managed per abilitareRemoved per disabilitare |
Managed (abilitato) |
Pipeline di scienza dei dati | oaiDataSciencePipelines |
Abilita o disabilita il componente. Se abilitata, è gestita dalla piattaforma OpenShift AI. | Managed per abilitareRemoved per disabilitare |
Managed (abilitato) |
KServe | oaiKserve |
Abilita o disabilita il componente. Se abilitata, è gestita dalla piattaforma OpenShift AI. | Managed per abilitareRemoved per disabilitare |
Managed (abilitato) |
Ray | oaiRay |
Abilita o disabilita il componente. Se abilitata, è gestita dalla piattaforma OpenShift AI. | Managed per abilitareRemoved per disabilitare |
Managed (abilitato) |
Personalizzazioni per gli operatori consigliati
Esaminare gli operatori consigliati e le personalizzazioni opzionali che si possono includere durante l'installazione.
Per includere una personalizzazione per un operatore quando si installa il componente aggiuntivo OpenShift AI con la CLI, includere l'opzione con
il formato --parameter PARAM=VALUE
quando si esegue il programma ibmcloud oc cluster addon enable openshift-ai
. Ad esempio, per includere la personalizzazione GPUDirect Storage NVIDIA per l'operatore NVIDIA, specificare
--parameter nvidiaGpuDirectStorageEnabled=true
.
Per includere una personalizzazione per un operatore quando si installa il componente aggiuntivo OpenShift AI con l'interfaccia utente, fare clic su per abilitare l'opzione quando richiesto.
Personalizzazione | Parametro CLI | Descrizione | Valori CLI | Valore predefinito |
---|---|---|---|---|
Politica di cancellazione dei NDF | nfdDeletePolicy |
Mantenere o eliminare l'operatore se il componente aggiuntivo OpenShift AI viene rimosso. | Retain oppure Delete |
Retain |
NVIDIA Politica di cancellazione | nvidiaDeletePolicy |
Mantenere o eliminare l'operatore se il componente aggiuntivo OpenShift AI viene rimosso. | Retain oppure Delete |
Retain |
NVIDIA Carichi di lavoro in Sandbox | nvidiaSandboxWorkloads |
Abilita la gestione di operandi aggiuntivi necessari per i carichi di lavoro sandbox. | true (abilitato)false (disabilitato) |
true (abilitato) |
NVIDIA Installazione del motore host DCGM | nvidiaDcgmEnabled |
Abilitare la distribuzione dell'hostengine NVIDIA DCGM come pod separato. | true (abilitato)false (disabilitato) |
true (abilitato) |
NVIDIA vGPU Direttore | nvidiaVgpuManagerEnabled |
Abilitare NVIDIA vGPU Manager. | true (abilitato)false (disabilitato) |
true (abilitato) |
NVIDIA Responsabile VFIO | nvidiaVfioManagerEnabled |
Abilitare VFIOManager per la configurazione della distribuzione di VFIO-PCI. | true (abilitato)false (disabilitato) |
true (abilitato) |
NVIDIA Node Stato Esportatore | nvidiaNodeStatusExporterEnabled |
Abilita l'esportatore di stato di Node. | true (abilitato)false (disabilitato) |
true (abilitato) |
NVIDIA Plug-in per dispositivi Sandbox | nvidiaSandboxDevicePluginEnabled |
Abilitare il plugin del dispositivo NVIDIA Sandbox. | true (abilitato)false (disabilitato) |
true (abilitato) |
Gestore MIG NVIDA | nvidiaMigManagerEnabled |
Abilitare NVIDIA MIG Manager. | true (abilitato)false (disabilitato) |
true (abilitato) |
NVIDIA vGPU Gestione dispositivi | nvidiaVgpuDeviceManagerEnabled |
Abilitare NVIDIA vGPU Gestione dispositivi. | true (abilitato)false (disabilitato) |
true (abilitato) |
NVIDIA Conservazione diretta GPUD | nvidiaGpuDirectStorageEnabled |
Abilitare l'archiviazione GPUDirect. | true (abilitato)false (disabilitato) |
true (abilitato) |
NVIDIA Test CUDA | nvidiaCudaTest |
Abilitare i test CUDA di NVIDIA. | true (abilitato)false (disabilitato) |
false (disattivato) |
Politica di cancellazione dell'operatore del gasdotto | pipelineDeletePolicy |
Mantenere o eliminare l'operatore se il componente aggiuntivo OpenShift AI viene rimosso. | Retain oppure Delete |
Operazioni successive
- Vedere informazioni sulla gestione del componente aggiuntivo OpenShift AI.
- Assicuratevi di aver compreso il processo di aggiornamento del componente aggiuntivo OpenShift AI.