IBM Cloud Docs
Confronto tra piattaforme e modelli di distribuzione

Confronto tra piattaforme e modelli di distribuzione

Questo argomento contiene le due tabelle seguenti che illustrano le caratteristiche e le capacità principali dei diversi modelli e piattaforme di distribuzione dei dati.

SaaS rispetto alla distribuzione On-Prem

SaaS rispetto alla distribuzione On-Prem
Area caratteristica SaaS (Nuvola) On-Prem
Distribuzione e aggiornamenti IBM-gestito, con aggiornamenti automatici e scalabilità. Installazione, aggiornamenti e scalabilità manuali autogestiti.
Milvus Supporto È disponibile il servizio completo Milvus (non solo Milvus ). Per le esigenze di ricerca vettoriale leggera è supportato anche Lite Milvus. Il servizio completo Milvus può essere aggiunto manualmente. Lite Milvus non è supportato.
Alta disponibilità e ripristino di emergenza (HADR) Funzionalità HA e DR integrate gestite da IBM. Richiede un'impostazione manuale per HA e DR; è supportato il backup dei metadati.
Servizio di accesso ai dati (DAS) Supportato Supportato (in Tech Preview dalla versione 2.2.x ).
OpenTelemetry Supporto
Integrazioni di governance (ad esempio, watsonx.governance ) Perfetta integrazione nativa con i servizi di governance di IBM. È possibile, ma richiede la configurazione manuale e l'impostazione della compatibilità.
Sicurezza e IAM IAM gestito attraverso i servizi di IBM Cloud Identity con accesso basato sui ruoli. Dipende dall'autenticazione locale (ad esempio, LDAP, AD); è necessaria una configurazione IAM personalizzata. Pieno controllo su dati, crittografia, firewall e rete; allineamento con le politiche di sicurezza interne.
Scalabilità delle risorse Elastico, gestito automaticamente da IBM. Scalabilità manuale tramite operazioni di amministrazione e gestione delle risorse.
Regioni di disponibilità del servizio Limitato alle regioni supportate da IBM Cloud. Disponibile ovunque il cliente si trovi ad implementare on-premise.
Motore di interrogazione - Presto Disponibile; necessita di approvvigionamento. IBM gestisce la distribuzione e la scalabilità. Disponibile; necessita di approvvigionamento. Il cliente gestisce la distribuzione e la scalabilità.
Supporto Spark (Ingestione) Disponibile in versione out-of-the-box; viene utilizzato per l'ingestione e la gestione delle tabelle. Richiede il provisioning e la configurazione. Disponibile in versione out-of-the-box; viene utilizzato per l'ingestione e la gestione delle tabelle. Richiede il provisioning e la configurazione.
Archiviazione Utilizza il servizio IBM Cloud Object Storage (COS)- S3-compatible fornito automaticamente da IBM. Si paga per lo storage con scalabilità flessibile. Utilizza lo storage persistente fornito dal cliente tramite Red Hat OpenShift, in genere Ceph, IBM Storage Ceph o Storage Foundation, configurato dal cliente.
Formato di archiviazione Supporta sia i COS interni (forniti automaticamente) sia un'ampia gamma di archivi di oggetti/file esterni, tra cui IBM COS, Amazon S3, MinIO, HDFS, Google Cloud Storage, Azure Data Lake, Apache Ozone, NFS, e così via. Stesso ampio supporto di SaaS—built-in ed esterno: IBM COS, S3, Ceph, MinIO, HDFS, Ozone, ADS, Storage Scale, Portworx, NFS, e così via.
Origini dati Supporta un'ampia serie di connettori, tra cui servizi IBM Cloud (COS, Db2, Cloud Databases ), RDBMS di terze parti ( MySQL, PostgreSQL, SQL Server, Oracle ), NoSQL ( Cassandra, MongoDB ), cloud storage ( S3, GCS, Azure ), file (FTP, HTTP, Box, Dropbox ), Milvus, Elasticsearch, e così via. Un insieme praticamente identico supportato su OpenShift/Pak—covering quegli stessi IBM servizi, database relazionali e NoSQL archivi cloud, connettori di file, Milvus e così via.
Connettori JDBC personalizzati Non supportato Supportato dal Gestore dell'infrastruttura
Caveau e depositi segreti Non disponibile Supportato
Autenticazione Kerberos Non supportato Supportato per i connettori
Integrazione
dbt (Strumento di creazione dati) Supportati: dbt- watsonx-presto per SQL/ Presto, dbt per motore Spark (trasformazioni in-place). Supportato: dbt- watsonx-presto funziona anche per Presto on-prem; il motore Spark supporta anche dbt.
IBM Knowledge Catalog (IKC) Integrazione nativa per la governance delle viste/tabelle SQL su Presto /Spark. La stessa integrazione della governance si applica alle implementazioni on-prem utilizzando IKC.
Apache Ranger Supporto dei criteri per Presto (C++) e Spark tramite il plugin Ranger. Supportato anche on-prem quando Ranger è disponibile nell'ambiente.
Banda dati Supportato per il monitoraggio di Spark oltre Spark UI. Disponibile anche per pipeline Spark on-premise.
Birdwatcher Strumento di debug per il servizio Milvus incluso. Disponibile per On-Prem.
DataStage e Data Virtualization Integrazione con IBM DataStage e Data Virtualization su Cloud Pak for Data (CPD). Completamente disponibile in installazione on-premise attraverso l'integrazione con Cloud Pak.
Integrazione degli strumenti di BI Supporta Superset, Tableau, Power BI, Cognos, e così via attraverso gli endpoint pubblici JDBC / ODBC. Sono supportati gli stessi strumenti; dipende dalla configurazione della rete locale e dalle regole del firewall.
Integrazione del lignaggio Manta Supportato; integrazione integrata con la visualizzazione in Manta UI. Supportato; richiede una configurazione manuale per l'integrazione con Manta.
Hub prodotto dati Disponibile come servizio gestito nel cloud. Gli utenti possono pubblicare, governare, scoprire e consumare "prodotti di dati" creati all'interno di IBM watsonx.data. Data Product Hub si integra perfettamente con la versione cloud per la gestione del ciclo di vita e la catalogazione. È completamente supportato anche come software on-premises. Data Product Hub può essere distribuito in un ambiente OpenShift/Cloud Pak for Data insieme a IBM watsonx.data. Tutte le funzionalità come il ciclo di vita dei prodotti di dati, i metadati, la governance e la ricerca sono disponibili in modo nativo.
Estensibilità e BYOL BYOL (Bring Your Own License) limitato nel modello gestito. Piena flessibilità BYOL: integrate qualsiasi strumento o motore compatibile.
Utilizzo in aria/ fuori linea Non supportato; richiede l'accesso a Internet per essere utilizzato. Completamente supportato; adatto per ambienti con tenuta d'aria, altamente regolamentati o disconnessi.
Fatturazione e licenze Prezzi in abbonamento (per utilizzo o per utente) Licenza aziendale tradizionale + costo dell'infrastruttura

Confronto tra piattaforme: AstraDB e watsonx.data

Confronto tra piattaforme: AstraDB e watsonx.data
Categoria AstraDB watsonx.data Impresa watsonx.data Enterprise con funzionalità premium
Architettura di base Architettura serverless Cassandra Elaborazione e archiviazione separate Funzionalità di autoscaling Distribuzione multi-cloud Architettura open data lakehouse Apache Iceberg e Hive metastore Opzioni di implementazione ibride Data lake + warehouse benefici watsonx.data integrazione watsonx.data intelligence L'esperienza watsonx.data premium fa parte della piattaforma IBM watsonx. Molteplici esperienze integrate sulla piattaforma IBM watsonx condividono servizi e spazi di lavoro. Un'esperienza fornisce un accesso mirato agli strumenti per compiti specifici. La piattaforma IBM watsonx comprende le seguenti esperienze integrate: IBM watsonx.data intelligence IBM watsonx.data integrazione IBM watsonx.ai IBM watsonx BI
Gestione dati Database vettoriali e non vettoriali Distribuzione di database multiregionali Schemi flessibili e strutturati DevOps API per automatizzare le operazioni Funzionalità di caricamento massivo Backup, ripristino e clonazione del database automatizzati Piano di controllo unificato Singolo punto di accesso ai dati Supporto per l'elaborazione batch, lo streaming e la replica dei dati Archiviazione degli oggetti a basso costo
Motori di interrogazione API, CLI, driver Data API (API basata su documenti) client Cassandra Compatibilità con il linguaggio di interrogazione (CQL) HTTP accesso Presto ( Java e C++) Apache Spark Milvus IBM Db2 Warehouse e Netezza integrazione Più di 35 connettori di database supportati Data virtualization Supporto per formati di tabella aperti, tra cui Apache Iceberg
Funzionalità AI e vettoriali Ricerca vettoriale per AI RAG e ML Embeddings Ricerca ibrida con BM25 e modelli di reranking Ricerca in linguaggio naturale AI generativa ottimizzata Ampia integrazione dell'ecosistema Stretta integrazione con Langflow Milvus database vettoriale RAG e ML embeddings Scoperta di dati alimentata dall'AI
I migliori casi d'uso Autoscaling delle applicazioni IA e dei carichi di lavoro di apprendimento automatico mediante ricerca vettoriale Modelli di utilizzo variabili Iniziative di analisi aziendale e IA Iniziative di analisi aziendale e di intelligenza artificiale con dati strutturati e non strutturati, nonché requisiti di governance e integrazione dei dati.