IBM Cloud Docs
Comparaison des plateformes et des modèles de déploiement

Comparaison des plateformes et des modèles de déploiement

Cette rubrique présente les deux tableaux suivants qui décrivent les principales caractéristiques et capacités des différents modèles et plates-formes de déploiement de données.

SaaS comparaison entre les déploiements sur site et les déploiements sur site

SaaS comparaison entre les déploiements sur site et les déploiements sur site
Zone de fonction SaaS (Nuage) Sur site
Déploiement et mises à jour IBM-gérée, avec des mises à jour et des mises à l'échelle automatiques. Autogestion, installation manuelle, mises à jour et mise à l'échelle.
Milvus Soutien Un service complet Milvus est disponible (pas seulement un service allégé Milvus ). Lite Milvus est également pris en charge pour les recherches vectorielles légères. Le service complet Milvus peut être ajouté manuellement. Lite Milvus n'est pas pris en charge.
Haute disponibilité et reprise après sinistre (HADR) Fonctionnalités HA et DR intégrées gérées par IBM. Nécessite une configuration manuelle pour HA et DR; la sauvegarde des métadonnées est prise en charge.
Service d'accès aux données (DAS) Pris en charge Pris en charge (dans Tech Preview à partir de la version 2.2.x ).
OpenTelemetry Soutien Oui Oui
Intégrations de gouvernance (par exemple, watsonx.governance ) Intégration native transparente avec les services de gouvernance de IBM. Possible, mais nécessite une configuration manuelle et une mise en place de la compatibilité.
Sécurité et IAM IAM géré par les services IBM Cloud Identity avec un accès basé sur les rôles. Dépend de l'authentification locale (par exemple, LDAP, AD); une configuration IAM personnalisée est nécessaire. Contrôle total des données, du cryptage, du pare-feu et du réseau; alignement sur les politiques de sécurité internes.
mise à l'échelle de ressource Elastique, géré automatiquement par IBM. Mise à l'échelle manuelle via les opérations d'administration et la gestion des ressources.
Régions de disponibilité des services Limité aux régions soutenues par IBM Cloud. Disponible partout où le client déploie sur site.
Moteur de recherche - Presto Disponible; doit être approvisionné. IBM gère le déploiement et la mise à l'échelle. Disponible; doit être approvisionné. Le client gère le déploiement et la mise à l'échelle.
Support Spark (Ingestion) Disponible prêt à l'emploi; utilisé pour l'ingestion et la gestion des tables. Nécessite un provisionnement et une configuration. Disponible prêt à l'emploi; utilisé pour l'ingestion et la gestion des tables. Nécessite un provisionnement et une configuration.
Stockage Utilise IBM Cloud Object Storage (COS)- le service S3-compatible est automatiquement fourni par IBM. Vous payez pour le stockage avec une mise à l'échelle flexible. Utilise le stockage persistant fourni par le client via Red Hat OpenShift- généralement Ceph, IBM Storage Ceph, ou Storage Foundation, mis en place par le client.
Format de stockage Prend en charge à la fois le COS interne (provisionné automatiquement) et une large gamme de magasins d'objets/fichiers externes, y compris IBM COS, Amazon S3, MinIO, HDFS, Google Cloud Storage, Azure Data Lake, Apache Ozone, NFS, et ainsi de suite. Même support étendu que SaaS—built-in et externe : IBM COS, S3, Ceph, MinIO, HDFS, Ozone, ADS, Storage Scale, Portworx, NFS, etc.
Sources de données Prise en charge d'un large éventail de connecteurs, y compris les services IBM Cloud (COS, Db2, Cloud Databases ), les SGBDR tiers ( MySQL, PostgreSQL, SQL Server, Oracle ), NoSQL ( Cassandra, MongoDB ), le stockage en nuage ( S3, GCS, Azure ), les fichiers (FTP, HTTP, Box, Dropbox ), Milvus, Elasticsearch, et ainsi de suite. Un ensemble pratiquement identique est pris en charge sur OpenShift/Pak—covering ces mêmes services IBM, les bases de données relationnelles et NoSQL, les magasins en nuage, les connecteurs de fichiers, Milvus, et ainsi de suite.
Connecteurs JDBC personnalisés Pas de soutien Prise en charge par le gestionnaire d'infrastructure
Chambre forte et stockage secret Non disponible Pris en charge
Authentification Kerberos Non pris en charge Prise en charge des connecteurs
Intégration
dbt (Data Build Tool) Supporté : dbt- watsonx-presto pour SQL/ Presto, dbt pour Spark engine (in-place transforms). Prise en charge : dbt- watsonx-presto fonctionne également pour on-prem Presto; le moteur Spark prend également en charge dbt.
IBM Knowledge Catalog (IKC) Intégration native pour la gouvernance des vues/tables SQL à travers Presto /Spark. La même intégration de la gouvernance s'applique aux déploiements sur site utilisant IKC.
Apache Ranger Prise en charge des politiques pour Presto (C++) et Spark via le plugin Ranger. Également pris en charge sur site lorsque Ranger est disponible dans l'environnement.
Bande de données Prise en charge de la surveillance Spark au-delà de Spark UI. Disponible également pour les pipelines Spark sur site.
Observateur d'oiseaux Outil de débogage pour le service Milvus inclus. Disponible pour On-Prem.
DataStage et Data Virtualization Intégration avec IBM DataStage et Data Virtualization sur Cloud Pak for Data (CPD). Entièrement disponible dans une installation sur site grâce à l'intégration de Cloud Pak.
Intégration des outils de BI Prend en charge Superset, Tableau, Power BI, Cognos, et ainsi de suite par l'intermédiaire des points de terminaison publics JDBC / ODBC. Les mêmes outils sont pris en charge; cela dépend de la configuration du réseau local et des règles du pare-feu.
Intégration de la lignée Manta Prise en charge; intégration intégrée avec la visualisation dans l'interface utilisateur Manta. Pris en charge; nécessite une configuration manuelle pour l'intégration de Manta.
Concentrateur de produits de données Disponible en tant que service géré dans le nuage. Les utilisateurs peuvent publier, gérer, découvrir et consommer des "produits de données" créés sur IBM watsonx.data. Data Product Hub s'intègre de manière transparente à la version en nuage pour la gestion du cycle de vie et le catalogage. Il est également entièrement pris en charge en tant que logiciel sur site. Data Product Hub peut être déployé dans un environnement OpenShift/Cloud Pak for Data aux côtés de IBM watsonx.data. Toutes les fonctionnalités telles que le cycle de vie des produits de données, les métadonnées, la gouvernance et la recherche sont disponibles en mode natif.
Extensibilité et BYOL BYOL (Bring Your Own License) limité dans le modèle géré. Flexibilité totale du BYOL - intégration de tout outil ou moteur compatible.
Air-Gap/Offline Usage Non pris en charge; nécessite un accès à l'internet pour être utilisé. Entièrement pris en charge; convient aux environnements à air comprimé, hautement réglementés ou déconnectés.
Facturation et licences Tarification par abonnement (par utilisation ou par utilisateur) Licence d'entreprise traditionnelle + coût de l'infrastructure

Comparaison des plateformes : AstraDB versus watsonx.data

Comparaison des plateformes : AstraDB versus watsonx.data
Catégorie AstraDB watsonx.data Entreprise watsonx.data Entreprise avec fonctionnalités haut de gamme
Architecture de base Architecture sans serveur Cassandra Calcul et stockage séparés Capacités de mise à l'échelle automatique Déploiement multi-cloud Architecture ouverte de lac de données Apache Iceberg et Hive métastore Options de déploiement hybride Avantages du lac de données et de l'entrepôt watsonx.data intégration watsonx.data intelligence L'expérience watsonx.data premium fait partie de la plateforme IBM watsonx. De multiples expériences intégrées sur la plateforme IBM watsonx partagent des services et des espaces de travail. Une expérience permet d'accéder de manière ciblée aux outils nécessaires à la réalisation de tâches spécifiques. La plateforme IBM watsonx comprend les expériences intégrées suivantes : IBM watsonx.data intelligence IBM watsonx.data intégration IBM watsonx.ai IBM watsonx BI
gestion de données Bases de données vectorielles et non vectorielles Déploiement de bases de données multirégionales Schémas flexibles et structurés DevOps API pour automatiser les opérations Capacités de chargement en masse Sauvegarde, restauration et clonage de bases de données automatisés Plan de contrôle unifié Point d'accès unique aux données Prise en charge du traitement par lots, de la diffusion en continu et de la réplication des données Stockage d'objets à faible coût
Moteurs de recherche API, CLI, pilotes Clients Data API (Document-based API) Cassandra Compatibilité avec le langage de requête (CQL) HTTP accès Presto ( Java et C++) Apache Spark Milvus IBM Db2 Warehouse et Netezza intégration Plus de 35 connecteurs de base de données pris en charge Data virtualization Prise en charge des formats de table ouverts, notamment Apache Iceberg
Capacités de l'IA et du vecteur Recherche vectorielle pour AI RAG et ML Embeddings Recherche hybride utilisant BM25 et des modèles de reranking Recherche en langage naturel Optimisation de l'IA générative Large intégration de l'écosystème Intégration étroite avec Langflow Milvus base de données vectorielles RAG et ML embeddings découverte de données alimentée par l'IA
Les meilleurs cas d'utilisation Applications de mise à l'échelle automatique Charges de travail d'IA et d'apprentissage automatique à l'aide de la recherche vectorielle Modèles d'utilisation variables Initiatives en matière d'analyse d'entreprise et d'IA Les initiatives d'analyse d'entreprise et d'IA avec des données structurées et non structurées, ainsi que les exigences en matière de gouvernance et d'intégration des données.