Milvus サービスの追加
Milvusは、ディープニューラルネットワークやその他の機械学習(ML)モデルによって開発された膨大な埋め込みベクトルを保存、インデックス化、管理するベクトルデータベースである。 これは、類似性検索および AI アプリケーションの組み込みを強化するために開発されています。 Milvusは、非構造化データ検索をよりアクセスしやすくし、さまざまな環境間で一貫性を持たせます。
Milvus 2.4.xでは pymilvus
のバージョン 2.4.0 を推奨します。 以前のバージョンをアンインストールし、最新バージョンをインストールしてください pymilvus
。
IBM® watsonx.dataのサービスとして Milvusを追加するには、以下の手順に従ってください。
-
watsonx.data コンソールにログインします。
-
ナビゲーションメニューから、 Infrastructure Managerを選択します。
-
サービスを定義し接続するには、 Add component をクリックし、 Milvus を選択し、 Next をクリックします。
-
Add component - Milvus ウィンドウで、以下の詳細を入力します。
Milvus サービスの追加 フィールド 説明 表示名 画面に表示する Milvus サービス名を入力します。 サイズ 適切なサイズを選択する。 スターター:100万ベクトル、64個のインデックス・パラメーター、1024個のセグメント・サイズ、384次元を推奨。 小さい:1,000万ベクトル、64個のインデックス・パラメーター、1024個のセグメント・サイズ、384次元を推奨。 ミディアム:5,000万ベクトル、64個のインデックス・パラメーター、1024個のセグメント・サイズ、384次元を推奨。 Large:1億ベクトル、64個のインデックス・パラメータ、1024個のセグメント・サイズ、384次元を推奨。 カスタム: 最大 30億ベクトル、64インデックスパラメータ、1024セグメントまで推奨。 実際にサポートされるベクトル数と次元数は、インデックスの種類とサポートされる最大 vCPU 構成によって異なります。
- IVF_SQ8- 最大30億ベクトル。
- IVF_FLAT - 最大 1.3 億ベクトル。
- HNSW - 最大10億ベクトル。
ストレージバケットを追加 Small、Medium、Large サイズの外部ストレージを関連付けます。 Starter サイズでは、IBM 管理型ストレージを選択することもできます。 外部ストレージを関連付けるには、ストレージを設定する必要があります。 パス 外部ストレージの場合は、ベクトル化データファイルを保存するパスを指定します。 Milvus 現在、あらかじめ設定されたTシャツのサイズ(S、M、L)またはカスタムサイズの間で拡大縮小が可能になりました。 Milvus を縮小すると、より大きな容量から縮小する場合にパフォーマンスに影響を与える可能性があります。 縮小後、コレクションがメモリに収まらなくなった場合、サービスに影響が出る可能性があります。 サービスに影響がある場合は、コレクションを削除するか、スケールバックするしかありません。 サービスがクラッシュしない場合でも、以前はロードされていたが、現在では利用可能なメモリを超えているコレクションは問題が発生する可能性があります。
スケーリング操作により、5分から10分のサービス遅延が発生します。 スケーリングの移行中は、継続中の業務が中断される場合があります。
外部ストレージの追加の詳細については、ストレージとカタログのペアを追加するを参照してください。
コレクションのスキーマが変更された場合(コレクション内のフィールド数の増加や
varchar
フィールドが 256 文字を超える場合、または複数のベクトル フィールドがコレクションに追加される場合、レコード数が減少する可能性があります。Milvus サービスはカタログなしでストレージに接続できる。 ストレージを無効化した後でも、 Milvus 上のアクションを実行することができます。
Milvusが使用するストレージのエンドポイントは、 S3のようなリージョンに特化したストレージの場合はリージョンと一緒に、末尾にスラッシュを付けずに指定する必要があります。 例:
https://s3.<REGION>.amazonaws.com
Milvus エンジンのホームバケットに対するバケット・クレデンシャルの更新を有効にするには、手動によるエンジンの一時停止と再開が必要です。
-
「作成」 をクリックします。
関連API
関連APIについては、こちらをご覧ください