Arbeiten mit der Entwicklungsumgebung VS Code

Gilt für: Funkenmotor Gluten beschleunigter Funkenmotor

Die VS Code-Entwicklungsumgebung ist eine Spark-basierte Entwicklungsumgebung, mit der Sie Spark-Anwendungen auf einem Spark-Cluster, der auf der Spark-Engine läuft, interaktiv programmieren, debuggen, übermitteln und testen können.

Es ist als Visual Studio Code-Erweiterung verfügbar und kann in Ihrem lokalen System installiert werden, um mit Visual Studio Codeauf die Spark-IDE zuzugreifen. Es reduziert die Entwicklungszeit und erhöht die Benutzerfreundlichkeit.

Vorbereitende Schritte

Abonnement von watsonx.data in der Cloud. Vergewissern Sie sich, dass Sie eine Spark-Engine erstellt haben und diese in Betrieb ist.
Installieren Sie eine Desktopversion von Visual Studio Code.
Installieren Sie die Erweiterung watsonx.data von VS Code Marketplace.
Installieren Sie die Visual Studio Code-Erweiterung Remote-SSH von Visual Studio Code marketplace.

Da Spark-Labore von Natur aus flüchtig sind, müssen Sie die gespeicherten Daten regelmäßig sichern, um einen möglichen Datenverlust bei Upgrades oder einem Absturz des Spark-Masters zu verhindern.
Für Benutzer, die mit umfangreichen Anwendungen und Notebooks in Visual Studio Code arbeiten, wird empfohlen, mindestens 8 GB Arbeitsspeicher anstelle der standardmäßigen 4 GB Arbeitsspeicher zuzuweisen. Dies gewährleistet eine reibungslosere Leistung und eine bessere Handhabung ressourcenintensiver Aufgaben. Dies ist wichtig, wenn SparkLabs für einige speicherintensive Anwendungen verwendet wird, z. B. für Notebooks. In solchen Szenarien müssen die Sitzungen bei einer Netzunterbrechung neu geladen werden, was zusätzlichen Speicheraufwand erfordert. Um solche Risiken zu vermeiden, müssen Sie proaktiv zusätzlichen Speicherplatz zuweisen.

Vorgehensweise

Einrichten der Spark-Labore

Installieren Sie die Erweiterung watsonx.data.

a. Öffnen Sie Visual Studio Code. Klicken Sie auf Erweiterungen.

b. Suchen Sie über VS Code Marketplace nach der Erweiterung watsonx.data und installieren Sie die Erweiterung.

c. Außerdem wird das Symbol watsonx.data im linken Navigationsfenster angezeigt. Klicken Sie auf das Symbol. Es öffnet sich das Fenster Willkommen bei IBM watsonx.data Erweiterung.
Klicken Sie im Fenster Willkommen bei IBM watsonx.data Erweiterung auf Verbindung verwalten. Das Fenster Verbindung verwalten watsonx.data öffnet sich.
Konfigurieren Sie eine der folgenden Angaben:
- JSON-Eingaben
- Formular-Eingaben
Um JSON-Inputs zu konfigurieren, klicken Sie auf JSON-Inputs und geben Sie die folgenden Details an:
- API-Schlüssel: Geben Sie den API-Schlüssel der Plattform an. Um den API-Schlüssel zu generieren, siehe Generierung des API-Schlüssels.
- Connection JSON: Geben Sie die Verbindungsdetails aus der Benutzeroberfläche watsonx.data an. Um das zu tun:
  1. Melden Sie sich auf Ihrer watsonx.data Seite an.
  2. Klicken Sie im Navigationsmenü auf Verbindungsinformationen.
  3. Klicken Sie auf VS-Code. Kopieren Sie die Konfiguration aus dem VS Code-Verbindungskonfigurationsfeld und verwenden Sie diese als Wert für das JSON-Feld Verbindung. Weitere Informationen finden Sie unter Abrufen von Verbindungsinformationen.
Um Formulareingaben zu konfigurieren, klicken Sie auf Formulareingaben und geben Sie die folgenden Details an:
- Host-Adresse der watsonx.data Konsole: Geben Sie die Host-IP-Adresse der watsonx.data Installation an. Um die IP-Adresse des Hosts abzurufen, siehe Abrufen von Verbindungsinformationen.
- Umgebungstyp: Wählen Sie SaaS.
- CRN: Die Instanz CRN Ihrer watsonx.data Instanz. Um die CRN abzurufen, siehe Verbindungsinformationen abrufen.
- Benutzername: Ihre E-Mail-ID, wenn Sie Ihren API-Schlüssel verwenden, oder im Format <Service-id>-<GUID>. Weitere Informationen zur Erstellung von Dienst-ID und GUID finden Sie unter Erstellen von Dienst-IDs.
- API-Schlüssel: Geben Sie den API-Schlüssel der Plattform an. Um den API-Schlüssel zu generieren, siehe Generierung des API-Schlüssels.
Klicken Sie auf Testen & Speichern. Retrieved Spark Clusters wird angezeigt. Die verfügbaren Spark-Engines werden im WATSONX.DATA:ENGINES abschnitt angezeigt.
Erstellen Sie ein Spark-Labor.

a. Um ein neues Spark-Labor zu erstellen, wählen Sie im Abschnitt WATSONX.DATA:ENGINES den gewünschten Spark-Cluster aus, und klicken Sie auf das Symbol + (Cluster hinzufügen). Das Fenster Spark-Labor erstellen wird geöffnet. Geben Sie einen eindeutigen Namen für das Spark-Labor an und wählen Sie die Spark-Version aus. Die Standardversion von Spark ist 3.5. Sie können die anderen optionalen Felder bei Bedarf ändern.

Der Parameter " spark.hadoop.wxd.apikey wird bei der Erstellung von Spark-Labors standardmäßig im Feld Spark-Konfigurationen konfiguriert.

b. Klicken Sie auf Aktualisieren, um das Spark-Labor im linken Fenster anzuzeigen. Dies ist der dedizierte Spark-Cluster für die Anwendungsentwicklung.

c. Klicken Sie auf, um das Spark-Laborfenster zu öffnen, um auf das Dateisystem und das Terminal zuzugreifen und damit zu arbeiten.

c. Im Explorer-Menü können Sie das Dateisystem anzeigen, in das Sie die Dateien hochladen können, und Protokolle anzeigen.

Um ein bereits laufendes Spark-Labor zu löschen, fahren Sie mit der Maus über den Namen des Spark-Labors im linken Navigationsbereich von watsonx.data und klicken Sie auf das Symbol Löschen.

Spark-Anwendung entwickeln

Entwickeln Sie eine Spark-Anwendung im Spark-Labor. Sie können mit einer Spark-Anwendung auf eine der folgenden Arten arbeiten:

Eigene Python erstellen
Jupyter Notebooks erstellen

Eigene Python-Datei erstellen

Klicken Sie unter Visual Studio Code auf das Spark-Labor. Es wird ein neues Fenster geöffnet.
Klicken Sie im neuen Spark-Laborfenster auf Neue Datei. Sie erhalten eine Eingabeaufforderung Neue Datei mit den folgenden Dateitypen:
- Textdatei: Wählen Sie diese Option, um eine Textdatei zu erstellen.
- Python Datei: Wählen Sie diese Option, um eine Python Anwendung zu erstellen.
- Jupyter Notebook wählen Sie diese Option, um eine Jupyter Notebook Datei zu erstellen.
Wählen Sie Python Datei. Eine neue Datei .py wird geöffnet. Sie können mit der Arbeit an der Datei Python beginnen und sie später speichern.

Sie können die Anwendungsdatei Python auch auf die Explorer-Seite ziehen. Die Datei wird im rechten Teilfenster der Anwendung Visual Studio Code geöffnet.
Führen Sie den folgenden Befehl im Terminal aus, um Ihre Anwendung Python auszuführen. Damit wird eine Python Sitzung eingeleitet, und Sie können die Bestätigungsnachricht im Terminal sehen.
```
python <filename>
```

Jupyter-Notebooks erstellen

Klicken Sie unter Visual Studio Code auf das Spark-Labor. Es wird ein neues Fenster geöffnet.
Installieren Sie die Erweiterung Jupyter im neuen Spark-Laborfenster, um mit Jupyter-Notebooks zu arbeiten. Suchen Sie im Menü " Erweiterungen" des neuen Spark-Lab-Fensters nach Jupyter (Sie finden es auch auf dem VS Code Marketplace ) und installieren Sie die Erweiterung.

Stellen Sie sicher, dass Sie die Erweiterung Jupyter aus dem neuen Spark-Laborfenster heraus installieren.
Klicken Sie auf der Seite Explorer auf Neue Datei. Sie erhalten eine Eingabeaufforderung Neue Datei mit den folgenden Dateitypen:
- Textdatei: Wählen Sie diese Option, um eine Textdatei zu erstellen.
- Python Datei: Wählen Sie diese Option, um eine Python Anwendung zu erstellen.
- Jupyter Notebook wählen Sie diese Option, um eine Jupyter Notebook Datei zu erstellen.
Sie können auch eine neue Datei Jupyter Notebook erstellen, indem Sie den Namen der Datei mit der Erweiterung .ipynb eingeben oder das vorhandene Notizbuch per Drag & Drop auf die Explorer-Seite ziehen.
Wählen Sie Jupyter Notebook. Eine neue Datei .ipynb wird geöffnet. Sie können mit der Arbeit an der Datei Jupyter Notebook beginnen und sie später speichern.
Klicken Sie in der Datei Jupyter Notebook auf den Link Kernel auswählen.
Sie müssen eine Python Umgebung auswählen, um Ihre Datei auszuführen.
Wählen Sie den Dateipfad, der conda/envs/python/bin/python enthält.
Die Jupyter Notebook ist nun einsatzbereit. Sie können Ihren Code schreiben und ihn zellenweise ausführen.

Wenn Sie die Datei speichern, wird der Dateipfad automatisch in der Eingabeaufforderung Speichern unter angezeigt. Sie können den Pfad ändern oder zum Speichern auf OK klicken.