IBM Cloud Docs
Netezza Performance Server 데이터 로드

Netezza Performance Server 데이터 로드

' IBM® Netezza® Performance Server for IBM Cloud Pak® for Data as a Service'에 데이터를 로드하는 방법에는 여러 가지가 있습니다. 로컬 컴퓨터 또는 S3 데이터를 로드하는 방법을 알아보세요.

시작하기 전에

  1. Fix Central 클라이언트 패키지를 다운로드하고 클라이언트 패키지 설치에 설명된 대로 설치합니다.

    NPSaaS 데이터에 데이터를 업로드하는 가장 쉬운 방법 중 하나는 ' nzsql 명령을 사용하는 것입니다. nzsql '는 NPSaaS 호스트에서 SQL 명령을 실행하는 데 사용할 수 있는 인터페이스를 제공합니다.

    웹 콘솔을 사용하여 데이터를 로드할 수 없습니다.

  2. Netezza Performance Server 로그인합니다.

    이 예에서는 ' nzsql ' 명령이 사용되었지만 다른 클라이언트를 사용할 수도 있습니다.

    NPSaaS 연결하기에서 설명한 대로 비공개 엔드포인트 또는 공용 및 비공개 엔드포인트로 NPSaaS 프로비저닝할 수 있습니다. 각 엔드포인트 유형은 NPSaaS 연결할 수 있는 두 개의 호스트 이름 집합을 제공합니다.

    데이터를 로드하려면 관리자 사용자이거나 데이터베이스 또는 스키마의 소유자여야 합니다. 데이터를 처음 로드하고 기존 테이블에 데이터를 로드하지 않는 경우 ' Create Table ' 권한도 있어야 합니다. 사용자 권한을 변경해야 하는 경우 사용자 관리하기를 참조하세요.

    nzsql -host <nps_host_ip> -u <user> -pw <password>
    
    세부사항
    입력 설명
    nps_host_ip

    인스턴스의 IP 주소를 지정합니다.
    ' NPS HOST IP' :
    검색하려면 1. IBM Cloud 계정에 로그인합니다.

    1. 비공개 엔드포인트 > 서비스 인스턴스 세부 정보로 이동합니다.
    2. 인스턴스를 선택하십시오.
      이제 인스턴스 IP 주소가 페이지에 표시됩니다.
    사용자 사용자 이름을 지정합니다.
    비밀번호 사용자의 비밀번호를 지정합니다.

    예:

    nzsql -host X.XX.XXX.XXX -u admin -pw password
    Welcome to nzsql, the IBM Netezza SQL interactive terminal.
    Type:  \h for help with SQL commands
           \? for help on internal slash commands
           \g or terminate with semicolon to execute query
           \q to quit
    
    SYSTEM.ADMIN(ADMIN)=>
    

로컬 시스템에서 데이터 로드

  1. 로드할 로컬 데이터 파일을 준비합니다:

    1. 열에 주목하세요.
    2. 파일의 위치를 기록해 두십시오.
    3. 데이터가 쉼표로 구분된 파일(예: CSV 파일)에 저장되어 있는지 확인합니다.
  2. ' CREATE TABLE AS ' 명령을 사용하여 테이블을 만듭니다.

    ' CREATE TABLE AS ' 명령은 NPSaaS 테이블을 생성하고 로컬 데이터 파일의 데이터로 테이블을 채웁니다.

    이 명령의 일부로 로컬 데이터 파일이 일시적인 외부 테이블로 바뀝니다. 즉, 로컬 데이터 파일은 일시적으로 데이터베이스 테이블로 취급되어 NPSaaS 테이블로 로드하기 위해 쿼리할 수 있습니다. 작업이 완료되면 임시 외부 테이블은 자동으로 삭제됩니다.

    CREATE TABLE <table> AS SELECT * FROM EXTERNAL <file_path> (<col1>, <col2>, ...) USING (RemoteSource <source_type> DELIM <delimiter_type> SkipRows <number_of_rows>);
    

    여기서:

    세부사항
    입력 설명
    테이블 생성 중인 테이블의 이름을 지정합니다.
    file_path 로드 중인 소스 데이터 파일의 위치를 지정합니다. 이 소스 데이터 파일은 일시적인 외부 테이블로 변환됩니다.
    col1, col2, ... 로드 중인 파일의 열 이름에 해당하는 열 이름을 지정합니다.
    Source_Type 소스 데이터 파일이 원격임을 지정합니다. 외부 테이블을 사용하여 데이터를 로드하는 경우 기본적으로 소스 데이터 파일 경로는 NPSaaS 호스트에 있는 것으로 간주됩니다. 로컬 컴퓨터에서 데이터를 로드하려면 ' RemoteSource ' 옵션을 사용해야 합니다. ' nzsql 클라이언트의 경우 ' RemoteSource 'NZSQL''를 지정합니다. 자세한 내용은 RemoteSource 옵션을 참조하세요.
    구분자_유형 소스 데이터 파일에 사용되는 구분 기호를 지정합니다. 자세한 내용은 구분 기호 옵션을 참조하세요.
    number_of_rows 데이터를 로드하기 전에 건너뛸 초기 행의 수를 지정합니다. 자세한 내용은 SkipRows 옵션을 참조하세요.

    예:

    CREATE TABLE flight_data AS SELECT * FROM EXTERNAL '/home/user/Downloads/customer_data.csv' (flight_id bigint, passenger_id int, last_name varchar(225), first_name varchar(225), seat_number int) USING (RemoteSource 'nzsql' DELIM ',' SkipRows 1);
    

    외부 테이블로 데이터를 로드하는 방법에 대한 자세한 예는 외부 테이블을 참조하세요.

    데이터가 NPSaaS 로드됩니다. 이제 쿼리 실행을 시작할 수 있습니다.

Amazon S3에서 데이터 로드

이전에 Amazon S3 업로드한 데이터 파일에서 NPSaaS 데이터를 로드할 수 있습니다.

  1. 로드할 데이터를 준비합니다.

    1. 데이터가 Amazon S3 있는지 확인합니다.
    2. 파일 형식에 유의하세요.
  2. NPSaaS' CREATE TABLE AS ' 명령을 사용하여 테이블을 만듭니다.

    ' CREATE TABLE AS ' 명령은 NPSaaS 테이블을 생성하고 S3 데이터로 채웁니다.

    이 명령의 일부로 데이터 파일이 일시적인 외부 테이블로 바뀝니다. 즉, 데이터 파일은 일시적으로 데이터베이스 테이블로 취급되어 NPSaaS 테이블로 로드하기 위해 쿼리할 수 있습니다. 작업이 완료되면 임시 외부 테이블은 자동으로 삭제됩니다.

    CREATE TABLE <table> AS SELECT * FROM EXTERNAL <file> USING (
     REMOTESOURCE <source_type>
     DELIM <delimiter_type>
     UNIQUEID <unique_ID>
     ACCESSKEYID <access_key_ID>
     SECRETACCESSKEY <secret_access_key>
     DEFAULTREGION <default_region>
     BUCKETURL <bucket_URL>
     ENDPOINT <endpoint>
     MULTIPARTSIZEMB <multipart_size>
     );
    

    여기서:

    세부사항
    입력 설명
    Source_Type 소스 유형을 지정합니다. ' S3 을 사용해야 합니다.
    구분자_유형 소스 데이터 파일에 사용되는 구분 기호 유형을 지정합니다.
    UNIQUE_ID 선택사항입니다. 클라우드 버킷의 데이터를 그룹화하는 데 사용되는 네임스페이스를 지정합니다.
    access_key_id 액세스 키를 지정합니다.
    secret_access_key 비밀 액세스 키를 지정합니다.
    기본_지역 버킷이 위치한 지역을 지정합니다.
    bucket_URL 버킷의 이름을 지정합니다.
    엔드포인트 버킷에 액세스할 지역 URL을 지정합니다.
    multipart_size 멀티파트 업로드에서 각 파트의 크기를 지정합니다. 기본값은 105MB이며, 한 번의 요청에 최대 105MB의 버퍼를 업로드할 수 있습니다.

    예:

    CREATE TABLE flight_data AS SELECT * FROM EXTERNAL '/customer_data.dat' (flight_id bigint, passenger_id int, last_name varchar(225), first_name varchar(225), seat_number int) USING (
       REMOTESOURCE 'S3'
       DELIM '|'
       UNIQUEID 'sample'
       ACCESSKEYID 'xxxxx'
       SECRETACCESSKEY 'xxxxx'
       DEFAULTREGION 'ap-geo'
       BUCKETURL 'my.sample.bucket'
       ENDPOINT 's3.eu-west-1.cloud-object-storage.appdomain.cloud'
       MULTIPARTSIZEMB '50'
       );
    

데이터가 NPSaaS 로드됩니다. 이제 쿼리 실행을 시작할 수 있습니다.