特定の区切り文字で区切られたファイルを読み取りたい

Avatar
dstn

特定の区切り文字で区切られたファイルを読み取りたい

キーワード:CSV,区切り文字,デリミタ

概要

特定の区切り文字で区切られたファイルを読み取りたい場合、CSVファイル読み取り処理を使用し、 [デリミタ文字]を設定します。

サンプルプロジェクトの説明

「;」(半角セミコロン)で区切られたファイルを読み取り、「,」(半角カンマ)で区切られたファイルを出力します。

処理の流れ

サンプルプロジェクトの処理の流れは以下の通りです。
  1. CSVファイル読み取り処理」で「;」で区切られたファイルを読み取ります。
  2. CSVファイル書き込み処理」で「,」で区切られたファイルを出力します。
実行結果のイメージについては、サンプルプロジェクトのサンプルデータ「output.csv」を参照してください。

ポイントとなる機能

名前 説明 ツールパレット上の場所
CSVファイル読み取り処理 CSV(Comma Separated Values)形式、TSV(Tab Separated Values)形式などの形式のファイルを読み取ります。 「ファイル」-「CSV」-「CSVファイル読み取り」

処理のポイント

CSVファイル読み取り処理の [デリミタモード][デリミタ文字]を設定することで、区切り文字を設定することが可能です。
[デリミタ文字]に「;」を設定することで、列ごとの値を取得しています。

サンプルプロジェクトの使用方法

上記処理を実装したサンプルプロジェクトを用意しています。サンプルプロジェクトを使用する場合の手順は、以下の通りです。

サンプルプロジェクトのダウンロード 逆引きリファレンス シナリオ036のサンプルプロジェクト
  1. サンプルプロジェクトの展開
    サンプルプロジェクト「rl_reference_036.zip」を展開します。

  2. プロジェクトのアップロード
    「rl_reference_036.zip」を展開後に作成される「rl_reference_036プロジェクト」ディレクトリがプロジェクトファイルとなります。
    DataSpider Studioを起動し、マイプロジェクトの画面から[ファイル]-[ローカルからアップロード]で展開したディレクトリ「rl_reference_036プロジェクト」をアップロードしてください。

  3. サンプルデータの準備
    「rl_reference_036.zip」を展開後に作成される「samples」ディレクトリがサンプルデータとなります。
    $DATASPIDER_HOME/server/samplesディレクトリに上書きしてください。

スクリプトの作成手順

プロセスフローおよびデータフローは、「 サンプルプロジェクトの説明」のスクリプト画像を参照して適宜設定してください。
  1. デザイナのツールパレット「ファイル」-「CSV」-「CSVファイル読み取り」から、CSVファイル読み取り処理をスクリプトキャンバスに配置します。
    • CSVファイル読み取り処理の設定は、以下のように行います。

      [必須設定]タブ



      処理のポイント
      • [デリミタモード]は、[一覧から選択][直接入力][文字コード入力]の三種類から選択できます。
      • 「;」(半角セミコロン)で区切られたファイルを読み取るには、以下いずれかの方法があります。
        • [一覧から選択]を選択し、[デリミタ文字]に「半角セミコロン」を選択する。
        • [直接入力]を選択し、[デリミタ文字]に「;」を入力する。
      • [デリミタ文字]にダブルクォーテーションを設定することはできません。

  2. デザイナのツールパレット「ファイル」-「CSV」-「CSVファイル書き込み」から、CSVファイル書き込み処理をスクリプトキャンバスに配置します。
    • CSVファイル書き込み処理の設定は、以下のように行います。

      [必須設定]タブ


  3. スクリプトを実行し、正常終了すれば成功です。

コメント

ログインしてコメントを残してください。

Powered by Zendesk