WindGateスタートガイド¶
この文書では Asakusa Framework スタートガイド の構成で、WindGateを利用する方法について簡単に紹介します。
See also
WindGateのより詳しい情報は WindGateユーザーガイド を参照して下さい。
プロファイルの設定¶
WindGateは、外部システムとの入出力の定義を「プロファイル」として定義します。
プロファイルを定義したプロパティファイルは、 $ASAKUSA_HOME/windgate/profile
配下に <プロファイル名>.properties
という名前で配置します。
標準ではプロファイル名 asakusa
用のプロファイル定義ファイルとして asakusa.properties
が配置されています。
プロファイルの定義情報は環境に合わせて変更してください。
このガイドでの構成¶
このガイドでは、次のような前提でアプリケーションを作成します。
- 組み込みのHadoopライブラリーを使用する
- 入出力データとしてCSVファイルを利用し、これを開発環境上(ローカル)に配置する
実行環境にインストールされているHadoopを利用する場合や、CSVファイルでなくデータベースを利用したい場合などでは、 WindGateユーザーガイド を参考に設定を行ってください。
Hadoopの設定¶
WindGateを利用したバッチアプリケーションを実行するにはHadoopの実行環境が必要です。 実行環境にHadoopが用意されていない場合、Asakusa FrameworkのデプロイメントアーカイブにHadoopライブラリーを組み込むことでも、WindGateを実行することができます。
デプロイメントアーカイブにHadoopライブラリーを組み込むには、プロジェクトのビルドスクリプト build.gradle
の末尾に以下の設定を追加します。
asakusafwOrganizer {
profiles.prod {
hadoop.embed true
}
}
ベースディレクトリの設定¶
CSVファイルを格納するディレクトリは、プロファイル上で設定します。
$ASAKUSA_HOME/windgate/profile/asakusa.properties
(プロファイル asakusa
用の構成) のファイルをエディタで開き、 resource.local.basePath
の内容にディレクトリへのフルパスを指定します。
なお、初期状態ではここに /tmp/windgate-${USER}
が指定されています [1] 。
このドキュメントでは、この値を変更せず、初期設定のままにしたという前提で進めます。
[1] | ${環境変数名} という形式で環境変数を指定できます。
初期状態では、 /tmp/windgate-<ログインユーザー名> をベースディレクトリとして利用しています。 |
データモデルクラスの生成¶
WindGateではモデルをDMDLで記述します。 DMDLの記述方法については「 DMDLスタートガイド 」などを参考にしてください。
DMDLスクリプトはプロジェクトの src/main/dmdl
ディレクトリ以下に配置し、スクリプトのファイル名には .dmdl
の拡張子を付けて保存します。
データモデルクラスを作成するには、データモデルの定義情報を記述後にGradleの compileDMDL タスクを実行します。
CSV入出力への対応¶
データモデルの定義情報を作成したら、CSVの入出力に対応させたいデータモデルに対して、 @windgate.csv
という属性を指定します。
この属性が指定されたデータモデルは、宣言されたプロパティと同じ順序のフィールドを持つCSVファイルの入出力に対応します。
この属性は、データモデルの宣言の直前に指定します。 以下は記述例です。
@windgate.csv
example_model = {
// ... プロパティの定義
};
この状態でデータモデルを作成すると、データモデルのほかに以下の3つのクラスが作成されます。
<パッケージ名>.csv.<データモデル名>CsvSupport
<パッケージ名>.csv.Abstract<データモデル名>ImporterDescription
<パッケージ名>.csv.Abstract<データモデル名>ExporterDescription
より細かな設定については WindGateユーザーガイド を参照してください。
Asakusa DSLの記述¶
WindGateを利用する場合でも、Asakusa DSLの基本的な記述方法は同様です。 WindGate特有の部分は、以降で説明する CSVファイルをインポートする と CSVファイルをエクスポートする 部分のみです。
それ以外の部分については、 Asakusa DSLスタートガイド を参照してください。
CSVファイルをインポートする¶
開発環境のCSVファイルをインポートしてHadoopの処理を行う場合、 CSV入出力への対応 で生成した <パッケージ名>.csv.Abstract<データモデル名>ImporterDescription
クラスのサブクラスを作成して必要な情報を記述します。
このクラスでは、下記のメソッドをオーバーライドします。
String getProfileName()
インポータが使用するプロファイル名を戻り値に指定します。
インポータは実行時に
$ASAKUSA_HOME/windgate/profile
以下の<プロファイル名>.properties
に記述された設定を元に動作します。 今回はデフォルトを利用するので、"asakusa"
という文字列をreturn
文に指定してください。String getPath()
インポートするCSVファイルのパスを指定します。
ここでは ベースディレクトリの設定 で指定した
resource.local.basePath
からの相対パスで指定します。 ベースディレクトリの設定と合わせて/tmp/windgate-<ログインユーザー名>/<指定したパス>
というファイルを利用します。
以下は Document
というデータモデルを宣言した場合の実装例です。
public class DocumentFromCsv extends AbstractDocumentCsvImporterDescription {
@Override
public String getProfileName() {
return "asakusa";
}
@Override
public String getPath() {
return "input.csv";
}
}
ここで記述した内容は、ジョブフローの入力に対して、 @Import
を利用して指定します。
CSVファイルをエクスポートする¶
ジョブフローの処理結果をCSVファイルにエクスポートする場合、 CSV入出力への対応 で生成した <パッケージ名>.csv.Abstract<データモデル名>ExporterDescription
クラスのサブクラスを作成して必要な情報を記述します。
このクラスでは、下記のメソッドをオーバーライドします。
String getProfileName()
エクスポータが使用するプロファイル名を戻り値に指定します。
インポータと同様に
"asakusa"
という文字列をreturn
文に指定してください。String getPath()
エクスポートするCSVファイルのパスを指定します。
インポータと同様に ベースディレクトリの設定 で指定した
resource.local.basePath
からの相対パスで指定します。 ベースディレクトリの設定と合わせて/tmp/windgate-<ログインユーザー名>/<指定したパス>
というファイルに結果を出力します。なお、出力先にすでにファイルが存在する場合、エクスポート時に上書きされます。 インポートに指定したファイルや、他のエクスポート処理で使用するファイルとは別のファイルを指定するようにしてください。
以下は Document
というデータモデルを宣言した場合の実装例です。
public class DocumentToCsv extends AbstractDocumentCsvExporterDescription {
@Override
public String getProfileName() {
return "asakusa";
}
@Override
public String getPath() {
return "output.csv";
}
}
ここで記述した内容は、ジョブフローの入力に対して、 @Export
を利用して指定します。
アプリケーションの実行¶
アプリケーションのビルドや実行方法は、通常のAsakusa Frameworkのアプリケーション開発と同様です。
CSVファイルをインポートする で指定したように、入力データのCSVファイルは /tmp/windgate-<ログインユーザー名>/input.csv
など、 getPath()
で指定したものを利用してください。
出力結果は同様に、 CSVファイルをエクスポートする で指定したように、 /tmp/windgate-<ログインユーザー名>/output.csv
など、 getPath()
で指定したパスに出力されているはずです。
アプリケーションの実行手順については、 Asakusa Framework スタートガイド などを参照してください。