MySQL 上のデータと Hive テーブルを JOIN したくてどうしようかな?と考えていたけど、Embulk の input に MySQL、output に HDFS を指定してやれば、あとは Hive の CREATE EXTERNAL TABLE で実現可能なことに気が付いた。
CREATE EXTERNAL TABLE
ちょいちょいと Embulk の config を書いて、だいたいのところが出来上がり。細かいところは、まだ詰めきれてないけど、だいぶ工数が減らせた気がする。
Embulk ! Embulk !