この記事では、オープンソースのモダンなデータカタログのDataHubを EKS で実行する方法について紹介します。環境構築は Terraform で行います。
構成
この記事で作成する環境です。
以下のDocker Imageを使用して EKS タスクを実行することで、DataHub をサービングします。
- acryldata/datahub-ingestion
- acryldata/datahub-gms
- acryldata/datahub-frontend-react
- acryldata/datahub-mae-consumer
- acryldata/datahub-mce-consumer
- acryldata/datahub-upgrade
- acryldata/datahub-kafka-setup
- acryldata/datahub-elasticsearch-setup
- acryldata/datahub-mysql-setup
- acryldata/datahub-postgres-setup
- acryldata/datahub-actions

まず、terraform を使用して、環境構築を行います。
ここで構築するリソースは下記の通りです。
コード中のvar.xxxは適宜設定してください。
- VPC
- EKS クラスター
- EKS 用 IAM ロール
- helm chart
VPC
IAM
EKS
helm
terraform apply して環境構築します。
DataHub 実行
以下のコマンドでFrontendのエンドポイントを確認します。
以下のような出力が得られるので、datahub-datahub-frontend
のEXTERNAL-IPを使ってアクセスします。
local環境のブラウザで http://<lb_name>.<region>.elb.amazonaws.com:9002
にアクセス。
ログイン画面で 以下をを入力しログイン。

まとめ
この記事では、DataHub を EKS で実行する方法について紹介しました。
参考

備考
Hakky ではエンジニアを募集中です!まずは話してみたいなどでも構いませんので、ぜひお気軽に採用ページからお問い合わせくださいませ。
