この記事では、オープンソースのモダンなデータカタログのDataHubを EKS で実行する方法について紹介します。環境構築は CLI で行います。
構成
この記事で作成する環境です。
以下のDocker Imageを使用して EKS タスクを実行することで、DataHub をサービングします。
- acryldata/datahub-ingestion
- acryldata/datahub-gms
- acryldata/datahub-frontend-react
- acryldata/datahub-mae-consumer
- acryldata/datahub-mce-consumer
- acryldata/datahub-upgrade
- acryldata/datahub-kafka-setup
- acryldata/datahub-elasticsearch-setup
- acryldata/datahub-mysql-setup
- acryldata/datahub-postgres-setup
- acryldata/datahub-actions

CLI でのインフラ環境構築
EKSクラスターの構築
クラスター上にデプロイするMySQLデータベースとNeo4jのパスワードを格納したkubernetesシークレットを作成
Datahubリポジトリをhelmに追加
Datahubのストレージレイヤ部分をデプロイ
storage classの名称確認
PVCの動作確認
eksのversionが1.30以上ではPVCにSCがアタッチされていないため設定を変更
PVの動作確認
全てのpodが Running になっているのを確認する
Datahub本体部分をデプロイ
DataHub 実行
ポートフォワーディングでlocalのブラウザで実行することができます。
まず、local環境でexposeする。
local環境のブラウザで http://localhost:9002 にアクセス。
ログイン画面で 以下をを入力しログイン。

まとめ
この記事では、DataHub を EKS で実行する方法について紹介しました。
参考

備考
Hakky ではエンジニアを募集中です!まずは話してみたいなどでも構いませんので、ぜひお気軽に採用ページからお問い合わせくださいませ。
