この記事では、オープンソースのモダンなデータカタログのDataHubをAWS上にデプロイするための環境構築について紹介します。
本記事ではOSはUbuntu 24.04であることを前提として以降説明します。
AWS CLI
Amazon Web Services(AWS)のサービスをコマンドラインから操作・管理するためのオープンソースツールです。
インストール
configおよびcreadentialsの設定
- ターミナルで
aws configure
を実行
- AWS Access Key ID, AWS Secret Access Key, Default region nam, Default output formatを入力

IaCツールの1つで、プログラマーがインフラを安全かつ効率的に構築、変更、バージョン管理するためのツールです。
インストール
Terraformのバージョンを指定してインストール
Kubernetisクラスタ管理のためのツール
kubectl
Kubernetes クラスターを操作するためのコマンドラインツールです。
インストール
Helm
HelmとはKubernetes設定ファイルを1つの再利用可能なパッケージにまとめて、Kubernetes アプリケーションの作成、パッケージ化、構成、デプロイを自動化するツールです。
HelmはHelmチャートと呼ばれるパッケージングフォーマットを使用してアプリケーションの配信を自動化することによりプロセスを単純化します。
インストール
eksctl
AWS EKS の環境構築をするためのコマンドラインツールです。
インストール
Python
ここではPython 3.11もしくは3.12が既にインストールされていることを想定しDataHubを操作するためのパッケージのインストールについて説明します。
インストール
以下のコマンドを実施し操作に必要なPythonパッケージをインストールします。
バージョンを表示させて、datahubパッケージが正常にインストールされたかを確認します。
その他連携に必要なパッケージのインストールは公式ドキュメントのInstalling Pluginsを参照願います。
ここではREST API用のパッケージとs3用のパッケージを以下のコマンドでインストールします。
まとめ
この記事では、DataHubをAWS上にデプロイするための環境構築について紹介しました。
参考

備考
Hakky ではエンジニアを募集中です!まずは話してみたいなどでも構いませんので、ぜひお気軽に採用ページからお問い合わせくださいませ。
