kt.log

Getting started with Azure Databricks

本記事では、Azure Databricks をデプロイする方法を解説します。 Azure Databricks のリソースを作成して Workspace を立ち上げることをゴールとします。

前提

免責

  • 筆者の環境は英語です。画面が日本語表示になっていない点、ご了承ください。

手順

リソースの作成を開始する

既存のリソースグループがある場合は、リソースグループから作成を行うこともできます。以下のスクリーンショットはその方式です。もちろん、リソースグループが無い状態からでもリソースは作成できます。

基本項目を入力する

本記事では Get Started with Azure Managed Instance for Apache Cassandra で作成した Azure Managed Instance for Apache Cassandra クラスターと同じリソースグループに、 Azure Databricks を作成します。別の記事で、これらの連携について解説するためです。リージョンも同様に合わせてあります。
Azure Databricks 単体で利用する場合は、このような配慮は不要です。

ネットワークの項目を入力する

前項と同様に、 Virtual Network も Azure Managed Instance for Apache Cassandra と同じものを使用します。
既存の Virtual Network を利用する場合、 Public/Private Subnet CIDR Range は、それぞれ既存で使われている IPアドレス と衝突しないようにしてください。本記事では、既存で使われている IPアドレスが 10.0.0.x ですので、以下のスクリーンショットのように指定しました。
Azure Databricks 単体で利用する場合は、このような配慮は不要です。

Public Subnet Name は public-subnet 、Private Subnet Name は private-subnet とします。初期状態では一見するとフォームに名前の値が既に入っているように見えますが、実際には単なるプレースホルダーですので(文字が微妙にグレーがかっている)、自分で入力する必要があります。

アドバンスドの項目を設定する(任意)

本記事では特に設定は行いません。

タグを入力する(任意)

筆者は独自にタグを付与しています。

レビューして作成する

デプロイ完了

今回は約3分30秒でデプロイが完了しました。

リソースにアクセスする

Workspace を立ち上げる

まとめ

Azure Portal から Azure Databricks のリソースを作成する方法を解説しました。特に難しいことは無いと思いますし、オープンソース版のSparkをIaaSに構築するよりもはるかに簡単であると思います。 IPアドレス に関する基礎的な知識が少し必要ですので、不安な方には IPアドレス について勉強することをお勧めします。