Tableau Bridge についての備忘録

Bridge、いいですよね。
Tableauの機能のうちですごく好きです。
 
オンプレミスデータとTableau Cloud をつなげることができる素敵なソフトウェアですね。
例えば社内にローカル端末においてある端末にあるデータをTableau Cloudにパブリッシュした後、端末側に更新があればボタン一つでTableau Cloud と同期が取れます。

最近(今年度?)では、絶妙に使いにくかったレガシー版からほぼ移行されており、以下をしてあげるだけで接続が完了していまいます。
・Tableau Bridgeソフトウェアを端末側にインストール
・Tableau Cloud 側で接続設定

今回はそんなBridgeで少し手間取った点や注意点を書いていこうと思います。

更新するときに案外端末リソースを消費する

基本は端末側のスペックに応じてスケールアウトをしてくれますが、仮想環境として要求される要件は以下にある通り、vコア4~8、16~32GBのVRAM、NVMeSSDくらいは要求されています。
https://help.tableau.com/current/online/ja-jp/to_bridge_scale.htm

実際、それなりの規模のデータの更新(数百MB)をする際の挙動を確認してみると、以下のような使用状況になりました。
・HDDだと使用率が100%で張り付く
・CPUも数Core使用率が100%
・ネットワーク帯域も80Mbps程度利用

上記のような状態になるため、更新時は端末側の操作も当然重くなります。
また、どこかしらがボトルネック(R/W、ネットワーク帯域など)になると、更新時間もそれに応じて伸びていきます。
 
もちろん、時間さえ掛ければ十分に更新してくれる(複数データソースのBridge更新を要求した際もキューに入ってくれる)ので、状況に応じてですが、意外にスペックが必要なことは留意しておいた方が良いかもしれません。

特に記憶媒体(HDD)の使用率が上限に張り付く関係上、バックアップなどが並行して走ると相性によっては少し危険かもしれません。

物理的特性からHDDが適切だとは思いますが、ディスク自体は分散しておくと安全かと思います。

Tableau Cloudにパブリッシュする際のUNCパスは忘れずに!

まずUNCパスとは何か、という方も多いかと思います。
ざっくり、Windows システム上のパスの種類は以下3種類が挙げられます。

絶対パス

  • 書き方例
    C:\Users\Alice\Documents\report.docx

  • 概要
    絶対パスは、ドライブのルートから目的のファイルやフォルダまでの全経路を示すパスです。どのディレクトリに現在いるかに関わらず、常に同じ場所を一意に指定できます。

相対パス

  • 書き方例
    .\data\info.txt
    (※現在のディレクトリが C:\Users\Alice の場合、C:\Users\Alice\data\info.txt を指します)

    1. または、親ディレクトリを示す場合は
      ..\backup\oldfile.txt
      (※現在のディレクトリから1つ上の階層の backup フォルダ内の oldfile.txt を指します)

  • 概要
    相対パスは、現在の作業ディレクトリを基準にファイルやフォルダの位置を指定します。.\ は「現在のディレクトリ」を、.. は「親ディレクトリ」を意味し、状況に応じて短く記述できる利点があります。

UNCパス(Universal Naming Convention)

  • 書き方例
    \\ServerName\SharedFolder\project\file.txt

  • 説明
    UNCパスは、ネットワーク上の共有リソースへアクセスするためのパス表記です。ドライブレターではなく、先頭に2つのバックスラッシュ (\\) を付け、サーバー名と共有フォルダ名でリソースを特定します。これにより、ローカルだけでなくネットワーク上のファイルも一意に指定できます。

上記のうち、Bridgeで更新するためには、データをTableau Cloud にパブリッシュする際にUNCパスを使わなくてはなりません。
Tableau Bridge や Tableau Cloud の設定によって、接続されている端末のプライベートネットワーク、端末名(hostName)までは分かるのですが、データの場所を一意に特定する為には、キチンと場所まで書いておく必要があるためです。

絶対パスや相対パスは見ていただくとわかる通り、端末の名前などは無く、どの端末でも共通の書き方ができるものになります。各個人の端末だけの世界であればそれらで充足していますが、「Tableau Cloud から見てどの端末の場所か?」までは分からないので、教えてあげる必要があるんですね。
 
ちなみに分かりにくい点として、もし絶対パスでパブリッシュしたデータソースに、Bridgeの更新をかけても特段のエラーは発生しません。
Tableau Cloud のジョブを見ると成功しているように見えるが、なぜか更新日付などは変わらない、といった状況になってしまうので、わかりにくいんですよね。。

Tableau Bridgeソフトウェアもたまにはアップデートしよう

他のTableau製品と違い、基本的にはバックグラウンドに常駐させておくような使い方なので、割とアップデートを忘れがちです。
それなりに安定しているように見えるので、アップデート自体は問題が無ければ必須ではないとは思いますが、パフォーマンスの改善やバグ修正などがされているそうなので、気づいたときにしておくと安心ですね。

おわりに

今回はBridge でのあれこれを書いてみました。
細かいところにトラップ(?)はあるものの、総じてとても使いやすいソフトウェアであることは間違いないです。
個人的にはPrepに泣かせられることが多かったのですが、Bridgeの便利さには脱帽しています。。

いいなと思ったら応援しよう!