![見出し画像](https://assets.st-note.com/production/uploads/images/143220967/rectangle_large_type_2_24a2684c4b392be08fda98acddcb5538.png?width=1200)
Tableau パブリッシュへの道〜その1:ファイルタイプ
こんにちは山口征啓です。いよいよ明日がDATA Saberの試験です。この後におよんでまだ受験資格を満たしていないわけですが、ぎりぎりになるのはいつものことなので、気にせず進めていきます。
この3回シリーズでは、Tableauのパブリッシュに必要な情報についてお伝えします。パブリッシュとは自分の作ったワークシートやビジュアルをリモート環境にアップすることです。1回目の今回はパブリッシュへの準備としてTableauのファイルタイプについてです。
Tableauのファイルタイプはたくさんあって混乱するので、最初にまとめておきましょう。
公式サイトによると以下の6つのファイルタイプがあります。
ファイルタイプ一覧
ワークシート系
ワークブック(.twb) 基本的なファイル形式 .tdsを含む
パッケージドワークブック(.twbx) .twb + データ + 背景イメージ
ブックマーク(.tbm) ワークシート1つだけのファイル
.tbwr 自動保存される復旧用のワークブックファイル
データ系
データソース(.tds) データ接続のためのショートカット
抽出(.hyper)データのコピー
パッケージドデータソース(.tdsx) .tds + .hyper + 色々なファイル
それでは一つずつ特徴をみていきましょう
ワークブック(.twb)
これが最も基本的なファイル形式です。Tableau Desktopを開くと自動的に生成されます。ファイル→保存するとこの形式になります。
通常は複数のワークブックとダッシュボードやストーリーを含みます。
ワークブックにはデータが含まれていません。したがってファイルの外にデータに接続して使う必要があります。もしファイルにデータを含めたい場合は、次のパッケージドワークブックを使います
パッケージドワークブック(.twbx)
ワークブックに加えて、抽出されたデータ(.hyper)やローカルのデータ(Excelなど)と背景イメージが含まれています。Zip形式で圧縮されています。データを含むのでファイルを渡すだけで、誰でもデータを閲覧できるという利点があります。
一方で、ファイルサイズが大きくなる、データが更新されない、データが意図しない人に渡ってしまうというデータ流出の危険性があります。そのため使用を推奨されていません。
ブックマーク(.tbm)
こちらは1つのワークシートだけを保存する形式です。頻繁に使用するワークシートがあるときに便利とされています。
データの更新はされませんので、あまり変化がなく、かつ頻繁に参照するようなワークシートがある時に向いていると思います。
検索してもユースケースが全く出てこないので、あまり使われていないようです。
.tbwr
こちらは公式サイトにも載っていなくて、なんという名称なのかわからないのですが、自動保存される復旧用ファイルです。
Tableauでは数分おきにワークブックが自動的に保存されます。この内容が.twbr形式で保存されます。
データソース(.tds)
つづいてデータ系のファイルです。一番基本的なのはこのデータソースです。
一般的にデータソースというとデータ自身を指すと思うのですが、Tableauのデータソースは、データを持っていません。代わりに、どのデータに接続したとか、読み込んだ後のデータ変形(結合、列名変更、型変更、別名)の情報だけをもっています。
名前が紛らわしいので注意が必要ですね。
抽出ファイル(.hyper)
こちらはデータを抽出した時に作成されるファイルです。以前は.tdeと呼ばれていたようです。
抽出とは元のデータセットから抜き出して、別に保存されるデータのことです。これも拡張子から中身が想像しにくいですね。
抽出すると以下のメリットがあります
処理が高速になる
データにオフラインでアクセスできる
元のデータソースでは利用できない機能を使うことができる
オフラインで作成したワークブックをTableau Publicにパブリッシュするときにも抽出が必要になります。
パッケージドデータソース(.tdsx)
最後はパッケージドデータソースです。これはデータソース(.tds)に加えて、抽出ファイル(.hyper)やテキスト ファイル、Excel ファイル、Access ファイル、ローカル キューブ ファイルなどのローカル ファイル データが含まれます。そしてZip形式で圧縮されています。
全部盛りのデータソースですので、ローカルでも開くことができますが、
ファイルサイズが大きくなる、データが更新されない、データ流出の危険性などパッケージドワークブックと同じ欠点を持つため、推奨されていません。
終わりに
さまざまなファイルタイプがありますが、基本的にはワークブック、データソース、抽出ファイルの3つをよく使います。
これらの違いをおさえておくとスッキリしますね。
次回はTableauのリモート環境についてです。