Tableauユーザーの皆さん、Tableau社がコンテストを開催しているのはご存知ですか?
実は、Tableau社は『Iron Viz』という名前で年に数回コンテストを開催しているんです。
今回の記事では、『Iron Viz』とはどのようなコンテストなのか、というところから私がコンテストに応募した作品と、その最終結果まで書いていきます。
端的にいうと、世界中のTableauの猛者達が趣向を凝らして作成したViz(作品)を応募し、勝者を決定するコンテストです。応募するのはTableau Publicからで、全世界のユーザーがVizやデータ等をダウンロードできる状態にする必要があります。
評価を行うのはTableauの社員とコミュニティから選ばれたゲスト審査員で、評価軸は以下の3つと提示されています。
また、一般ユーザーからの投票も併せて行われ、応募締め切りから大体10日前後で審査結果が公表されます。
Iron Vizの開催や審査結果は全てTableau Publicのブログ上で行われるため、興味のある方は常にチェックしておきましょう。
コンテストの開催とともに毎回異なるテーマが発表されます。
記事執筆時点での直近(2018年5月)に開催されたIron Vizのテーマは、"Books and Literature(書籍と文学)"でした。テーマはあえて広く設定されるため、どのようなVizを作るのかは各々の発想に委ねられます。
テーマ発表から応募締め切りまで約1ヶ月と期間が短く、テーマに沿ったアイディア出しが非常に重要になります。
応募用のVizに使用するデータには一切の制限はありません。
しかし、全世界のユーザーに閲覧・ダウンロードの許可を与えるため、オープンデータや、自分で作成したデータを利用するのが一般的でしょう。一例ですが、東京都もオープンデータを公開しています。
Iron Vizで入賞したとしても賞金や賞品はもらえません。
しかし、1位のユーザーはTableau Conferenceに招待され、その年のチャンピオン達(コンテストは年に数回開催されます)で行われる最終決戦に参加することができます。
ここからは私が実際に応募したVizの紹介になります。Tableau Publicで見る場合はこちら。
題材は、日本人らしく『古今和歌集』としました。
以下の画像が応募した物で、古今和歌集の作者や頻出単語を可視化したVizになります。右側の線がたくさんあるチャートは、古今和歌集と新古今和歌集の頻出句ランキングを比較し、推移を線と色で表しています。頻出句の推移から、時代による作者の心情の推移が読み取れます。
作成時間は約8時間(データの準備:6時間、Vizの作成:2時間)程度です。
古今和歌集のデータは既にオープンデータ化されていたので、こちらからダウンロードすることができました。
しかし、新古今和歌集はオープンデータ化されているものの、こちらのページ上で羅列されているだけでしたので、スクレイピングで取得し自分でデータ化しました。
スクレイピングは、PHPやPython等でwebサイト上の情報を収集する手法です。
今回はPHP用ライブラリ『phpQuery』を使用して、約2000首の和歌と作者のデータを収集しました。
次に、Tableau Prep(当時はまだマエストロ)でデータを整形していきます。
実はここでかなり骨が折れました…。試行錯誤しながら、最終的にこんなフローになりました。
応募フォームから登録すると、こんな感じで応募作品として掲載されます(上から2行目に掲載されて少し興奮しました)。
ここから、一般ユーザーによる投票、審査員による審査が始まり、10日後位に結果が発表されます。
結果は入賞できず、でした。
応募作品が掲載された時点で周りのレベルがかなり高く、薄々気付いていましたが、やはり残念ですね。。。
実は今回のIron Vizの開催を知ったのが、応募締め切りの4日前だったので、充分な時間を確保できなかったのが大きな要因だと思っています。
次回はもっと準備時間を多く確保し、クオリティの高いVizを応募するので、どうぞお楽しみに!