Twitterというサービスを利用している。

だいたい1日に10回くらいはツイートするし、ちょっと時間が空いたときはタイムラインを追って、フォローしているユーザーのツイートを見て楽しむ。

 

Twitterは、突発的に話題が生まれる。

ある有名人が不倫なんかをしたら、それの賛否についてだったり、有名人ではなくても、そのツイートの発言に関する議論が起こったり・・・

と常に話題が絶えない。

RTやいいねを通して、他ユーザーに一気に広まり、広告などのトレンドを押しのけて、一気にトップの話題になることもよくある。

「そのようなTwitterの動きを別の形で見て楽しむことができないか」

ということを考えた私は、それを実現するシステムの開発を9月から開始した。

 

「Twitter(ツイート)を可視化」の事例

Wordクラウド

私のツイッターから作ったWordクラウド

文章(ツイート)中で出現頻度が高い単語を持ってきて、その頻度に応じた大きさで画像に示す。

 

トレンド

ある日のTwitterのトレンド。この日は衆議院選挙の投票日。

ツイッター全体で投稿されているツイートの中で、修験頻度の高いものを表示する。

 

ハッシュタグ

ツイート中に「#」をつけることで、任意にタグを設定できる機能。

例)#衆議院選

イベントやテーマをタグとしてつけて、検索しやすくしたりする。テレビ番組の中には、この機能を利用して、ユーザーや視聴者とのインタラクティブな番組の進行に役立てている。

 

 

 

これらの事例の特徴

 

リアルタイムであること

Twitterは、140文字以内の文章を投稿・共有するサービスである。(よくSNSというように言われるが、厳密にはブログらしい)

投稿の手軽さから短時間中に多くの投稿がある。

 

トレンド(流行・話題)というまとまり

Twitterは、盛り上がっている話題を一目で確認できる。このトレンドに乗じてツイートするユーザーも存在する。

トレンドに注目すれば、ある一定の話題・テーマに関するツイートを多量に収集できる。

 

含まれる情報が多い

TwitterのAPIから取得したJSONデータを読んでみると、非常に多くのデータがツイートに含まれているということがわかる。

※1つのツイートから取得したJSONデータ

  • ツイートID(実はツイートそれぞれにIDがある)
  • ユーザーID
  • ユーザー名(@の後ろにある英数字)
  • ユーザー名(日本語も使える方)
  • ユーザーのプロフィール
  • フォロー数
  • フォロワー数
  • ツイート数
  • お気に入り登録数
  • 住んでいる所
  • ユーザーアカウント登録日
  • ツイートの内容
  • ユーザーがリツイート(以下、RT)されたものか
  • 他ユーザーによってRTされたかどうか
  • リツイートされた回数
  • お気に入りされたかどうか
  • お気に入りにされた数
  • 本文中に記載されているユーザーの情報
  • 本文中に記載されているハッシュタグ
  • 本文中に記載されているURL
  • ツイートを行ったアプリやサイトの情報
  • ツイートの言語情報
  • ツイートされた日時
  • ツイートに含まれる場所情報

というように一つのツイートでもたくさんの情報を得ることができる。

また、日本人(日本語)のツイートは、ほかの言語によるツイートよりも本文中に含まれている情報量に多様性があるという人もいる。

▼「日本語ツイートの情報量は、世界で2番目に少ないらしい」

http://blog.yubais.net/3.html

 

 

本題:動向を可視化するには

 

Twitterの動向をリアルタイムに表示したい。

あくまで、「Twitterの動向」なので、選挙戦の動向だったり、ある話題についての議論を詳しくは分析しない。(というか参考にならないと思う)

「勢い」であったり「熱量」というような数値化しにくいものをアニメーション化して、表現することを目指す。

 

内容分析までに手を出してしまうと、Twitter中に大量に含まれる「外れ値」的なツイートをいちいち排除する手間がかかる。

例えば…

  • スパム・広告ツイート(話題に関係ないものもある)
  • 単語は含まれているが、まったく意味がないもの
  • いいね、RT稼ぎの「ネタツイート」

APIにアクセスするプログラムを試しに走らせたら、こういうのがたくさん引っかかった。話題性というような視点から見たらOKだが、ちょっと真面目な目的(議論とか)になるとアウトである。

というわけで、ユーザーの興味・関心から発生する「勢い」と「熱量」とに注目して収集・表現しようと思う。

 

 

具体的に何を使うか

ここから(次回から)は、技術的な話。

今回使おうと考えているのは、

Node.js

サーバーサイドで動くJavaScript環境

「twit」というパッケージを使って、StreamingAPIにアクセスし、そこからツイートのデータをJSONファイルとして出力する。

 

openFrameworks

グラフィックスやサウンドを使った創造的なコーディングをするためのツールキット。C++という言語をベースにしている。リアルタイムで画面に描画するために今回用いる。

(あと、大学の演習で結構使ってるので…)

 

じゃあ次回は、具体的な設計(もどき)の方へ…

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

Fill out this field
Fill out this field
有効なメールアドレスを入力してください。

メニュー