2010年4月28日水曜日

Twitter ストリーミングAPIをgardenhoseで使う

とりあえず,TwitterストリーミングAPIでデータをもっと欲しいので,
gardenhoseに申し込んでみた.
http://twitter.com/help/request_streaming
にアクセスして,名前,所属,E-Mail,URL,申請理由を書くだけ.

登録したら速攻使えるようになりました.
というか,sampleの性能があがって,gardenhoseになりました.
申請理由とか真面目に書いたのに,あんまり意味がない.

で,どのくらいとれるようになったかを確認.
sampleではIDの下一桁が0-4のTweetがとれていたけど,gardenhoseだと下2桁が0-14のTweetが取得出来ていた.およそ3倍の性能と言ったところ.
それでも,全体の15%しかとれない.これが多いか少ないかは難しいところだ.

sampleでは日本語のTweetが秒間6.5個くらいとれたのに対して,
gardenhoseでは日本語のTweetが秒間20個くらいとれた.
ちなみに,計測時間は19:30くらい.
昼間は秒間10Tweetくらいだった.だいぶ差があるなあ.

0 件のコメント: