完全自動2chまとめブログ

remix2ch Blog
http://blog.livedoor.jp/remix2chnews/
というのを作った。
バックエンドで定期的に2chのニュース速報板・ニュー速+板・芸スポ板を巡回し、盛り上がっているスレッドを自動的にまとめて投稿してる。


基本はremix2chスクリプト
「レスが付く発言が良レス」という基準でスレッドを自動編集・発言を選別する。
レスが多いほど派手なテキストデコレーションが付くのもremix2ch譲りの機能。


しかし、なんでもかんでもまとめ記事化していては、いくら自動化していてもリソースが足りなくなる。
まとめるスレッドそのものを選別しなければいけない。
そこで、第二の基準。スレッドの瞬間風速(発言数)。
一定時間ごとに各板のsubject.txtを監視して、基準以上のスレッドを調べる。
これは2NNなどが使っている評価基準。


レス数とスレッドスピード。これがGooglePageRankに当たるもの。
この2つを絶対的な評価基準として作っている。


他に、画像の自動キャッシュ&埋め込みシステム、Youtubeの動画URLを検知して埋め込むシステム、>>1のIDを強調表示するシステムなど、一般的なまとめブログで使われるテクニックはすべて自動化処理ができた。


監視スクリプトはcronで定期監視・実行。
まとめた内容は、WSSE経由atompubでLivedoor Blogに投稿する。
自鯖でやるよりも、今回は餅は餅屋にやらせることにした。
自鯖では究極的にはうちのサーバの処理能力や回線速度がネックになるから。


いまのところ非常に良い感じで動いている。
某所では2chまとめブログは横の繋がり(アクセスの流し合い)が大事という話だったが、私はあえてそういうのを無しでやってみようと思う。


スレッド出現から編集・公開までのスピードでは、自動処理に絶対に手動では勝てない。
人力分類だった昔のYahooに対してのGoogleの出現、ぐらいのインパクトを起こせるシステムになれるかもしれない。
なったらいいなあ。元祖2chまとめサイトの管理人としては。