#偽2ch騒動 KH Coderを用いてひろゆきこと西村博之の発言を見よう

ひろゆきこと西村博之の発言についてデータベースに入れ解析をしようと思います。

2014年4月初頭から2ch.netを追われた西村は2ch.scを立ち上げ自分がすべての権利を持っていると宣言しシステムだけでなく書き込みデータまで許可されていないのにクロールでデータをコピーして運営しています。

残念ながら2ch.scには全くと言っていいほど人が集まっておらず2ch.netはおろか、おーぷん2ちゃんねると比較しても人が全く集まっておりません。

2chとおーぷん2chと2ch.scの投稿数を比較するサイトが作られる – 楽しくないブログ」から「2ch投稿数 比較 (http://kenmo.biz/hikaku/index.php)」が紹介されていました。

20140502-2ch-open-net-sc-hikaku

これは本日(2014/5/2 15:10頃)にとった3サイトの比較図です。おーぷん2ちゃんねるの方が権利者で創始者が運用して2ちゃんねるの権利を主張している西村が管理をしている2ch.scよりアクセスが多いことにちょっと驚きました。

クロールして2ch.netをコピーしなければもしかすると人が集まった可能性はあったとも思うのですが、ユーザーからすると2ch.scでレスしても誰にも反応されないので各メリットがないからかもしれません。

いくら西村が正当な権利を主張しても利用者から見たメリットを提供できない限り2ch.scに人が増えることはないと思いますが、また別の記事でその辺りについては書きます。

西村は2ch.netに対していろいろと仕掛けようとし2ch.scでも攻撃的な発言をしてそれがあたかも本当であるかと思われ心配した方も多いと思います。

以前「#偽2CH騒動 ひろゆきこと西村博之氏 が語る来月にも2ch.netが閉鎖するかもという発言を検証する」でも指摘したとおり彼の願望による発言ではないかと指摘しましたが、彼の書き込みからそれについても検証したいと思っています。

まずは何を書いたか調べてみよう

昨日アップした記事では書き込み数についての報告をしました。実は西村の発言自体は多くないので1日もあればすべてのレスを読めるかなと思います。

ただし、彼は話をコントロールしたり、相手の言い分を全く聞かず話をそらすために話しを変えたりして最初から何が言いたかったんだっけ?もやもやする気分になるのである程度機械的に処理する必要があると思いました。

以前別の案件で分かち書きや形態素解析などのツールを使ってごりごり作ったこともありましたが、その時に目をつけたのが「KH Coder」になります。

このシステムは文書解析に必要な形態素解析で文章を分解することと解析するためにデーターベースにする2つの機能を持っているので今回のような処理をする分にはうってつけのソリューションになると思います。

まずは頻度の高い単語を調べよう

20140501-nishimura-sc.zip」にある以下のハンドルの書き込みをもとに調べました。5月1日の昼までのデータがベースになります。

ハンドル レス数
ひろゆき@どうやら管理人 ★ 622
ひろゆき@てすとくん ★ 86
ひろゆき@テストくん ★ 10
ひろゆき  ppp-58-8-141-162.revip2.asianet.co.th@どうやら管理人 ★ 3
ひろゆき  mx-ll-183.89.61-17.dynamic.3bb.co.th@どうやら管理人 ★ 2

どうやら、管理人とてすとくんではする話を使い分けていそうな気がしますが今のところまだ調べきれていません。他にも西村が使っていそうなハンドルがあればぜひ教えて下さい。

KH Coderでは抽出された言葉の数は簡単に出せます。トップ10だけ表示ます。

抽出語 出現回数
ー。 573
173
思う 143
72
言う 64
使う 59
無い 58
書く 56
作る 55
サーバ 52

”ー。”は西村の癖で文末に書くようです。4月12日は 頻出頻度は .146でしたが、いまではその頻度が大きく落ちています。

4月12日はテンションが高く、勝算があるので元気いっぱいで今はそれほどテンションが上がることもないのでその頻度は低くなったのかもしれません。ただ本題ではないので時間があるときにでも別記事にまとめてみたいと思います。

とりあえず何が言いたかったのか調べてみよう

単語の頻出頻度を見てもその人の書く癖がわかるだけで言いたいことはなにかわかりにくいところもあるかもしれません。

そこで、「共起ネットワーク」で単語同士の結びつきについて見てみましょう。KHcoder-nisimura20140501

この図を見ているとなんとなくですが西村が主張したいことがわかるよううな感じがします。(一応元の書き込みを見ながら書いていますが西村の言い方を理解できていない部分があるので間違った表現になるかもしれません。あとこれはあくまでも事実ではなく彼が思っていることだとお考えください。)

  • 所有権は西村とパケットモンスター社が持つ。
  • 自爆テロの可能性がある、お金の問題が背後にある。
  • 自爆テロではデータとサーバを巻き沿いにする
  • ドメインが譲渡されたのであれば契約書があれば証明できるはずだ。
  • 裁判では法的判断を仰ぐために証拠を出す
  • ネットでは証拠を出す必要がないので出しません。
  • 専ブラに対応するよう専ブラ作者の作業待ち
  • 海外の裁判で闘うことを検討しているので準備が必要
  • ジムとは弁護士を介して話している。弁護士同士のやりとりで返事がないなど問題がある場合はジムとメールしている。(弁護士同士がメールしているのかもしれません)

この辺りについては次回以降テーマを絞って西村が何について言おうとしていたか論じてみたいと思います。

まとめ

今回はKH Coderを使用し始めたばっかりなので基本機能しかしようしていない。次回以降は西村の書き込みを見て彼の発言とその信頼性について検証していきたいと思っています。

2ch.netはお金がないので4月中にでもジムが自爆テロをするかもといっていたのは今思えばそういうことをいうことによって不安になった人が2ch.scに移るかもと思ったのかもしれません。

どちらにしても彼の願望による発言も多いと思うのでかなり疑って彼の発言を聞くことが必要なのかなと思っています。

関連ページ

#偽2CH騒動 本気ではないコピーサイト2CH.SCは定着しないだろう

#偽2CH騒動 について調べてみました。 その1

#偽2ch騒動 調べてみた その2  2014/2/19から4月上旬まで何があったか

#偽2CH騒動 調べてみた その3 何が本当で何が未確定情報なのか?

#偽2CH騒動 まとめサイト問題で2CH.NET運営が対処するべき方法について考えてみる。

#偽2CH騒動 ひろゆきこと西村博之氏 が語る来月にも2CH.NETが閉鎖するかもという発言を検証する

#偽2CH騒動 ●はなぜ流出したのか?を考えてみる。

#偽2CH騒動 情報収集中 情報元について整理

#偽2CH騒動 とりあえずデータの概要だけ

コメントを残す