以前、 パクられてるツイート元をRTするbot( [twitter:@pakurares] )を作った。
特に手を加えることなく今も継続して稼働し続けている。
途中から動作時に多少情報を記録するようにしてたが結局全然使っていなかった。
作ってから一年位経ったことだしせっかくなので暇つぶしにデータを見てみることにした。
データについて
RTする際にその時点でのrt数とfav数を記録している。
なお同ツイートを複数回RTしている場合がたまにあるが2度目以降は記録していない。
基本的に投稿されてすぐのツイートはRTする確率がかなり低く、大体は数ヶ月から数年立っているものが対象になっている。
なので、pakuraresがRTしなかった場合数値はほぼ変動しなかった、というかなり雑な仮定を行うとおおよその効果が見えそうに思う。
統計
4/26時点のRT/fav数から、初回RT時点のRT/fav数をそれぞれ引いた値を計算した。
相当大雑把だが、掘り返したことで新たに加算された値と見ることができる(と思う)
現時点でpakuraresの総ツイート数は2755あるが、
記録し始めたのは途中からなのでデータが有るのはそのうち1635ツイート分になる。
RT | fav | |
---|---|---|
平均値 | 4256 | 330 |
中央値 | 3059 | 92 |
最小値 | -5679 | -1610 |
最大値 | 52867 | 9460 |
標準偏差 | 4575 | 853 |
RT:favの比率
RT数がfav数に比べ思ったよりもかなり多かった。なんとなく 3:1 くらいの比率の印象に思っていたが意外とそうでもないっぽい。
マイナス値
RTした時点よりも現時点のfav数およびrt数が低くなっているものが割とあった。
RT数で負なのは20個、fav数では371個あった。
あんまり後から消したりは普通しないと思うので、アカウントが消えたことで減少しているっていうのが主要因な気がする。
ただ、ここではfavがRTの値に比べやけに多い。複数アカウントでfav数水増ししているようなアカウントをtwitterがどんどん潰していってるっていうことなんだろうか。わからん。
全体として
botの効果として100程度伸びてくれたら御の字かなと思って作ったのだけれども、想定とは大分桁が違っていた。よいことだ。
しかし仮定の雑さが現れているだけとも読めなくはない。
誤検出について
パクころ をベースに処理しているので、検出は当然完璧ではない。
本当のオリジナルじゃないものをRTするとおかげさまで誰かしら親切な方が指摘してくれる。これのお陰で結構助かっており、誤検出の訂正が行えるのはほぼ全てがこの情報提供によるものである。
オリジナルの情報付きで教えて貰えた場合はそれをRTし、オリジナルでないが元ネタは不明って情報の場合は自力で探している。
どっちにしても、もらった情報には星をつけているので、pakuraresのお気に入り数が大体の誤検出数にあたると思う。
現状のツイート数2755に対してお気に入り数が73だったので、大体 2.6% 程度と思われる。
思ったよりは結構低いが、それでもそこそこミスっているとも取れる値なので、何か対処が打てれば良さそうに思う。が、思いつかないので保留。
人力での元ネタ探しについて
以下のステップで確認している。そんなに大した手間は掛からず数分で済むのでやってみて欲しい。
- パクころ - 検索 : に特徴的なワードを入れて収集済みのツイートに類似の文面が無いか
- 特徴的なワードをGoogle検索し、検索ツール>期間指定 から終了日に疑惑のツイートの日時を指定し、より古いものはないか
- ツイートの画像URLをGoogle検索し、画像で検索 のモードにした上で日時指定して古いものはあるか
RT数増分
どんな感じのが伸びたのかを貼っていく。
10000以上伸びてたのは130個、1000以上伸びてたのは1285個あった。
1位
RT | fav | |
---|---|---|
RT時点 | 7423 | 7423 |
現在 | 60290 | 12272 |
増分 | 52867 | 4849 |
パクころ - パクリ詳細 : 467485894052573186
最近宅配で送り状が濡れて文字見えないから確認したいって不審電話相次いでるみたいなので。写真は試しにヤマト運輸の伝票を30秒水に浸してタオルでごしごし拭いたもの。伝票はカーボン複写だから水に強いよ。連絡先聞きたがる電話にはご注意を。 pic.twitter.com/scE8xpsS68
— ユチカ (@d0v0ib) 2014年5月16日
2位
RT | fav | |
---|---|---|
RT時点 | 29848 | 29848 |
現在 | 79950 | 35195 |
増分 | 50102 | 5347 |
パクころ - パクリ詳細 : 372324956253589504
妹が7年間ためた梅ねりの袋を並べてる。ギネスを目指してるらしい。 pic.twitter.com/1AG70Zr5Qu
— 北原 (@kitaharatakeru) 2013年8月27日
3位
RT | fav | |
---|---|---|
RT時点 | 18632 | 18632 |
現在 | 53901 | 18608 |
増分 | 35269 | -24 |
パクころ - パクリ詳細 : 498135114530824193
ちなみにコミックマーケットにおけるエロの割合は全体の二割です。少ないなと感じた貴方、これが現実なのです。貴方はたった二割のエロのみに向かっている故に気付かないのです。ちなみに追記しますが、一般向けは全体の三割です。じゃあ残りの五割は何なんだですって?ホモです。
— ヴェクトル (@vektria) 2013年8月10日
4位
RT | fav | |
---|---|---|
RT時点 | 40933 | 40933 |
現在 | 73997 | 43731 |
増分 | 33064 | 2798 |
パクころ - パクリ詳細 : 488900649086484481
ラーメン屋でうずら多めで4つにしよ!と思ったら、一枚で5個と知った今。 pic.twitter.com/ZcLpoBFQej
— イマクニ? (@imakuni) 2014年7月15日
5位
RT | fav | |
---|---|---|
RT時点 | 12982 | 12982 |
現在 | 45852 | 15440 |
増分 | 32870 | 2458 |
パクころ - パクリ詳細 : 455908776722178048
お偉いさん「データ移動にUSBメモリを使うのは、ウイルス混入の危険があるからNG。でもCD-Rに焼くならいいよ。」
— オノッチ (@onotchi_) 2014年4月15日
自分「何が違うんですか?」
お偉いさん「焼いたらウイルスも死ぬでしょ。」
自分「ほう」
_人人人人_
> 初耳 <
 ̄Y^Y^Y ̄
fav数増分
3000以上伸びてたのが25個、1000以上伸びてたのは157個。
1位
RT | fav | |
---|---|---|
RT時点 | 14339 | 14339 |
現在 | 33471 | 23799 |
増分 | 19132 | 9460 |
パクころ - パクリ詳細 : 451299782598721536
「ファン」は度が過ぎると「評論家」になってしまって、最初の頃の、ただ楽しむことを忘れがちになってしまうのです。「こうすればいいのに」「これはらしくない」「こういうのみたくない」結構多い。し、自分がそうならないようにしないとなあって、大好きなものへの姿勢を時々かえりみるです。
— ハコファクトリィ (@hakofac) 2014年2月26日
2位
RT | fav | |
---|---|---|
RT時点 | 9383 | 9383 |
現在 | 33134 | 18752 |
増分 | 23751 | 9369 |
パクころ - パクリ詳細 : 344433191278501888
画像認証にすらバカにされる人生だった pic.twitter.com/t0yjMFYn3s
— 👑手首⭐️🎵🦄卍㍇界隈卍 (@a899haru) 2013年6月11日
3位
RT | fav | |
---|---|---|
RT時点 | 7682 | 7682 |
現在 | 20028 | 15873 |
増分 | 12346 | 8191 |
パクころ - パクリ詳細 : 484465161017647104
駅で。
— すくらった (@skrattaochsmile) 2014年7月2日
小学生の女の子「ねぇ」
僕「はい」
女の子「あそこでティッシュ配ってるでしょ」
僕「うん」
女の子「もらってきて」
僕「??」
女の子「もらってきて!」
僕(もらいにいく)
女の子「あはは!もらった!大人があたしの命令を聞いた!!あははは!(興奮)」
僕(興奮)
4位
RT | fav | |
---|---|---|
RT時点 | 5010 | 5010 |
現在 | 18425 | 12940 |
増分 | 13415 | 7930 |
パクころ - パクリ詳細 : 457490024351547392
単位の取り方と落とし方をわかりやすくまとめた。 pic.twitter.com/tkK03x8ONn
— 否み (@inami4) 2014年4月19日
5位
RT | fav | |
---|---|---|
RT時点 | 6943 | 6943 |
現在 | 13994 | 14591 |
増分 | 7051 | 7648 |
パクころ - パクリ詳細 : 497367349356281856
今日も仲良くティッシュ箱(笑)
— うり (@ginzuratvxq) 2014年8月5日
すっかりお気に入り(*^^*) pic.twitter.com/7G6xEmnHg5
その他
上記は元々伸びていたやつが掘り返しにより更に再燃した感じである。では埋もれていたものに対する効果はどうか。
初回RT時点でのRT数が400以下のものからの増加率の高いものからいくつか見てみた。
良い例1
RT | fav | |
---|---|---|
RT時点 | 304 | 304 |
現在 | 4941(16.3倍) | 2188(7.2倍) |
増分 | 4637 | 1884 |
パクころ - パクリ詳細 : 292424545040756736
新人のバイトさん「えー、私もJOJO超好きなんですよー!絶対私の方が詳しいですよ!なにか賭けます?w」
— Rei (@AdderRei) 2010年8月17日
俺「魂を‥‥賭けよう‥!」
新人さん「えーwなんですかそれおもしろーいww」
俺( ゚д゚)
良い例2
RT | fav | |
---|---|---|
RT時点 | 350 | 350 |
現在 | 3425(9.8倍) | 444(1.3倍) |
増分 | 3075 | 94 |
パクころ - パクリ詳細 : 227322315627696128
おっぱい大きい子が好き!尻がでかい女は嫌!ウエストは58cm!体重は45kg以下でおっぱいはEカップ以上!と言ってる男は「理想の結婚相手はイケメンで年収1000万以上の2~30代!私は働きたくないです!年収500万以下とかぞっとします!」って言ってる女ぐらい無謀だと思った方がいい
— 神様と新米を作る暮(くれ) (@kure0326) 2011年7月20日
良い例3
RT | fav | |
---|---|---|
RT時点 | 397 | 397 |
現在 | 3604(9.0倍) | 3044(7.7倍) |
増分 | 3207 | 2647 |
パクころ - パクリ詳細 : 399376423804076032
僕等は ちんこ 出している
— P子 (@peeko777) 2013年11月10日
出しているから 寒いんだ
僕等は ちんこ 出している
出していたから 風邪ひいた
この陰茎 民衆に 晒してみれば
真っ赤な パトランプ 僕は御用
ミミズ だって
おけらだって
ミツバチだって
みんな みんな 服は着ないさ
何故俺だけが
悪い例1
RT | fav | |
---|---|---|
RT時点 | 322 | 322 |
現在 | 5642(17.5倍) | 391(1.2倍) |
増分 | 5320 | 69 |
パクころ - パクリ詳細 : 288250656681230338
神戸市が「氏名」を禁止用語にすると検討している事を、もう一度伝えます。事の発端は、韓国人が神戸市に対して「氏名」は氏を持たない韓国朝鮮人への差別だと言い出し、神戸市に圧力を加えたそうです。これに神戸市は「氏名」を禁止用語にすると検討。日本の中で日本人が日本語を規制される時代です。
— 倉橋 晴信 (@japan2020) 2011年10月1日
この件についてざっとGoogle先生に伺うと、文字の強調とかが大好きな感じのテンション高めの記事ばかりが出てきて冷静な情報が見つからず、かなり煽り感が高いが、少なくとも 神戸市のサイト を見ると現時点では普通に氏名という表記が使われている。
3年も4年も前の情報である上に眉唾ワード大集合みたいな感じにも関わらず大幅にRT数が伸びており、誰も日付をろくに見ていないことが分かる。
そもそもこれをパクっている人がいるのが謎だ。
悪い例2
RT | fav | |
---|---|---|
RT時点 | 359 | 359 |
現在 | 5657(15.8倍) | 3549(8.0倍) |
増分 | 5298 | 3190 |
パクころ - パクリ詳細 : 515080312867409920
×接客業をすると人に優しくなれる
— ΛCE (@NEETCRUTENDER) 2014年9月24日
○接客業をするとそんなんで今までよく刺されずに生きてこれたなっていうレベルのマジキチが割とゴロゴロしてるのでちょっとやそっとの事では動じなくなり、多少の無理難題くらいなら笑顔で対応出来るようになる。
このツイートと別に以下のようなツイートがある。
×接客業をすると人に優しくなれる
— 市井ニノ (@1i2no) 2014年9月23日
○接客業をすると世の中には自分が想定するより遥かに度を超えて意味の分からないマジキチクレーマーがいると知り対処できる振り幅が大きくなるので多少性格やらに難がある位なら意思疎通ができるだけ上出来だと思えて許容できる様になる
偶然にしても内容の構成がかなり似通っており、より強い単語に書き換えただけに見えなくもなく、オリジナルとしてはかなり黒いラインではある。
検出アルゴリズムの都合上、完全なパクリでないこういうものまでは検出出来ないのでこんなケースも起こりうる。
おわりに
twitterにコメント付きリツイートが付いた。
要はpermalinkをただ貼るだけで良いので、これを使えば既存のbotツール自体に手を加えなくても似たようなことは出来ると思う。
また、公式RTを使わないにせよ、出典が辿れるということが重要であると思う。
Twitter / Account Suspended
はpixivの画像で構成されており、全てリンクが付加されているのでシンプルかつ誰も損しない良い手法である。
公式RTを使用するbotが増えてくれればと思っていたが一年経った今もその兆しは無いように見える。
丸パクリを自分のアカウントで流すのに比べ、RTばかりしているアカウントを見つけること自体がかなり難しいので、自分が発見できていないだけなのかもしれないが、少なくとも自分の観測範囲では見つけられなかった。
周知が難しいとはいえ、上記に示したようにある程度の効果は収めることが出来てるっぽいので、もっと作ると良いと思う。
botのアカウントから手動で紹介しようと思うので良い感じのがあったり作ったりしたら教えて欲しい。