【導入】彡(^)(^)と(´^ω^`)で学ぶセイバーメトリクス

Last-modified: 2021-07-25 (日) 00:07:06

彡(゜)(゜)「…」カタカタ

彡(•)(•)「…」カタカタ

彡()()「…」カタカタ

彡(●)(●)「…」カタカタ

彡(●)(●)#「ア゛ァ゛ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーッッッッッッッッッッッッッッッッッッッッッッッ!!!!!!!!!!!!!!!!!!!!!!!!!!!!!」

(´・ω・`;)「どうしたの…真夜中なのに奇声なんて上げて…」

彡()()「コイツがなぁ!!!!!コイツがワイの松井を馬鹿にするねん!!!!、!!!」

334:名無しさん@おーぷん 11/45/14(土)45:45:19 ID:UNKO
っぱ松井よ
単打なんかで打率稼いでるゴキローはゴミ!w

810:名無しさん@おーぷん 11/45/14(土)81:09:31 ID:INMU
おっ(頭)大丈夫か大丈夫か?w
mvp一度も無い上に何のタイトルも取ったことのない松井の方がゴミだってはっきりわかるんだねw
林修は✝悔い改めて✝

彡()()「ふっフザケンナヨおおおおおおおああああああああああ論破してやるぅぅぅぅ!!!!!!!!!!!!!!!」

(ω)「(こんな下らない理由で発狂してるのか…)」

(´・ω・`;)「で、でもあっちの言い分も一理あるんじゃない?事実タイトルもmvpもないでしょ?ゴジラって」

彡(○)(○)「ファッ!?お前もか!?かっかかかか関係ないやろタイトルとかmbvlzgsysotsypブァァァあああああああ!!!!!!」

(ω)「(本当に発狂してるよ…)誰か詳しい人に聞いてみたら?」

彡(◎)(◎)「そっそれも、そそうやな…ハバ卒190cmタワマン85階住み年収60億のワイとしたことが冷静さを欠いてたわ…」

彡(゛)(゛)「そうなると…あいつに聞くか…」

さとる「話は聞きました。松井がイチローよりも優秀なことを証明してほしいんですね?」

(´・ω・`)「はい…できればわかりやすくお願いします」

でも何故私なのですか?

彡(゛)(゛)「さとるってセイバーメトリクス?に詳しいんやろ?数学的に野球を分析してるとかなんとか」

彡(^)(^)「ほなら正確やろ?レスバの時も適当にさとるの言う事言えば勝てる訳やん」

結論から言うと、確かにセイバーメトリクスを使えば選手の優劣というものを判断することができますが、それが全てな訳では勿論ありません。
セイバーメトリクスと言うのは様々な指標を組み合わせることで一見すると簡潔でわかり易い答え、つまり"数字"を出してる為どうしてもそれが絶対的なもの、つまり数学で言う問の解答の様に思われてしまいますが、実はそうでは無いのです。
様々な指標を組み合わせている以上、一つの結果が一つの因果を示す訳ではなく、色々な過程があってその結果を表します。
それがセイバーメトリクスと言うものなのですが、やはりそれをしっかりと理解していないと数字が少し高いだの低いだのでこの選手はあの選手はと言ってしまいがちです。是非自分で調べて、基礎から学ぶ事をおすすめします。そうすればセイバーメトリクスの意義というのがわかると思いますよ。

彡()()「…(長いし何言ってんのかわからん…なんでこんなに偉そうなんや…)」

(´・ω・`;)「そんな事言わずに是非教えて下さい…」スッ

これは…?

(´・ω・`)「メスショタ画像です、2TB分の」

少し長くなりますが、教えさせていただきます。

松井vsイチロー?

これからセイバーメトリクスの基礎から応用、できれば最新の指標まで解説したいのですが、流石に1からずっとやってると飽きると思います。
なので先に「イチローと松井どっちがすごいか?」についてお話します。

彡(^)(^)「待ってましたァ!」

career fWAR
ichiro 57.8
matsui 13.3

彡(゜)(゜)「これは…?イチローは松井より4倍以上ゴキブリってことか…?」

これはWins Above Replacement(WAR)と呼ばれる指標で、平均的な選手よりどれだけ勝利数を増やしたかを表します。
例えばある選手のWARが-1.7ならば、WAR0の代替可能選手、つまりマイナーリーガーよりも-1.7勝分の貢献をした事になります。
言うなればこの選手はマイナーリーグに落とすべきという訳ですね。

彡(^)(^)「つまり…」

彡()()「全然あかんやん…」

(´・ω・`;)「おかしいなぁ…打撃に関してはなかなか良かったと思うんだけど…」

では次にこの指標を見てください。

career wRAA
ichiro 46.2
matsui 128.4

彡()()「もうええよ…どーせまた松井をバカにするんやろ…?」

これはweighted Runs Above Averageと言って、平均0よりどれだけ打撃で得点を増やしたかを表します。マイナスならそれだけ平均よりも悪い打撃をして得点を相対的に減らした事になりますね。

彡(^)(^)「な~んややっぱイチローってクソだわ!松井神!」

(´・ω・`)「う~ん、でもさっきのWAR?って指標だとイチローの方が良かったよね…何でなんだ?」

ここにセイバーメトリクスの面白さでもあり、怖さでもある要素が含まれています。
今、2つの指標を紹介しましたが、どちらが正しいと思いますか?

彡(^)(^)「そりゃwRAAやろ、名前長いし」

(´・ω・`)「僕はWARかなぁ…勝利数をどれだけ増やしたかでしょ?そっちのほうが総合的に判断できてていいと思うな。」

答えは"どちらも正しい"です。これからもっと掘り下げて行きましょう。

セイバーメトリクスの恐ろしさ

WARの算出方法を知ってますか?wikipediaからの引用*1ですが、こちらをご覧ください。

長いので省略

wRAA(Weighted Runs Above Average)を算出する。
wRAAは、「同じ打席数をリーグの平均的な打者が打つ場合に比べてどれだけチームの得点を増やしたか、または減らしたか」を示す指標[16]。
算出方法は「wOBA[17] - リーグのwOBA) / 1.15 × 打席数」。
2008年のマット・ホリデイは、(.418 - .333) / 1.15 × 623 = .085 / 1.15 × 623 = .0739 x 623 = 46.05(チームの得点を46点増やした) となる。
wRAAにパークファクター補正を加える。
2008年のクアーズ・フィールドは1.126なので、ホリデイの補正wRAAは39となる。
UZR(Ultimate Zone Rating)を算出する。算出されるのは2002年以降に限定される。
UZRは、「同一ポジションの平均的な野手に比べて、守備でチームの失点をどれだけ増やしたか、または減らしたか」を示す指標。捕手の場合には、FRM(ストライクゾーンぎりぎりのボール球を、球審にストライクとコールさせる事により、リーグ平均と比較して何点相当防いだか[18])、rSB(盗塁される数を減らす事により、リーグ平均と比較して何点相当防いだか)、RPP(捕逸や暴投を減らす事により、リーグ平均と比較して何点相当防いだか)が代わりに考慮される[19]。
算出方法はアルティメット・ゾーン・レーティング#算出方法を参照。
2008年のホリデイは9.1(チームの失点を9.1点減らした)。
UZRにポジション補正を加える。
守備位置ごとに要求される守備力の水準や貢献度が変わってくるため、162試合×9イニング=1458守備イニングおきに前述の補正値を加える。
2008年のホリデイは全162試合中139試合(86%)で左翼手として出場したので、9.1 + -7.5 × 0.86 = 約2.7が補正UZRとなる。
UBR(Ultimate Base Running)とwSB(Weighted Stolen Base Runs)とwGDP(Weighted Double Play Runs)を合計した「BsR」(Base Running)を算出する[20]。UBRのデータは2002年以降に限定される。
UBRは、「平均的な野手に比べて、盗塁を除く走塁でチームの得点をどれだけ増やしたか、または減らしたか」を示す指標。
wSBは、「平均的な野手に比べて、盗塁でチームの得点をどれだけ増やしたか、または減らしたか」を示す指標。
wGDPは、「平均的な野手に比べて、併殺阻止でチームの得点をどれだけ増やしたか、または減らしたか」を示す指標。
打席数による補正を加える。
打席数が多いほど、代替可能選手の打席数を減らしたとして評価される。
代替可能選手は600打席につき20得点の損失になると定義し、「打席数 ÷ 600 × 20」で補正を加える[15]。
2008年のホリデイは623打席なので、補正値は約20.8となる。
RAR(runs above replacement)を算出する。
補正wRAA(→2)、補正UZR(→4)、打席数補正(→5)を足し合わせ、代替可能選手に比べて何得点分の価値があるのかを算出する。
2008年のホリデイは、39 + 2.7 + 20.8 = 62.5 となる。
RARをWARに変換する。
ピタゴラス勝率(Pythagorean expectation)により、10RARは1勝分(= 1WAR)に相当する。
2008年のホリデイは、62.5 ÷ 10 = 6.25 となり、代替可能選手と比べて6.25勝の上積みをチームにもたらしたことになる。

彡()()「日本語でおk」

これが恐ろしさの一つ、煩雑さと結果の簡潔さです。式だけ見ても意味不明ですがさっき説明したのでWARの意味自体はわかりますよね?

(´^ω^`)「どれだけ勝利数を、だからわかりやすいね!」

つまり、"中身を理解していなくても表面だけ理解する事ができる"のです。このせいで数字至上主義がインターネットを元に流行ったことがありました。
現在では正しい認識が周知され、またセイバーメトリクス自体が"閉じたコンテンツ"となった為混乱は見受けられませんが…いつ爆発してもおかしくないのです。

彡(゜)(゜)「つまりはしっかり理解する事が大切なんだな。」

(´・ω・`)「でも、wRAAで大勝してる松井がWARではイチローに4倍近くも負けてるってどう言うこと?」

では、こちらのサイトの一番下にある"value"という欄を探してください。
Batting、とありますがこの通算はどのくらいでしょうか?

(´・ω・`)「え~と、これはイチローの記録だね…61.4かな?」

次に、こちらのサイトから同じように通算Battingを見てみましょう。

彡(゜)(゜)「Battingね…120.3やな。」

では、次にそれぞれのBase Running(走塁)、Fielding(守備)を比べてみてください。

彡()()「ファッ!?松井がマイナスなのに対してイチローは圧倒的プラスやん!?」

つまり、そもそも2人は大きくタイプが異なるのです。
イチローは守備、走塁が上手く外野向け。松井は守備が壊滅的なのでDHがあればもっと良い成績を残してたであろう。
ということになります。これで比べようなんて、烏滸がましくありませんか?

WARは総合的な指標です。wRAAは打撃に絞った指標です。都合のいい指標を見たって何もわかりません。せっかく色々な指標があるのだから使いませんか?
運を表すBABIP、守備力を表すUZR、勝負強さを表すClutch、WPA,高精細なカメラとGoogleの大容量高性能なサーバーにのみ算出の許されるexpected指標…
数えていたらきりがありません。是非、一緒にセイバーメトリクスの面白さを探求していきましょう!

このサイトの使い方

自由に読んでいってください。一応順番つけるとしたら上から順に読んでいくことをおすすめしますが、面白さ的には後半のほうがずっと面白いので最初は少しイライラするかもしれません。番外編は本当に思いついたままに書いているので難度にバラツキがあります。
あと見ればわかる通りチラウラリアwikiを間借りしてるので感謝したりfantiaで支援してあげてやってください。