【基本】彡(^)(^)と(´^ω^`)で学ぶセイバーメトリクス

Last-modified: 2021-07-24 (土) 21:41:14

基本編ではセイバーメトリクスに疎くても使っているであろう指標、例えばOPSなどについて解説します。

今までの指標の問題点

今までの指標、つまり出塁率や長打率の問題点は何でしょうか?

(´・ω・`)「適正な評価がなされていない、でしょ?」

そうです。例えば出塁率だと四球とホームランが同じ価値で扱われていて、逆に長打率だと四球が全く評価されていません。

彡(゜)(゜)「長打率だけでええんちゃう?だって四球なんておもろないしホームランをちゃんと評価できてるやん。」

いえ、長打率は逆にホームランを過大評価している節があります。毎回満塁ホームランを打つなら別ですが1B:HR=1:4は過剰です。
そもそも単打でも鈍足選手の打つ走者一掃打と俊足選手の内野安打じゃ価値が違いますよね?

彡()()「確かに…」

(´・ω・`)「じゃあどうすればいいの?」

四球、単打、長打それぞれに点数を振り分ければよいのです。

On-base plus slugging(OPS)のメリット・デメリット

メリット

[OPS]=[OBP]+[SLG]

彡(^)(^)「これ知っとるわ!最近やと球場の表示に出る所もあるな!」

(´・ω・`)「でもこれがなんで使われてるの?出塁率と長打率足しただけで何か意味あるとは思えないけど…」

上で述べた通り"四球、単打、長打それぞれに点数を振り分けている"からです。
出塁率、長打率はそれぞれ

OBP...BB:1B:2B:3B:HR=1:1:1:1:1

SLG...BB:1B:2B:3B:HR=0:1:2:3:4

と評価していることがわかりますよね?
分母の違いを考慮せずこれを足し合わせる、つまりOPSにすると

OPS...BB:1B:2B:3B:HR=0.5:1:1.5:2:2.5*1

と評価していることがわかりますね。
これが有効な理由として次のように得点との相関が優位なことが挙げられます。
picture_pc_3f5e5e0b0a3d1f07f53de17e14338a26.png*2

彡(゜)(゜)「これがOPSが使われる理由なんやなぁ…」

デメリット

そもそも現在ではOPSより得点との相関が高い指標がある、という理由もありますが、それは別にOPSにも問題点があります。それは何でしょうか?

彡(゜)(゜)「思ったのはアウトの内容やな。フライアウトとゲッツーじゃ全然価値がちゃうんやしそこも点数化したほうがええんちゃう?」

(´・ω・`)「それにいくら打率や長打率より相関が高いとはいえもっといい係数があるんじゃない?」

そうですね。この"それぞれの打席結果に点数を算出する"という考え方はLinear Weights(LW,LWTS)、線形加重と呼ばれ、OPSもその考え方に基づいています。
それぞれの係数の算出は"その打席結果によって平均してどれだけ点数を増やせたか"に依ります。この係数に使用される数字をRun value(得点価値)と言います。
RVがそのまま係数に使用される訳ではなく、適切な荷重を受けていることに注意しましょう。
2013~2015年の得点価値
image002_0.png*3

ここでOPSとの得点価値を比較してみましょう。

OPS...BB:1B:2B:3B:HR=0.5:1:1.5:2:2.5

RV...BB:1B:2B:3B:HR=0.668:1:1.799:2.556:3.222

これを見てなにか思うことはありませんか?

彡()()「全然係数ちゃうやんけ…ホームランなんてRVやと三塁打程度の価値やし…」

これがOPSの弱点です。いくら相関が高くてもこれでは正確とは言えませんね。

Weighted On-Base Average(wOBA)

wOBA(NPB)={0.692*[NIBB]+0.73[HBP]+0.966×失策出塁+0.865*[1B]+1.334*[2B]+1.725*[3B]+2.065*[HR]}÷([AB]+[NIBB]+[HBP]+[SF])*4

wOBA(MLB)= (0.690*[uBB]+ 0.722*[HBP]+0.888*[1B]+1.271*[2B]+1.616*[3B]+2.101*[HR])/([AB]+[NIBB]+[SF]+[HBP])*5

これがその問題点を改善した指標、"wOBA"です。基本OPSよりも得点相関は高くなります。
また、注意して欲しいのはほぼ毎年係数が変わる事です。これは参照元を見てもらえば分かりますが、その年度によって得点数、RVも変わるからですね。

彡()()「ムズすぎやろ…」

(´・ω・`)「まぁ僕達が計算するわけじゃないし多少はね?」

メリット

断言しますと正確に評価できるのはwOBAです。2019,MLB,規定打席打者のOPS,wOBAのランキングを見てみましょう。
Screenshot_20210724-175603~2.png Screenshot_20210724-175639~2.png *6

彡(゜)(゜)「顔ぶれはあんま変わらへんけど順位はまぁまぁ変わっとるな…」

(´・ω・`)「それだけOPSとwOBAで加重が乖離してるって事だね。」

デメリット

彡(_)(_)「…これ言っていいのか分からんけど…」

彡(゜)(゜)「さっきのrun valueでゲッツーとか三振の価値出したやん。あれどーなん?式見る限りだと特に考慮されてへんけど…」

その通りです。wOBAではその様な価値は考慮されていません。
今は説明しませんが、しっかりとそれを考慮した指標もあります。ここで覚えて欲しいのは「一つの指標だけ見るのは危険」と言うことです。
しかし、それを考えてもwOBAは優秀な指標です。もし選手の詳細なデータを参照できる機会があるならば、OPSよりも詳細なLWTSの使用をオススメします。

weighted Runs Above Average(wRAA)

[wRAA]= (([wOBA]-[league wOBA]/[wOBA scale])*[PA]

これは平均的な打者(リーグ平均のwOBA)に比べてどれだけ貢献したかを表す指標です。

[wOBA]-[league wOBA] 

となっていますので平均的な打者は0となります。

累積指標と比率指標

(´・ω・`)「これってなんの意味あるの?wOBAじゃだめ?」

もちろん、この指標を使うれっきとした意味があります。
打率やOPS,wOBAは比率指標とされており、例えば10打席立った選手と300打席立った選手は往々にして同じ評価を受ける事があります。

彡(゜)(゜)「確かに3ヒット10打席と90ヒット300打席じゃ同じ打率やし、打席結果も同じならOPSとかwOBAも同じになるな」

しかし、wRAAなら打席数も考慮しているので試合に出るだけそれが評価される事になります。

•累積指標は長く出場した際の功徳が反映される

•比率指標は選手の実力がバイアス無しでわかる

上述の通り、使い分けることが大切です。

(´・ω・`)「代打の選手と全試合出場の選手を見比べる時に使えるね。」

その際"どれだけ勝率を上げたか"を表す指標も参考になりますが、ここでは割愛します。