연예인 평균자책점의 맹점과 투수의 세이버스탯+펨탯 수정판(feat.김강률) [18]

페이지 정보

작성자 댓글 0건 조회 14회 작성일 24-07-12 12:02

본문

desktop-wallpaper-choi-yena-album-cover-shooting-of--yena-smiley.jpg 평균자책점의 맹점과 투수의 세이버스탯+펨탯 수정판(feat.김강률)
우선 보면 기분이 좋아지는 사진부터 보고 시작


ERA.
평균자책점은 가장 대중적인 투수의 비율 스탯이다.

가장 대표적인 투수의 클래식스탯은 다승,평자,Whip 가 존재하는데,이들은 방송사 화면에도 제일 많이 띄워주고 네이버 기록실 메인에도 걸려있다.

모든 야구팬들이 알겠지만,저 3개중 쓸데없기로 소문난 스탯이 하나 있다.

바로 다승인데, 이 승리투수란 기록은 맹점이 너무나도 많다.아무리 잘던져도 팀 불펜과 타선의 도움이 필수적이어야만 얻을 수 있는 스탯이기에 다승만으로 선수의 실력을 평가하는 야구팬은 단 한명도 없다.

그에 반해 ERA와 Whip는 투수 본연의 능력을 조금더 설명한다.일단 저 두 스탯은 팀 타선의 영향은 받지 않는다.그리고 투수가 실제로 못한 부분인 "자책점"과 "출루허용"에 초점을 둔 스탯이기에 투수의 스탯 중 다승보다는 훨씬 나은 스탯이다.

무엇보다 ERA는 아주아주 직관적이다.이 선수가 9이닝동안 던지면 평균 몇점 주는지를 말하고 있기 때문이다.

한마디로 타율처럼 이해가 편하고, 그에 따라 가장 대중적인 투수의 비율 스탯으로 자리매김하고 있는 것 이다.

필자 역시 야구를 가볍게 보고 이런 숫자놀음보다 직관을 즐기는 것을 선호하는 등 라이트팬이라면 ERA와 탈삼진 정도만 보고 투수를 평가해도 큰 문제가 없다 생각한다.

ERA는 그 직관성 대비 투수 능력 설명력이 뛰어난 편이기 때문이다.

다만 필자가 이 글을 쓰는 이유는 그런 라이트팬보다 야구를 좀더 딥하게 보고 숫자놀음을 사랑하는 변태들이 즐거운 숫자놀음을 하길 바라는 것이기에...

지금부터 ERA에 대한 비판을 해 보겠다.

20240219503080.jpg 평균자책점의 맹점과 투수의 세이버스탯+펨탯 수정판(feat.김강률)
현역 최고 수준의 KBO 선발 통산 ERA를 유지하고 있는 류현진.

1.자책점과 비자책점 간의 경계

평균"자책점"이란 용어에서 보이듯 ERA의 계산은 자책점만을 갖고 이루어 진다.실책으로 인한 출루는 자책점에 포함되지 않는다.문제는 이 실책 여부가 기록원의 재량에 달려 있다는 것이다.즉 똑같은 실책"성" 플레이더라도 이 기록원은 실책으로 기록하고,저 기록원은 내야안타로 기록해 차이가 있을 수 있다는 것이다.

2.야수진의 수비 능력

어떻게 보면 1과 연결되는 문제로,팀 야수진의 수비능력 차를 많이 받는다.대표적인 예시를 보자.

Screenshot_20240712_010442_NAVER.jpg 평균자책점의 맹점과 투수의 세이버스탯+펨탯 수정판(feat.김강률)
이는 세인트루이스 카디널스의 포수가 야디어 몰리나였을때 평균자책점과 팀 전제 평균자책점을 비교한 것이다.
몰리나는 MLB 최고의 수비형 포수로,블로킹과 프레이밍,게임 콜링과 도루저지가 모두 리그 최상위였다.

즉 이렇게 안정감 있는 수비수가 있으면 ERA가 유의미하게 좋아진다.

3.구원진의 차이

오늘의 주인공인 김강률에게 대표되는 문제.
책임주자라는 개념으로 인해 장작을 잔뜩 쌓고 내려가도 후속 투수가 잘 막으면 ERA가 유지되고,후속 투수가 몽땅 분식회계 한 뒤 3아웃을 잡으면 그전 투수의 ERA만 올라가고 후속투수의 ERA는 올라가지 않는다.
이로 인해 특히 불펜투수에게서 체감과의 괴리가 커지게 된다.

4.구장과 시대간 비교의 어려움

타율과도 비슷한 문제로,구장/시대간 차로 발생하는 노이즈를 잡을 수 없다.
라팍과 잠실에서 나오는 득점빈도는 분명 차이가 있다.
잠실을 홈 구장으로 쓰는 타자들이 라팍타자보다 홈런 수에서 명확한 손해를 보기 때문이다.
홈런은 안전진루권이 보장되어 가장 확실한 득점 루트고,특히나 뜬공 투수들은 잠실에서 이득을 볼 것이다.

시대보정 역시 문제다.
18시즌의 탱탱볼 시즌에는 무려 9개 팀이 4.9이상의 팀 ERA를 기록했다.가장 ERA가 낮던 팀인 SK도 4.67.
반면 19시즌엔 단 한팀도 4.9 이상의 팀 ERA를 기록하지 않았으며,가장 ERA가 낮던 팀인 SK는 3.48의 팀 ERA를 기록했다.똑같이 ERA 4.9를 기록한 투수라도 18시즌엔 평균치는 해주는 선수,19시즌엔 유사야구선수가 되는 것이다.



그럼 지금부터 ERA를 대체할만한 스탯을 알아보자.

1.FIP

gmbrszdeddaqsipbxuam.jpg 평균자책점의 맹점과 투수의 세이버스탯+펨탯 수정판(feat.김강률)
2021시즌 최고의 FIP를 기록한 코빈 번스.

수비무관 평균자책점이라 불리는 FIP다.
위 문제중 1,2,3을 해결하려 했던 스탯.

이 수비무관 평균자책점이란 것은 DIPS 이론에서 출발하는데,DIPS가 무엇인지 간단하게 알아보자면
649e0cb20703d2738245.jpg 평균자책점의 맹점과 투수의 세이버스탯+펨탯 수정판(feat.김강률)
2023시즌 MVP 페이스를 달린 페디나
NISI20210429_0017401163_web.jpg 평균자책점의 맹점과 투수의 세이버스탯+펨탯 수정판(feat.김강률)
2023시즌 최악이었던 박종훈이나

공이 배트에 맞아 인플레이가 된 후엔 안타가 될 확률이 엇비슷하다는 것이다.

즉 저 둘의 성적 차이는 애초에 인플레이를 허용하지 않는데 있다는 이론이다.

그래서 아예 인플레이를 빼버리고 투수 본연의 능력인 삼진-볼넷(+데드볼)-홈런만으로 계산한 것이 FIP다.

다만 이 FIP는 큰 문제가 있었는데,
전제로 잡은 "공이 배트에 맞은 뒤 안타가 될 확률은 에이스나 유사 투수나 비슷하다" 라는 이론이 틀린것으로 밝혀졌기 때문이다.

현재 연구에 따르면 30%정도는 인플레이 된 후에도 "투수의 구위"로 약한 타구가 만들어진다던지 해서 안타확률 억제가 가능하다는 것이 밝혀졌다.

그럼 이 스탯을 만들었을땐 왜 그걸 몰랐느냐?
이 스탯을 만들었을때 리그 최고 에이스였던 랜디존슨과 페드로 마르티네즈 등의 기록이 우연의 일치로(...)패전처리급 투수와 인플레이 타구 타율이 동일했기 때문이다.

물론 이렇다 해서 FIP는 아무데도 쓸데없다라는것도 잘못된것이다.연도별 상관계수 지표를 보면 FIP의 정확도가 ERA보다 매년 10%p이상 높게 나오기에 투수능력 설명력은 FIP가 확실히 더 높다.
일단 30%정도를 투수능력으로 억제할수있다는 것은,
70%정도는 운의 영역이라는 의미이기 때문이다.

즉 요약하자면 ERA는 수비의 노이즈가 껴있더라도 그냥 멀쩡한 정보는 전부 보자는 느낌이고,FIP는 그 노이즈를 제거하다 멀쩡한 정보를 제거하더라도 노이즈가 꼴보기 싫어서 없애야겠다는 느낌이라 보면 된다.

그래서 필자 역시 단독으로 FIP만 보는 것은 추천하지 않는다.만약 한두시즌 기록을 보는 등 샘플이 적을때는 FIP를 우선으로 보고,통산 기록을 보는데는 ERA를 추천한다.
통산 기록 수준으로 데이터가 쌓이면 수비에 대한 노이즈가 상당부분 걸러지고 평균회귀한다고 보기 때문이다.

2.ERA+,FIP+

413fc028e0c1a287e8323ef4081b597b506b2029fff7a5b553f24a9ae96be93fd4d48bfcb0abb2d027d1ad7ae477db73e56ef62dfb771bf9d8bd5de373bbdbcad1c93c332ed8c3334c0be6425e4e674e93df20d876917a398d6ea30f8cdf96dc6b8a.jpg 평균자책점의 맹점과 투수의 세이버스탯+펨탯 수정판(feat.김강률)
메이저리그 역대 선발투수중 최고의 ERA+기록을 가진 클레이튼 커쇼.

야구 스탯에서 뒤에 +가 붙으면 조정을 거쳤다는 의미다.
OPS+도 그렇고,친숙한 wRC+도 그렇다.
이 조정은 구장 조정과 리그 평균 대비 스탯을 보정해준다.즉 이것은 평균자책점의 문제중 4번을 해결한 스탯이다.보는법도 wRC+와 같다.
100이 리그 평균이며,110이면 리그평균대비 10%좋은 성적,90이면 리그평균대비 10%나쁜 성적이다.

그렇지만 근본이 ERA와 FIP기 때문에 태생적으로 ERA의 1,2,3번 문제,FIP의 태생적 문제를 안고 있다.
따라서 필자는 ERA와 FIP의 관계처럼 ERA+는 통산,FIP+는 한두시즌으로 보는것은 추천한다.

이와 비슷한 스탯으로 ERA-와 FIP-도 있는데,이건 반대로 낮을수록 좋은 스탯이다. 마찬가지로 리그 평균은 100.
사실 이게 먼저 나온 스탯인데 우리 머릿속엔 막연히 높을수록 좋다는 이미지가 있어서...높을수록 좋은 +로 바꾼 것이다.

3.xFIP

2HGIPATGBBNPLMVKH7BCCQVZKE.jpg 평균자책점의 맹점과 투수의 세이버스탯+펨탯 수정판(feat.김강률)
이번 시즌 상당히 좋은 xFIP를 기록중인 선발투수 타일러 글래스나우.

xFIP는 기대 수비무관 평균자책점으로,야구에서 가장 효과적인 아웃인 탈삼진에 가중치를 둔 FIP를 수정했다.
플라이볼 비율을 이용해 실제 피홈런보단 기대 피홈런을 계산해 넣는다.

즉 게릿 콜과 같은 공격적으로 승부해 삼진 많이잡는 선수들이나 땅볼형 투수에게 유리하고 뜬공형 투수에게 불리하다.FIP의 문제점인 큰 표본에서 정확도가 떨어지는 문제점을 그대로 갖고 있으나 작은 표본에선 정확도가 더 높다.무엇보다 투수 본연의 능력만을 고려하기 위해 운을 최대한 쳐냈기에 분식회계도 잡아낼수 있다.

비슷한 스탯으로 xERA가 있는데,
이건 아직 크보에서 제공되고 있지 않다.
기대 평균자책점으로 기대 가중 출루율을 이용해 계산한 스탯이다.좋은 스탯이지만 아직 필자가 만든 기록 계산 툴인 펨탯티즈에도 포함되지 않았기에...생략하겠다.

4.SIERA

_cSrGlHjjmhvUjvDJKJ2z-GCxkfEsyykHd9h27lAzg7auQjV-TF-AmwzzrdI-Tm7Icbna1qIkEY9uta3zFIq-PGuRpTWtxQ1IN7jqCm5-M_cXsIFwjkYeQ_JSYDj7XuWB0InfalcuYv10mKAg27v2w.webp.ren.jpg 평균자책점의 맹점과 투수의 세이버스탯+펨탯 수정판(feat.김강률)
그냥 넣고 싶어서 넣어본 다니엘 바드.

우선 공식을 보자.
SIERA = 6.145 16.986*(SO/PA) + 11.434*(BB/PA) 1.858*((GB-FB-PU)/PA) + 7.653*((SO/PA)^2) +/ 6.664*(((GB-FB-PU)/PA)^2) + 10.130*(SO/PA)*((GB-FB-PU)/PA) 5.195*(BB/PA)*((GB-FB-PU)/PA)

더럽게 복잡하지만 계산 툴 있으니 상관없다.

이것은 다음시즌 성적을 예상하기 위해 만들어지긴 했는데,순수히 투수 실력만을 뽑아내려고 용쓴 스탯이다.
ERA의 문제점 1,2,3,4를 거의 해결했다.

이것도 표본 변화시 오차가 있어 완벽한 스탯은 아니지만,야구에 완벽한 스탯이 없다는 것을 생각하면 특히나 투수스탯에 완벽이 없음을 생각하면 그나마 완벽에 가장 가까이 다가간 스탯이라 생각한다.

투수의 현재 기량만을 뽑아냈다는 것에서 볼만하다 생각하며 필자도 이런 스탯들에 관심이 있다면 볼것을 추천하는 스탯이다.

이렇게 투수 스탯을 알아보았으니 오늘의 주인공 김강률에 대해 알아보자.

ERA로 표현되지 않는 김강률의 실력

NISI20220420_0018719084_web.jpg 평균자책점의 맹점과 투수의 세이버스탯+펨탯 수정판(feat.김강률)

우선 김강률의 현재 스탯을 보면

Screenshot_20240712_090406.jpg 평균자책점의 맹점과 투수의 세이버스탯+펨탯 수정판(feat.김강률)
(필자가 만든 펨탯티즈를 이용해 작성된 칼럼인 너드좌님의 칼럼 중 김강률 스탯 파트)

ERA로 보면 1.62, 특급 불펜이다.

하지만 대다수 두산팬들은 "김강률은 그정도가 아니다" 라고 말한다.이유는 앞 투수의 승계주자만 실점하고 본인이 남긴 승계주자는 뒷 투수들이 막아줘서 ERA가 저렇게 낮다는 것인데,자세히 알아보도록 하자.

우선 Whip다.
이번시즌 김강률의 whip는 1.67이다.
필자는 장타력을 포함하지 않아 whip를 그다지 좋아하지 않지만,출루하나하나가 치명적인 구원투수의 경우엔 whip도 충분히 볼만한 성적이라 생각한다.

1.67이면 1이닝당 주자 1.6명,2이닝당 3명정도를 출루시킨다는건데 이정도면 승계주자가 1루에 1명만 있어도 상당히 높은 확률로 실점한단 의미다.

오늘 필자가 추천한 스탯인 SIERA와 xFIP를 보면 가관이다.4.90과 4.98로 맛이 가 있다.

즉 김강률은 당장 본인의 책임주자들은 잘 지켜 내서 ERA는 훌륭하지만 경기 내용은 전혀 그렇지 못한 것이다.

1592919088358961.jpg 평균자책점의 맹점과 투수의 세이버스탯+펨탯 수정판(feat.김강률)


즉 김강률의 실제 성적은 절대 필승조급이 아니라고 평할 수 있겠다.K/9와 BB/9역시 좋지 못하다.
"확실한출루"볼넷을 줄이고 "확실한아웃"삼진은 늘려야 하는 구원투수로서 좋은 점수를 주기 어렵다.

이렇게 투수 스탯에 관해 알아보았다.

요약하자면

1.가볍게 볼거면 ERA만 봐도 된다.
2.딥하게 볼거면 SIERA와 xFIP를 추천한다.
3.다른 세이버스탯도 참고자료로 볼만한게 많다.

다른 궁금한 스탯이 있다면 댓글로 질문 ㄱㄱ
(WPA는 아직 스탯티즈의 측정이 부정확하고 산술적 승리확률만 계산하는 스탯이라 뺐다)

+오늘 지속적으로 언급된 펨탯티즈는 필자가 만든 세이버메트릭스 계산 툴이다.

직접 사용해보며 기록을 확인해보고 싶은 사람은 아래 링크로 가서 엑셀 파일 다운로드 ㄱㄱ


이건 그놈의 wRC+ 튀는 문제도 수정한 버전임

댓글목록

등록된 댓글이 없습니다.

Total 712,277건 11 페이지
커뮤니티 목록
번호 제목 글쓴이 조회 날짜
72036 연예인
푸히헤헤햏ㅎ
2 23:13
36198 연예인
쿠로
0 23:11
64519 연예인
고기먹는스님
0 23:06
26776 연예인
푸히헤헤햏ㅎ
0 23:03
88324 연예인
고기먹는스님
0 22:59
85281 연예인
쿠로
0 22:56
46276 연예인
쿠로
0 22:55
25759 연예인
쿠로
2 22:55
95791 연예인
고기먹는스님
0 22:55
93466 연예인
고기먹는스님
0 22:40
38614 연예인
쿠로
0 22:39
40220 연예인
푸히헤헤햏ㅎ
0 22:38
28425 연예인
쿠로
0 22:37
79958 연예인
푸히헤헤햏ㅎ
0 22:36
67937 연예인
고기먹는스님
0 22:35
게시물 검색