平昌五輪男子シングルフリーでのジャッジの逸脱度について

 こんにちは。最近こんなニュースが話題になりましたね。

https://www.isu.org/communications/17362-isu-communication-2174/file

 平昌オリンピックでの中国ジャッジがジャッジの規定違反で二年のジャッジ停止、北京五輪での審査から閉め出されるなど、厳しい処分を受けたようです。

 調査詳細も出てました。

https://isu.org/communications/17361-case-2018-06-isu-vs-chen/file

 リンク名、ISU VS CHENってw(CHENは今回のジャッジの名字)

 

 平昌後、男子シングルFSジャッジのナショナルバイアスがひどいって話題になっていたなあとは思いましたが、実際に処分が下るとびっくりしちゃいますね。

www.buzzfeed.com アメリカのbuzzfeedでの批判記事。この記事で槍玉に挙げられているのは、中国ジャッジとアメリカジャッジです。中国ジャッジはボーヤンにSPで平均より10.7点高い点数、FSで25.0高い点数をつけ、アメリカジャッジはFSでリッポンとネイサンにそれぞれ11.6点、11.5点高い点をつけたとのこと。

 

 では、今回の件、一体どういう基準で処罰がくだされたのでしょうか?

 ジャッジの規定はISUコミュニケーション1631号に書いてあるみたいです。スケ連のページに邦訳がありました。とてもありがたい。

https://www.jsfresults.com/data/fs/pdfs/comm/comm1631j_p2e.pdf

 

 ただこれ、最新のものはISU1893号みたいですね。

https://www.isu.org/communications/312-isu-communication-1893-2/file

 冒頭に「This Communication replaces ISU Communication No. 1631 with immediate effect」とあるんで、多分こっちのほうが新しいと思うんですけど、邦訳がない…。

 とにもかくにもこちらの資料の、H)Criteria for the identification of cases of evaluation in the Judges’ GOEs and Program Components marksというところによれば、ジャッジがつけた得点から「逸脱度」というポイントを計算し、それが有る一定以上の数値になると、異常な審査結果としてチェックが入るようです。

 

 なんだそれ、面白そうじゃん、ということで、平昌五輪のフリー採点においての、ジャッジの逸脱度を計算してみました。

 資料に書いてあるとおり、逸脱度には2つあって、一つはGOEの逸脱度、そしてもう一つは5コンポーネンツの逸脱度です。どちらも審判がつけた点数が、全体の平均からどれだけ離れているかを見るものなんですが、その「平均」が曲者なんです。ジャッジがつけた点数だけではなく、レフェリーがつけたものも入れるみたいなんですよね…。うーん、ジャッジの点数しか公表されていないので、計算できないなあ。諦めるか!

…というわけにもいかないので、今回はジャッジの点数の平均だけから計算しようと思います。なので正確な値にはならないです!あしからずご了承ください。

 

(1)GOEの逸脱度

 GOEの逸脱度は、以下のように計算されます。ISUコミュニケーションズ1631と1893で大きな変更がないようなので、1631の邦訳から引用しますね。

a) 要素部分の採点(GOE)
i)  演技された各要素、セクションごとに、コンピューターがGOEの平均点を計算するが、その中にはパネルの全ジャッジの採点とレフェリーの採点とが組み込まれる。パネルが7人以上のジャッジで構成されている場合には、レフェリーの意見に大きなウエイトを置くために、レフェリーの採点を2倍とする。
OACの評価の為に集計される平均点は、競技結果(演技の順位決定の範囲で)としてこれまで使われていた刈り込み平均の結果とは同じではないという点に注意されたし。


ii) 各ジャッジの採点に対して、コンピューター・プログラムは当該要素の平均点との逸脱を計算する。
一つの要素でのジャッジの採点における逸脱は、ジャッジにより入力されたGOEと当該要素のGOEの平均点との差の絶対値(すなわち正の値)であり、ここでは「逸脱度」と呼ばれる。全要素における逸脱度は、2つの個別の合計に分けられる。すなわちプラス部分の逸脱度とマイナス部分の逸脱度である。

 ジャッジがつけたGOEと、GOEの平均値の差をそれぞれのエレメントで算出し、その絶対値を足し合わせる、という方法です。

 例えば平昌五輪FSでの羽生さんの演技におけるJ4ジャッジ(日本ジャッジ)の場合、1つ目のエレメント4SでGOEは+3をつけています。全ジャッジが4SにつけたGOEの平均値(実際にISUが計算に使っている平均値はこれにレフェリーの点数が入ってきます)が2.89なので、逸脱度は0.11となります。

 これをそれぞれのエレメントで算出し、足し合わせて総逸脱度を計算します。

 ちなみに私の計算によれば、J4ジャッジの羽生選手FSでのGOE逸脱度は、プラスの逸脱度が4.33、マイナスが-0.33、総逸脱度は4.67です(小数点以下も計算に入れてるのでこうなります)。

 

 逸脱度が異常とされる基準は、ISUコミュニケーションズ1631号によると以下のとおりです。

各ジャッジに対して、許容される総逸脱度のコリドーが計算される。この「コリドー」は、演技された要素の数が基礎になる。例えばショート・プログラムでは7つの必須要素が演じられる。各ジャッジの採点は、平均として各要素につき逸脱度1のずれがありうる。従って、ショート・プログラムでは7つの要素があり、(許容される)総逸脱度の最大は7.0となる。プラスとマイナスの逸脱度が加えられる。

 つまりエレメント1つにつき1点以上ずれたら、おかしいってチェックはいるよ!ってことですかね。

 男子FSだとエレメントが13個あるので、13より大きいと異常ということですね。J4ジャッジの羽生選手FSでのGOE逸脱度は4.67なので、異常とは判断されない、ということです。

 

 ちなみに逸脱度とは関係ないのですが、GOEにはこんな規定もあるんですね。

(i) For each element performed, the computer calculates the difference between the highest GOE and the lowest GOE of all Judges of the panel and the Referee.
The result is called “Range of GOEs ” for the respective element.
(ii) If the Range of GOEs of an element equals 3.0 points or more, the GOEs of the Judges for that element will constitute cases of evaluation.

  ジャッジとレフェリーがつけたGOEの中で、一番高いGOEと一番低いGOEの差が3以上のときは、それをつけたジャッジはチェック対象になるよ!ってことなのかな?

 

(2)プログラムコンポーネンツの逸脱度

 プログラムコンポーネンツの逸脱度は、以下のように計算されます。ISUコミュニケーションズ1631と1893であまり変更がないようなので(1893の方ではジャッジの異常を発見するOACメンバーの採点への言及がなくなっているだけ)、1631の邦訳から引用しますね。

各プログラム・コンポーネンツごとに、コンピューター・プログラムは、パネルの全ジャッジ、レフェリーそしてOACのメンバー(もしその現地にいれば)の採点を組み込んだ平均点を計算する。レフェリーの採点(個人の採点)とOACのメンバー(もし現地にいれば)の採点はいずれも1.5倍される。フィギュア・スケーティング・グランプリ・イベントの各戦(ジュニアとシニア)及び、ISUワールド・チーム・トロフィーにおいては、パネルが7人以上のジャッジで構成されている場合にはレフェリーの採点を2倍とする。6人以下の場合に時は1.5倍とする。
5つのプログラム・コンポーネンツのそれぞれについて、ジャッジのコリドーは、そのジャッジの採点と計算された平均点との間の1.50の逸脱度(コンポーネンツごとに最大10点の15%)に基づく。つまり、5つのプログラム・コンポーネンツでは(許容される)総逸脱度は7.5となる。プラスとマイナスの逸脱度は、差し引き相殺される。

 GOEの逸脱度の計算と違うのは、プラスとマイナスの逸脱度が相殺されることですね。これ、なんで違うんだろう?誰かわかる方がいれば教えてください。あと、GOEだとエレメント数×1の点数以上だと異常としてるんですが、プログラムコンポーネンツはコンポーネンツの数(5)×1.5で7.5点が閾値になってるみたいです。

 ちなみに、プログラムコンポーネンツにも最高点と最低点の差に規定があって、2.5点以上だとチェックが入るようです。つまり、みんなが8.5とか8とかつけてるときに、5.5ってつけたら目をつけられるってことですね。

 

 

 では、実際に計算した値がこのようになります。まずはGOEの逸脱度から。

f:id:Gorgias483:20180623031919p:plain

 J7が中国ジャッジなんですけど、こうやって見るとぶっちぎりですね。ちなみに13以上になっているのはここだけです。

 次はプログラムコンポーネンツの逸脱度です。

f:id:Gorgias483:20180623032132p:plain

 違反になるのは7.5以上ということですが、そこまで大きなばらつきはないですね。ただ、やっぱりJ7がボーヤンにつけた値が一番平均から逸脱しています。

 

 個人的に気になることとして、巷で言われ、記事でも指摘されていた「アメリカジャッジ(J2)はどうなんだ?」という件ですが、逸脱度を見るとばらつきは確かに大きいんですけど、違反とされるほどは大きくないですね。

 ただ、GOEの逸脱度って、平均からずれた値の絶対値を足し合わせたものなので、例えば、

ジャッジA:エレメント1を平均+1、エレメント2を平均-1と採点

ジャッジB:エレメント1を平均+1、エレメント2を平均+1と採点

としたとしても、ジャッジAとジャッジBは同じ逸脱度2で、評価が変わらないんですよ。でも問題になるのは全体から2点もずれちゃうジャッジBですよね?

 そこで、平均から最終的な得点がどのくらいずれるかわかりやすくするように、プログラムコンポーネンツと同様にプラスの逸脱度とマイナスの逸脱度を相殺すると、こうなります。

f:id:Gorgias483:20180623150641p:plain

 確かに、J2アメリカジャッジは確かに羽生くんに平均より8点も低いGOEつけてるんですけど、J1ジャッジはハビに+9.78、J6ジャッジはボーヤンに-7.67つけてるんですよね。

 これはばらつきの範囲内じゃないかなと思います。もちろん、わざとやった可能性はありますけど。

 ただ、これを規制しちゃうとなると、採点の自由度がなくなってしまうんじゃないかなと。あと、本当にJ2ジャッジが信念を持って羽生くんの点をそんなにつけなかった可能性もあるっちゃあありますし。話を聞いたら意外と「な、なるほど・・・そういう考えもあるのか・・・」ってなるかも?

 羽生ファンとしては、あの4S+3TでGOE+1はないでしょ!?って思うんですけどねー。

 

 世の中から不正がなくならないように、ナショナルバイアスも無くならないと思うし、バイアスがある前提でジャッジシステムを構築しないとだめなんでしょうね。そういう意味では現在の、GOE最高点と最低点の足切りや、各国から一名ずつジャッジを選ぶシステムは良く出来てるよなと思います。

 これ以上バイアスを減らすとなると、例えば五輪とか世界選手権では選手と同じ国のジャッジは審査できないようにするとか…?

 うーん、ISUの会長さんもナショナルバイアスについては問題視していると聞きますし、審査の自由度を保ちつつ、ナショナルバイアスを排除できるような名案が生まれるといいですね。