miércoles, 19 de marzo de 2008

Suizos acelerados y más

Como ahora se está hablando de suizos con emparejamientos acelerados en el grupo estadounidense, y afuera hace frío, he decidido tratar de enterarme un poco más de cómo funcionan.

Lo primero ha sido buscar en Internet. Es posible que no haya sabido buscar bien, pero el caso es que he encontrado poco de utilidad.

Así que he simulado un par de campeonatos con el programa Swiss Perfect para ver cómo quedaba.

Lo primero ha sido un campeonato bajo suizo normal, con 16 jugadores (téngase en cuenta de que es un caso único y en cierta forma extremo, que no creo que sea posible extrapolar fácilmente a otros tamaños, y menos cuando sean impares los jugadores u otros casos particulares). El número de rondas ha sido de 15, es decir, como una liga, pero siendo el orden de las partidas dictado por las reglas del suizo, salvo en la elección del color (no la he tenido en cuenta para facilitar los emparejamientos). Esta tabla con los resultados acumulados es la que he obtenido:

(Los resultados los he obtenido considerando que 1 siempre gana, 2 siempre gana excepto con 1, 3 siempre gana excepto con 1 y 2, etc. Téngase cuidado al leer la tabla, pues en cada columna el orden de los jugadores cambia. Es decir, la primera columna, del 1 al 16, indica la posición, no el jugador. Así, en la ronda 2, en donde hay 8 jugadores con 1 punto, éstos no están ordenados. Lo mismo con el resto.)


Como 16 es 2 elevado a 4, en la 4ª ronda ya sabemos cuál es el mejor jugador del campeonato, pues nadie más tiene 4 puntos (recuérdese que el número de rondas mínimo es el mismo que en el caso de eliminatorias). Aumentando una ronda más, no obtenemos más información. Pero con dos más (ronda 6), también conocemos al 2º mejor. Hasta la 8ª ronda no destaca el 3º, y en la 9ª por fin tenemos también un claro 4º.

El obtener a los 4 primeros es importante en reversi, pues en la mayoría de campeonatos hay finales, se da copa o cualquier otra cosa.

El problema es que la suposición de que 1 siempre gana, etc., no se cumple normalmente, al menos no para todos los jugadores. Es decir, que los resultados pueden empeorar (con empeorar me refiero a que haya más jugadores con la misma puntuación). Por ejemplo, en 7 rondas en principio habrá jugadores desde 7 a 0 puntos, es decir, los 16 jugadores divididos en 8 grupos de diferente tamaño, con diferente puntuación. Si nadie consigue ganar todas las partidas, hay un grupo menos, al menos un empatado más. Si nadie pierde todas las partidas, lo mismo. Y aunque no sea así, el que un jugador intermedio no gane las que tendría que ganar, puede afectar al resto de emparejamientos. Ahí va a influir la suerte.

La única característica de un torneo real, que no se ha contemplado en el ejemplo, y que mejora los resultados es que se dé un empate. Con medio punto para cada uno, estos jugadores crearán al menos un grupo de puntuación nuevo, en el mejor caso, dos.

En cualquier caso, la información más útil que podemos obtener de la tabla es que para este caso en particular, hacen falta 5 rondas más, es decir, 9 (4+5), para obtener a los mejor 4 jugadores. Si se juegan finales (1º contra 2º, 3º contra 4º), nos podemos quedar en la 7ª ronda. En cualquier caso, también podríamos conformarnos con una 4ª ronda que nos da al 1º, y dejar que el resto se decida con un sistema de desempate (aunque en una ronda tan temprana no confiaría ni en los puntos).

Ahora toca compararlo con lo mismo pero acelerado. Lo primero que hice fue un acelerado que creía que sería el clásico (pero que espero que no lo sea), es decir, añadir 2 puntos a los 8 primeros (ordenados por ratin) y quitárselos después de 2 rondas. De esta forma dividimos a los jugadores en 4 cuartos. Los jugadores del primer cuarto juegan con los del segundo, los del tercero con los del cuarto. Y a continuación, teóricamente, los del primero juegan entre sí, los del segundo también, etc.

Sin embargo, me equivoqué, pues de esta forma no se consigue determinar al mejor jugador con una ronda menos, ni mejorar los resultados de forma alguna. El sistema acelerado empleado serviría para 8 jugadores, pero no para 16. Hay que cambiar los parámetros.

El segundo intento también fue un fracaso y consistía en añadir 3 puntos durante 3 rondas. Las razones del fracaso son obvias, aunque para mí no lo fueron hasta que no lo hice.

El tercer y último intento sí que ha resultado bien, tal vez demasiado. Ha consistido en añadir 3 puntos a los 4 primeros, 2 a los 4 siguientes, 1 a los otros 4 siguientes, 0 a los últimos 4. Y en 2 rondas ya se pueden restar, pues tenemos a 1 único jugador con 2 puntos, 14 jugadores con 1 punto, 1 jugador con 0 puntos:

Un resultado realmente bueno, pero tampoco nos tenemos que engañar:
-Si en segunda ronda 9 gana a 7 en vez de perder (en un campeonato real, nada extraño), habría dos jugadores imbatidos: 1 y 9. Aunque ciertamente en 3ª ronda esto se solucionaría.
-Si el mejor jugador del torneo no fuera 1, sino 5, también se necesitarían 3 rondas.

En definitiva, conseguimos un número 1 en 2 rondas sólo si antes hemos ordenado perfectamente, es decir, tenemos unos rátines muy buenos. Si el ratin no predice los resultados demasiado bien (véanse los puntos anteriores), necesitaremos seguramente más rondas. Si el ratin es lo suficientemente bueno como para saber que el mejor está entre los 4 primeros, no hace falta que el torneo sea de 16. Obviamente estos problemas también los tiene un suizo normal, pero aquí parece que están un poco más agudizados.

En cualquier caso, 3 rondas tampoco está mal, pues seguiríamos mejorando los resultados de un suizo no acelerado. Los resultados en las siguientes rondas son estos:


Y ciertamente los resultados son algo mejores.

Como decía, se pueden sacar muy pocas conclusiones de un par de simulaciones. Está claro que con un suizo acelerado, controlando muy bien los parámetros, y no poniendo unos cualquiera, los resultados pueden mejorar. Sin embargo nos queda la gran duda de si en un campeonato normal, donde los rátines no son tan fiables, o simplemente un jugador puede tener un día especialmente bueno (o malo), se mantendrán estos buenos resultados o serán como los de un suizo normal, o peores.

Mientras escribía esto (lo he escrito en varios ratos en diferentes días), han publicado en el grupo estadounidense otra simulación basándose en los resultados del mundial de 2006.

No he podido descargarme el fichero entero que han publicado, aunque las tablas se pueden ver:
http://games.groups.yahoo.com/group/NAOthelloTourneys/message/2745

pero parece ser que los tres resultados que compara corresponden a:
- los resultados reales del mundial de 2006. El programa empleado fue el PAPP (los emparejamientos de cada ronda no se hicieron empleando criterios de ratin).
- los resultados simulados (empleando resultados del mundial de 2006 y los desconocidos según ratin, según me parece entender) empleando Swiss Perfect, NO acelerado, y en los emparejamientos se tiene en cuenta el ratin (emparejamientos USCF frente a los de la FIDE que no los emplea)
- los resultados simulados (como el anterior) empleando Swiss Perfect, pero SÍ acelerado; también según USCF.

Los resultados son mejores para los dos últimos casos, y (en mi opinión) sólo ligeramente mejores los del acelerado al no acelerado.

Así que parece que los resultados no mejoran significativamente (habría que comprobar si realmente son significativos o no) por emplear un sistema acelerado. Sin embargo, sí que mejoran por emplear un diferente sistema de emparejamiento (USCF frente a FIDE). Habrá que hablar otro día sobre sistemas de emparejamiento, pero adelantar que normalmente (tampoco sé exactamente cuándo) el sistema empleado es el siguiente: si hay 8 jugadores empatados, 1º juega contra 5º, 2º contra 6º, etc. Curiosamente esto no conduce a emparejamientos más equilibrados, sino que intenta dejar para el final los emparejamientos más interesantes. Un suizo es menos aburrido si la partida más bonita se juega al final. Por contra, precisamente lo que se busca con los emparejamientos acelerados es lo contrario.

Para terminar, aclarar que el 'experimento' hecho en el grupo estadounidense, habría que verlo con más calma y en principio no me parece tan fácil comparar los resultados de lo que ocurrió realmente con lo que se simula.

martes, 11 de marzo de 2008

Y ahora se habla del tiempo

Parece ser que hace muchos años las partidas de ajedrez no se limitaban con tiempo y podían durar lo que los jugadores aguantaran. Precisamente por eso se pasó a emplear un reloj de ajedrez ("reloj de juego" para no discrimarnos).

Así pues, originalmente el tiempo no determinaba el final de una partida, sino siempre la posición en el tablero.

Teniendo en cuenta lo anterior, entiendo que no tendría que resultar excesivamente sorprendente la reciente propuesta de Ben Seeley (que se puede encontrar en los foros británico y estadounidense, con varias decenas de respuestas) y que dice:

«If a player times out, but in a position in which there is literally no sequence by which they could lose (or if the worst possible sequence for them would be a draw), then they should be assigned that "worst possible" result. So, timing out in an unloseable position would give the timing-out player a win or draw, instead of being a time-out loss.»

http://games.groups.yahoo.com/group/NAOthelloTourneys/message/2609

Es decir, si un jugador pierde por tiempo, pero por el estado de la partida no hay ninguna secuencia por la que éste pudiera dejar de ganar (por fichas), tendría que ganar en vez de perder por tiempo.

En los casos más complejos habría que recurrir al uso de un ordenador, o bien sólo sería aplicable en el caso muy pocas casillas vacías (habría que fijar un número de casillas vacías máximo).

El principal inconveniente de esta propuesta es la dificultad de su aplicación. El jugador tiene que llamar a un árbitro (como si normalmente hubiera muchos), éste introducir la partida en un ordenador y mandarle que calcule, el ordenador determinar si sí o si no, y el árbitro dictar sentencia. En definitiva, ahora que lo he escrito, tampoco parece tan engorroso.

En cualquier caso, para simplificar, también otros han propuesto versiones descafeinadas. Las dos que me parecen más interesantes:

La primera es que no hiciera falta terminar el último movimiento dentro del tiempo asignado. En contra se arguye que el reglamento ahora es mucho más claro (para no perder hay que darle al reloj después del último movimiento antes de que se agote el tiempo) y no da lugar a interpretaciones diferentes.

La segunda, una evolución de la anterior, consistiría en que si se acaba el tiempo, terminar de jugar los movimientos forzados (no hay más que un movimiento posible) si los hay, y si de esta forma se termina la partida, se usa el resultado que se obtenga de completar estos movimientos.

El caso más claro sería el último movimiento. Imaginemos que sólo queda un movimiento, de blancas, y sobre el tablero hay 32 fichas negras y 31 blancas, al jugador de blancas le queda un segundo, pero sin ni siquiera llegar a colocar la ficha, y ya menos voltear, se le acaba el tiempo. Pues en este caso se jugaría este movimiento (obviando el tiempo) y las blancas ganarían (colocan una ficha y al menos voltean otra).

Esta última propuesta no podría dar lugar a interpretaciones diferentes y no parece excesivamente difícil de aplicar (aparte de darla a conocer a los jugadores).

Tras ver la propuesta original de Seeley, así como las respuestas, pensé que realmente la fuente del problema es que muchos jugadores (entre los que me podría incluir) no gestionan bien el tiempo del que disponen, lo cual es bastante normal, teniendo en cuenta que normalmente se juegan muchas más partidas con otros tiempos y sin voltear fichas (por Internet).

Por lo tanto, una solución alternativa consistiría en emplear incrementos de tiempo por movimiento. Por ejemplo, si una partida normal consiste en 25 minutos por jugador, sería equivalente emplear 20 minutos más 10 segundos por movimiento. Los relojes de juego digitales presentan esta función sin problemas, mediante dos métodos, el Bronstein y el Fischer. En el Bronstein los 10 segundos añadidos no son acumulativos (si sólo gastas 5, los otros 5 restantes no los conservas para los siguientes movimientos), mientras que en el Fischer, sí se acumulan los que no uses.

Obviamente el emplear uno de estos dos métodos sirve únicamente como una guía, como una referencia que ayudaría a los jugadores (a diferencia del ajedrez que se emplea también por otras razones), pues con un tiempo de fijo de 25 minutos, también el propio jugador puede dividir el tiempo de la misma forma que si empleara incrementos. Es decir, limitando las posibilidades de gestión del jugador estamos tratando de conseguir que el jugador no se tenga que preocupar tanto por el tiempo, pues sabe que incluso malgastándolo, dispondrá de un mínimo de 10 segundos para cada movimiento.

Obviamente, como toda limitación, no beneficia a quien sí gestiona perfectamente su tiempo.

Por otro lado, el uso de relojes digitales sería obligatorio. Ahora mismo no sé de cuántos relojes digitales y analógicos podemos disponer en un campeonato, pero supongo que será mitad y mitad. Es decir, que hasta que todos no sean digitales no se podría aplicar esta medida.

Para terminar, también se ha realizado otra propuesta sobre el tiempo. Concretamente sobre el tiempo empleado en partidas en Internet. Sería dividir la partida en tres etapas y dar diferentes tiempos para mover. En principio éstos tiempos serían determinados con el fin de evitar el uso de trampas en Internet.

Parece que la discusión en estos grupos está amainando, pero seguramente aún quedarán buenos mensajes por publicarse (esperemos).

viernes, 7 de marzo de 2008

Se habla de clasificación

Estos últimos días se ha hablado un poco sobre la Clasificación Mundial de Othello, esto es, la clasificación de la FFO (al menos no conozco ninguna otra que sea mundial).

Os pongo los primeros clasificados hoy:


Class. Inc. Part. Nom Pays

2902 +/-1266 13 ALNEMAN Jonas S

2887 +/- 521 4 LUCIOLI Juan Pablo ARG

2750 +/- 478 4 COELLO Alejandro ARG
1 2739 +/- 186 50 SAKAGUCHI Kazuhiro J
2 2735 +/- 138 73 TOMINAGA Kenta J

2720 +/- 319 7 TSUCHIDA Eiji J

2654 +/- 287 7 KUNO Shoukei J
3 2650 +/- 112 73 TAMENORI Hideshi J

2612 +/- 295 35 OLIVARES Daniel ARG
4 2594 +/- 70 206 SUEKUNI Makoto J
5 2525 +/- 62 197 SEELEY Ben USA
6 2520 +/- 129 40 KANEDA Shigeru J
7 2491 +/- 68 146 NAKAJIMA Tetsuya J
8 2489 +/- 71 128 MURAKAMI Takeshi J
9 2464 +/- 177 20 TSUCHIDA Daisuke J

2463 +/- 276 12 SAWADA Tomohiro J
10 2449 +/- 181 19 TAKANASHI Yuusuke J

En principio sólo habría que fijarse en los que están en negrita (incertidumbre de menos de +/- 200), pero curiosamente han sido los 'rátines' de jugadores que no están en negrita o que simplemente no están, los que han centrado el tema de la discusión: por un lado, el ratin de los tres argentinos, que algunos consideran un poco alto, incluso teniendo en cuenta la incertidumbre (desde aquí también opino que seguramente sí sea excesivo, pero tampoco como para escandalizarse); por otro lado, el que haya jugadores que han jugado partidas y no entran en la clasificación.

Se podría hablar mucho más, pero no creo que merezca la pena extenderse, más teniendo en cuenta que hay algunos aspectos de la clasificación que se me escapan. Por eso nos centraremos en esos dos puntos.

Primero, hace poco más de un año se modificó el sistema de clasificación (aunque en lo básico seguía siendo el mismo). La lista de atrás pero completa está en la dirección:
http://www.ffothello.org/classement/classement.php

Y los fundamentos en esta otra:
http://www.ffothello.org/classement/jech.php

De la anterior nos interesa lo siguiente (copio y pego):
Toutes les parties jouées depuis 1992 sont prises en compte avec un poids dégressif, fonction de leur ancienneté :
Période 1 : 0 - 7 mois, poids 150
Période 2 : 7 - 14 mois, poids 100
Période 3 : 14 - 26 mois, poids 60
Période 4 : 26 - 38 mois, poids 30
Période 5 : toutes les parties plus anciennes, poids 1

Seuls les joueurs ayant disputé au moins une partie (prise en compte dans le classement) dans les 38 derniers mois apparaissent dans le classement publié.

Que traducido al español (como si supiera) quiere decir que para calcular todos los rátines se consideran todas las partidas jugadas desde 1992, pero dando más importancia a las más recientes, y sólo se muestran los jugadores que han jugado en los últimos 38 meses.

Lo que hay que aclarar es el por qué tal vez uno juegue por primera vez un campeonato, por ejemplo el EGP de Barcelona del 5 y 6 de julio de 2008, con sus 11 rondas, tenga una de descanso (bye), otra la gane, y el resto (9) las pierda, y aún así no entre en la clasificación.

Es sencillo, si uno ha perdido contra uno de ratin 2300 y otro de 2000, ¿qué ratin se le da?, ¿1900?, ¿1500?, ¿1000?, ¿-1000?, no se puede dar un ratin fiable y por eso no se le da ninguno. Volviendo al ejemplo anterior, el bye no se cuenta para el ratin; y podría parecer que con una victoria ya se entra automáticamente en la clasificación, pero para eso ésta tiene que ser contra alguien que ya esté en la clasificación o bien que entre en ella debido a sus resultados en ese campeonato (por ejemplo, que la victoria no haya sido contra otro jugador que haya perdido todas las partidas y no estuviera previamente en la clasificación). Parecido si alguien gana todas las partidas (este caso es más raro).

Segundo, el ratin de los tres argentinos parece un poco alta (realmente bien podría ser ése su verdadero ratin). En cualquier caso, sí que se puede decir que nuestra intuición nos dice que seguramente esté un poco sobrevalorada, aunque teniendo en cuenta que por ejemplo la más alta es de 2887 +/- 521 y la incertidumbre es del 95 %, se entiende que hay un 5 % de probabilidad de que la clasificación esté fuera de ese rango. Es decir, que esa clasificación no dice que el ratin no pueda ser de menos de 2300. O de más de 3500.

Sí que es cierto que los rátines europeos, intuitivamente, nos parecen más fiables. Pero ya advirtieron de que habiendo pocas partidas entre los jugadores de los distintos continentes, era difícil hacer una clasificación mundial (hace poco más de un año sólo era sólo europea) fiable. Y precisamente es en los rátines de algunos jugadores de Sudamérica, quienes han jugado menos con jugadores de otros continentes (no creo que más de un argentino y un brasileño), en donde se ha visto que los rátines son menos fiables.

Se ha sugerido que tal vez con otro sistema no habría este problema, pero lo dudo y querría verlo antes funcionando durante un tiempo. Al menos no he leído ningún argumento a favor o en contra convincente.