Artículos, Noticias

Top500: Una batalla en HPC por el mejor rendimiento/Watt

Este año es particularmente interesante en el mundo HPC (High-Performance Computing) porque será cuando todos los jugadores más importantes en semiconductores se pondrán al día lanzando al mercado sus nuevas […]

Este año es particularmente interesante en el mundo HPC (High-Performance Computing) porque será cuando todos los jugadores más importantes en semiconductores se pondrán al día lanzando al mercado sus nuevas soluciones en cómputo de alto rendimiento. Por un lado tenemos a Intel, quien finalmente lanzará su nueva arquitectura MIC (antes conocida como proyecto Larrabee), AMD por su cuenta intentará recuperar terreno perdido con sus tarjetas FirePro basadas en la arquitectura GCN que vemos hoy en día en las Radeon HD 7000, y a NVIDIA que, con tan solo cinco años, ahora es reconocida como una potencia en cómputo paralelo.

Aunque no soy precisamente un desarrollador involucrado en el HPC, mi interés en el tema ha surgido a raíz de que el cómputo de alto rendimiento ya no es un tema que se maneja como información a voces,  al contrario, hoy en día se ha convertido en uno de los principales motores que mueve la industria pero principalmente porque es una de las fuentes de ingreso más importantes en donde compañías y países invierten fuertes sumas de dinero para entretenimiento, investigación y desarrollo.

El objetivo de este artículo, que es visualizar cuál es la participación de éstas compañías y qué podemos esperar con la salida de sus nuevas tecnologías, me centrará en la única forma ‘mortal’ que existe para medir su presencia: el Top500 de las Supercomputadoras más poderosas del mundo. Dado que los escenarios son completamente diferentes a lo que podríamos medir en una PC, tomaré como referencia esta fuente porque si en esta lista se menciona una Supercomputadora quiere decir que la tecnología ya esta implementada. En otras palabras, existe, que es a final de cuentas lo que importa.

Seis años después Intel Xeon Phi aparece en el Top500

Y para ir comenzando usaré como guía una diapositiva de una presentación de Intel en la que se habla por primera vez de manera técnica sobre su arquitectura MIC, ya que es, hasta donde sé, la única forma en la que ha se representado a modo benchmark el posicionamiento de la gran promesa de Intel en cómputo paralelo contra las soluciones actuales. Obviamente, la gráfica necesitaría ser actualizada con las nuevas arquitecturas de NVIDIA y AMD pero ya que no aparecen en el Top500 me basaré en números reales y no hipotéticos.

Viendo la gráfica de arriba vamos encontrando unos curiosos resultados en términos de eficiencia de energía en los que Intel asegura que una Supercomputadora en el puesto #150 con co-procesadores Xeon Phi es ligeramente más eficiente que la Supercomputadora de la Universidad de Nagasaki con ATI Radeon basadas en la arquitectura VLIW 4 y hasta 9% más que Barcelona equipada de NVIDIA Teslas 2090. Lo anterior refleja cifras bastante interesantes considerando el tiempo que le ha tomado a Intel finalmente implementar su tecnología que comenzó como Larrabbe, hace ya más de 6 años.

Intel hace comparaciones sospechosas

Si nos dejamos guiar por los números anteriores hay que reconocer que Intel ha cumplido contra lo que algunos llegaron a considerar nunca lograrían, pero ¿qué tan confiables son éstos números contra quienes llevan dominando la lista del supercómputo durante los últimos años? Para ello, visitando a un viejo amigo (el consultor Daniel Ortiz) me explica que éstos resultados se ven muy bien pero lucen algo “sospechosos”. ¿Cómo podría ser esto?

Dando un vistazo al Top500 para localizar la Supercomputadora con Xeon Phi de la gráfica fue curioso encontrar que da la impresión de que la posición #150 es para Intel la posición #1, ya que las Supercomputadoras que han usado para la comparación se encuentran en posiciones más abajo (#456 y #177) y descartando por completo el Top5, por decir algo. Esto me hace pensar que Intel fue bastante minucioso en su comparativa al grado de que prefiere quedar bien en posición que anteponer la eficiencia.

Esto se puede demostrar si tomamos en cuenta que Intel no incluyo supercomputadoras de posiciones superiores  que entregan menor rendimiento/watt que la supercomputadora Xeon Phi (1.77 TFlops/Watt). Es el caso de Tianjin con Tesla 2070 que entrega un rendimiento/Watt de 1.16TFlops/Watt y se encuentra en el #5, mientras que  en la Universidad de Frankfurt su supercomputadora con ATI Radeon logra 1.22 TFlops/Watt. Si Intel quisiera demostrar lo eficiente y poderoso que es Xeon Phi pudo haber elegido los equipos anteriores. Por el contrario, quien si supera a Xeon Phi es la supercomputadora de la Univ. de Nagasaki (#456), con ATI Radeon, que entrega un rendimiento de 2.9TFlops/Watt y Forschungszentrum Juelich (FZJ) con Tesla 2070 con 1.87 TFlops/Watt.

En HPC no todo es eficiencia y rendimiento; la implementación hace la diferencia

Con todo lo anterior he llegado a un punto en el que aplaudo lo que ha logrado Intel; principalmente, porque da la sensación que han aprendido la lección con el error de Larrabarre y el trabajo de tantos años luce muy prometedor en HPC. Sin embargo, del otro lado de la moneda parece que Intel quiere llamar la atención por posición y no por lo que entregar Xeon Phi, algo que me parece lamentable.

Ahora bien, otra de las variables que se tiene que tomar en cuenta para que una tecnología de supercómputo sea exitosa, es que sea un máquina para hacer dinero, y no hay método más exacto para medirlo que convenciendo a investigadores y desarrolladores cineastas, científicos y profesionales que inviertan en la tecnología. De nada sirve tener la supercomputadora más poderosa ahorradora de energía si la tienes de adorno o como resultado del ego.

Ya que nos basamos en los datos del Top500, si contamos que en esa lista aparecen todas las supercomputadoras más famosas que se usan para investigación, desarrollo, etc., he contado que NVIDIA tiene una presencia del 9.8% que no se compara contra el .4% y .2 que tiene AMD e Intel con Xeon Phi, respectivamente. Estoy convencido de que la participación de NVIDIA no se compara contra el 43% de IBM o los muy respetados procesadores Sparc de NEC, pero no cabe duda que el equipo verde ha logrado hacer en relativamente poco tiempo lo que a Intel le ha costado desarrollado su primera solución para el cómputo paralelo.

 

 Últimos comentarios

Al final de este recorrido que quizás algunos encontrarán limitado la intensión ha sido simplemente exponer lo que depara para el mercado HPC, tomando como referencia lo que ya existe no lo que esta en papel. Como menciona al principio del artículo, Intel quiere mostrar que la espera valdrá la pena, y con los números anteriores no hay duda de que así será ¿pero qué pasa con la competencia o con quienes tienen una fuerte presencia?

¿NVIDIA insuperable? 

Por el lado de NVIDIA es evidente que Xeon Phi destaca la edad que ya tiene la arquitectura “Fermi” pero que hasta ahora ha demostrado ser tan superior que se refleja no solo en rendimiento/watt sino en presencia; eso es algo que hasta ahora no se puede negar y debe respetarse. Para la mala suerte de Intel, NVIDIA no se quedará atrás y su respuesta inmediata será la nueva Tesla K10 con doble GPU-GK104. Hablando teóricamente, y si los cálculos no nos han fallado, estamos hablando que la Tesla K10 podrá entregar en rendimiento/Watt de 1.84 TFlops/Watt que no es más que 3% sobre lo que entrega Xeon Phi. La ventaja es que si a esta fórmula añadimos la variable “presencia” es viable pensar que NVIDIA seguirá teniendo una mayor ventaja sobre Intel.

Se habla que la desventaja de NVIDIA es y seguirá siendo el lenguaje CUDA; sin embargo, hoy en día es un factor que ya no es una limitante. Aunque se llegue a pensar que es más difícil programar en CUDA que en x86, la ventaja es que hay ejemplos que demuestran lo que se consigue  al invertir un poco más de tiempo aprendiendo algo “nuevo”. Digamos que sería como poner pretextos si no se considera que con GPUs Tesla se ha simulado la vacuna del virus H1N1 y se le encuentra en la labor de post-producción en trabajo digital y FX de películas taquilleras como The Avengers (2012) o la excepcional Avatar (2009).  Si Tesla K10 NVIDIA servirá como entremés, se habla de que con Tesla K20, basada en Big Kepler o GK110, es que podemos esperar el plato fuerte.

¿Y en dónde queda AMD?

AMD es un caso más decepcionante, ya que durante años su falta de innovación le ha obligado a prácticamente desaparecer (.4%) del mercado HPC. Por suerte, siendo muy optimistas, su participación podría resurgir ahora con sus nuevos productos AMD FirePro W-Series y S-Series basados en la arquitectura GCN, destinados a competir en el mercado profesionales. El problema de ello es que AMD tiene pelea por dos flancos: por un lado quiere hacerse de un mercado que para NVIDIA no es tan relevante (así me lo han expresado); y porque Intel cada vez más juega con gráficos integrados y sus CPUs, aunque son caros, son más poderosos. La pelea es difícil.

 

 

Llegamos al final de este breve recorrido que inicio como una simple curiosidad pero que definitivamente será tema de interés para todo desarrollador que planea invertir fuertes sumas de rendimiento que le preocupa y esta consciente que el poder no lo es todo sin eficiencia y sin el respaldo de ejemplos que demuestren lo que puede conseguirse. Espero que el artículo haya sido de su agrado.

Referencias:

Agradecimientos especiales:

  • Consultor Daniel Ortiz Lozano.