Clúster de GPU - GPU cluster

Un clúster de GPU es un clúster de computadoras en el que cada nodo está equipado con una Unidad de procesamiento de gráficos (GPU). Al aprovechar la potencia computacional de las GPU modernas a través de Computación de propósito general en unidades de procesamiento de gráficos (GPGPU), se pueden realizar cálculos muy rápidos con un clúster de GPU.

Titan , la primera supercomputadora en usar GPU

Hardware (GPU)

La clasificación de hardware de los clústeres de GPU se divide en dos categorías: heterogénea y homogénea.

Heterogéneo

Se puede utilizar hardware de los dos principales IHV (AMD y nVidia). Incluso si se utilizan diferentes modelos de la misma GPU (por ejemplo, 8800GT mezclado con 8800GTX), el clúster de GPU se considera heterogéneo.

Homogéneo

Cada GPU es de la misma clase de hardware, marca y modelo. (es decir, un clúster homogéneo que comprende 100 8800GT, todos con la misma cantidad de memoria)

La clasificación de un clúster de GPU de acuerdo con la semántica anterior dirige en gran medida el desarrollo de software en el clúster, ya que diferentes GPU tienen diferentes capacidades que se pueden utilizar.

Hardware (otro)

Interconectar

Además de los nodos de computadora y sus respectivas GPU, se necesita una interconexión lo suficientemente rápida para transportar datos entre los nodos. El tipo de interconexión depende en gran medida del número de nodos presentes. Algunos ejemplos de interconexiones incluyen Gigabit Ethernet e InfiniBand .

Vendedores

NVIDIA proporciona una lista de socios preferidos de Tesla (TPP) dedicados con la capacidad de construir y entregar un clúster de GPU completamente configurado utilizando las GPGPU de la serie 20 de Tesla. AMAX Information Technologies , Dell , Hewlett-Packard y Silicon Graphics son algunas de las pocas empresas que ofrecen una línea completa de clústeres y sistemas de GPU.

Software

Los componentes de software que se requieren para hacer que muchas máquinas equipadas con GPU actúen como una sola incluyen:

  1. Sistema operativo
  2. Controlador de GPU para cada tipo de GPU presente en cada nodo del clúster.
  3. API de agrupación en clústeres (como la interfaz de paso de mensajes , MPI).
  4. La plataforma de clúster VirtualCL (VCL) [1] es un contenedor para OpenCL ™ que permite que la mayoría de las aplicaciones no modificadas utilicen de forma transparente múltiples dispositivos OpenCL en un clúster como si todos los dispositivos estuvieran en la computadora local.

Mapeo de algoritmos

Mapear un algoritmo para ejecutar un clúster de GPU es algo similar a mapear un algoritmo para que se ejecute en un clúster de computadoras tradicional . Ejemplo: en lugar de distribuir partes de una matriz desde la RAM, se divide una textura entre los nodos del clúster de GPU.

Referencias y enlaces externos

  • Son Magnus Bruaset, Aslak Tveito (2006). Solución numérica de ecuaciones diferenciales parciales en computadoras paralelas . Birkhäuser. ISBN 3-540-29076-1.
  • Grupo acelerador de NCSA
  • Clústeres de GPU para informática de alto rendimiento
  • Clúster de GPU en STFC Daresbury Laboratory
  • Monitoreo de temperatura de núcleos de GPU