
EVOLUCION DE LAS SUPERCOMPUATADORAS
The CDC 6600 is believed to have been the first computer to be designated as a supercomputer , offering the fastest clock speed for its day (100 nanoseconds). El CDC 6600 se cree que ha sido el primer equipo para ser designado como un superordenador, que ofrece la velocidad de reloj más rápida de su día (100 nanosegundos). It was one of the first computers to use Freon refrigerant cooling and was also the first commercial computer to use a CRT console. Fue uno de los primeros ordenadores para el uso de refrigerantes freón de refrigeración y también fue la primera computadora comercial de usar un monitor CRT consola. The machine was operated for nearly a year at the 30th street location in Boulder until the Mesa Laboratory was ready in December 1966. La máquina fue operada durante casi un año en la 30 calle hasta la ubicación en el Condado de Boulder la Mesa de laboratorio estaba listo en diciembre de 1966. The CDC 6600 was a large-scale, solid-state, general-purpose computing system. El CDC 6600 fue un gran escala, de estado sólido, de uso general del sistema de computación. It had a distributed architecture (central scientific processor supported by ten very fast peripheral machines) and was a reduced instruction set (RISC) machine many years before such a term was invented. Tuvo una arquitectura distribuida (procesador central de científicos apoyados por diez máquinas periféricas muy rápido) y se redujo un conjunto de instrucciones (RISC) máquina de muchos años antes de este término fue inventado. Input to the computer was by punch cards or seven-channel digital magnetic tape. De entrada al equipo fue por tarjetas perforadas o siete canales digitales en cinta magnética. Output was available from two line printers, a cardpunch, a photographic plotter, and standard magnetic tape. Se dispone de salida de línea de dos impresoras, una cardpunch, un trazador de fotografía, y el nivel de cinta magnética. An interactive display console allowed users to view graphical results as data were being processed. Una consola de visualización interactiva permite a los usuarios ver los resultados gráficos de los datos se están procesando. The CDC 6600 had 65,000 60-bit words of memory. El CDC 6600 tenía 65.000 60-bits palabras de memoria. It was equipped with a large disk storage device and six high-speed drums as storage intermediate in speed and accessibility between the central core storage and magnetic tapes. Fue equipado con un gran dispositivo de almacenamiento en disco y seis de alta velocidad como los bidones de almacenamiento intermedio en la velocidad y la accesibilidad entre el núcleo central de almacenamiento y las cintas magnéticas. The 6600 supported the FORTRAN 66 compiler and a program library. El 6600 apoyó el compilador Fortran 66 y un programa de biblioteca. The CDC 6600 was decommissioned in 1977. El CDC 6600 fue desmantelada en 1977.
Modern supercomputing began in the 1970s with the introduction of vector processors. Supercomputación moderna comenzó en la década de 1970 con la introducción de los procesadores vectoriales. Many of the newer players developed their own such processors at a lower price to enter the market. In the early to mid 1980s, performance advancement was obtained through improvements in vector processor technology and the introduction of symmetric multiprocessors (SMPs). Dongarra [3] defined SMP as “[A] computer system that has two or more processors connected in the same cabinet, managed by one operating system, sharing the same memory, and having equal access to input/output devices.” Muchos de los nuevos jugadores desarrollado sus propios procesadores de este tipo a un precio inferior a entrar en el mercado. En la primera mitad del decenio de 1980, los resultados se obtuvo el progreso a través de mejoras en la tecnología de procesador de vectores y la introducción de multiprocesadores simétricos (SMPs). Dongarra [3 ] SMP define como "[A] sistema informático que tiene dos o más procesadores conectados en el mismo gabinete, dirigido por un sistema operativo, que comparten la misma memoria, y que tengan igualdad de acceso a los dispositivos de entrada / salida."
The early and mid-1980s saw machines with a modest number of vector processors working in parallel to become the standard. Los principios y mediados de los años 1980 vieron las máquinas con un modesto número de procesadores de vectores que trabajan en paralelo para convertirse en la norma. Typical numbers of processors were in the range of four to sixteen. Típico número de procesadores se encuentran en el rango de cuatro a dieciséis. During the first half of the 1980s, much attention was paid to the marketability of supercomputers so that manufactures were able to sell enough systems to stay in business. Durante la primera mitad de la década de 1980, se prestó mucha atención a la comercialización de los superordenadores a fin de que se fabrica en condiciones de vender lo suficiente para permanecer en los sistemas de negocio. This included development of “standard programming environments, operating systems, and key applications” [3]. Esto incluía el desarrollo de "entornos de programación estándar, sistemas operativos y aplicaciones clave" [3].
Supercomputers built in the early-80s used the shared memory model (SM), which limited scalability in such systems. Superordenadores construido a principios de los años 80 utilizó el modelo de memoria compartida (SM), que limita la escalabilidad de estos sistemas. In the later 1980s and early 1990s, attention turned from SM to distributed memory (DM) implemented by massive parallel processing systems with thousands of “ordinary” CPUs, some being off the shelf units and others being custom designs. En los últimos años 1980 y principios de 1990, la atención de SM convertido a memoria distribuida (DM), aplicadas por los sistemas de procesamiento paralelo masivo con miles de "ordinaria" CPU, algunos de ellos, frente a las estanterías y otros son diseños personalizados. This shift in focus was accompanied by an increase in performance of standard off-the-shelf processors due to the transition to RISC architectures and the introduction of CMOS technology. Este cambio de enfoque fue acompañado por un aumento en el rendimiento de la norma fuera de los procesadores de la plataforma debido a la transición a arquitecturas RISC y la introducción de la tecnología CMOS. This leads to the introduction of the concept of massively parallel processors (MPP) [3].Vaughan-Nichols [7] defines a MPP as a system using many CPUs, each with its own memory, running in parallel and linked by high-speed interconnections to execute the various parts of a program. Esto lleva a la introducción del concepto de procesadores masivamente paralelo (MPP) [3]. Vaughan-Nichols [7] define un PMP como un sistema que utiliza muchos CPUs, cada una con su propia memoria, funcionando en paralelo y conectados por alta velocidad de las interconexiones para la ejecución de las distintas partes de un programa. His use of “many” to describe the number of processors is a rather relative term. IBM Roadrunner, currently the world's fastest supercomputer is listed as a hybrid design with 12,960 IBM PowerXCell 8i CPUs and 6,480 AMD Opteron dual-core processors in specially designed server blades connected by Infiniband [8] but a computer with a few orders of magnitude fewer processors could also be described as having “many” processors. Dongarra suggests considering “many” to mean “larger than the current largest number of processors in a shared-memory machine.” Su uso de "muchos" para describir el número de procesadores es más bien un término relativo. Roadrunner de IBM, que actualmente es el superordenador más rápido del mundo se muestra como un híbrido de diseño de IBM con 12.960 procesadores PowerXCell 8i y 6.480 AMD Opteron de doble núcleo en procesadores diseñados especialmente para servidor hojas unidas por Infiniband [8], pero un equipo con algunas órdenes de magnitud menor número de procesadores también podrían ser descritos como "muchos" los transformadores. Dongarra sugiere considerar "muchos" en el sentido de "más grande que la actual mayor número de procesadores en un compromiso memoria-máquina ".
In order to provide a more reliable basis for statistics on high-performance computers, the Top500 list was introduced in 1993. Con el fin de proporcionar una base más fiable para las estadísticas sobre los ordenadores de alto rendimiento, la lista Top500 se introdujo en 1993. Initially this ranking made usage of the Linpack benchmark. Inicialmente hizo uso de esta clasificación de la referencia Linpack. LINPACK is a software library for performing numerical linear algebra on digital computers. Linpack biblioteca es un software para realizar el álgebra lineal numérica en ordenadores digitales. It was written in Fortran by Dongarra and other researchers between late 1970s and early 1980s for use with supercomputers. Fue escrito en Fortran Dongarra y por otros investigadores entre fines del decenio de 1970 y principios de 1980 para su uso con superordenadores. This decision was controversial since LINPACK is considered to over-estimate the capability of microprocessor-based machines [4]. Esta decisión fue polémica desde Linpack se considera a la sobre-estimación de la capacidad de las máquinas basadas en microprocesadores [4]. LINPACK has actually been largely superseded by LAPACK, which runs more efficiently on modern architectures. Linpack ha sido sustituida en gran parte por LAPACK, que será más eficaz en las modernas arquitecturas.
Until the introduction of the Earth Simulator supercomputer in 2002, MPP machines dominated the supercomputer industry [6]. The percentage of machines on the Top500 list utilizing vector processors had been steadily decreasing over the years, and had appeared to stabilize around 10% in 2003 (Feitelson 2005). When introduced, Earth Simulator was the world's fastest supercomputer and featured vector processors in a MPP architecture [4]. Hasta la introducción de la supercomputadora en el Simulador de la Tierra de 2002, dominó el MPP máquinas superordenador industria [6]. El porcentaje de las máquinas en la lista Top500 la utilización de procesadores de vectores se ha disminuido de manera constante en los últimos años, y ha aparecido a estabilizar en torno al 10% en 2003 (Feitelson 2005). Cuando se presentó, Simulador de la Tierra era el superordenador más rápido del mundo y figura en un vector de procesadores MPP arquitectura [4]. According to Dongarra, this “demonstrated that many scientific applications could benefit greatly from other computer architectures.” Feitelson highlights that researchers in Japan , where the Earth Simulator is located, have preferred the vector processing approach, while American companies have preferred to use commodity microprocessors. Según Dongarra, esto "demuestra que muchas aplicaciones científicas podrían beneficiarse en gran medida de otras arquitecturas de computadora." Feitelson destaca que los investigadores en Japón, donde el Simulador de la Tierra se encuentra, han preferido el enfoque de procesamiento de vectores, mientras que las empresas norteamericanas han preferido utilizar los microprocesadores .
Currently, the focus in supercomputing is on clustered systems, as Strohmaier and Meuer note that the number of clustered systems on the Top500 list has grown considerably. Dongarra defines “cluster” as a “commonly found computing environment consisting of many PCs or workstations connected together by a local-area network.” He also comments that a long running trend indicates that it is increasingly rewarding to aggregate the computational power of relatively small machines. As the typical desktop computer has become more powerful over the years, it can now be considered a significant computing resource [3]. Actualmente, en el centro de supercomputación se agrupan en sistemas, como Strohmaier Meuer y observar que el número de sistemas agrupados en la lista Top500 ha crecido considerablemente. Dongarra define el "grupo" como "se encuentran entorno compuesto de muchos ordenadores conectados entre sí o de trabajo por una red de área local. "También comenta que una larga tendencia indica que cada vez es más gratificante para agregar la potencia de cálculo de máquinas relativamente pequeño. Como la típica computadora de escritorio se ha vuelto más poderoso a través de los años, ahora puede ser considerada una parte significativa de recursos de computación [3]. Coupling groups of commodity computers together with high-speed interconnects has proved to be a successful venture, lowering costs and putting supercomputers within reach of new users [7]. As an example, Vaughan-Nichols [7] cites Viriginia Tech's new Terascale Cluster, built with 1,100 off-the-shelf Apple computers, Cisco Systems' 4500 Gigabit switches, and 24 96-port Infiniband switches. The Terascale cluster was built in 4 months and cost a relatively small $5.2 million. In summary, clusters of PCs and workstations have become the prevalent architecture for many HPC application areas in all ranges of performance in recent years [3]. Acoplamiento de los grupos de ordenadores, así como con interconexiones de alta velocidad ha demostrado ser una empresa exitosa, reduciendo los costos y la puesta superordenadores al alcance de los nuevos usuarios [7]. A modo de ejemplo, Vaughan-Nichols [7] cita Viriginia Tech nuevo Terascale grupo, con 1.100 construidos fuera de la plataforma con ordenadores Apple, Cisco Systems conmutadores Gigabit 4500, y 24 96-puerto Infiniband interruptores. Terascale El grupo fue construido en 4 meses y un costo relativamente pequeño 5,2 millones de dólares. En resumen, las agrupaciones de PC y estaciones de trabajo se han convertido en la prevalencia de la arquitectura HPC para muchas áreas de aplicación en todos los rangos de rendimiento en los últimos años [3].
4.
4. LINPACK and LAPACK Linpack y LAPACK
LINPACK is a software library for performing numerical linear algebra on digital computers. Linpack es una biblioteca de software para la realización de álgebra lineal numérica en ordenadores digitales. It was written in Fortran by Jack Dongarra, Jim Bunch, Cleve Moler, and Pete Stewart, and was intended for use on supercomputers in the 1970s and early 1980s. Fue escrito en Fortran por Jack Dongarra, Jim Bunch, Cleve Moler, y Pete Stewart, y fue destinado a ser utilizado en supercomputadoras en la década de 1970 y principios de 1980. It has been largely superseded by LAPACK, which will run more efficiently on modern architectures. Se ha sustituido en gran medida por LAPACK, que se desarrollará de manera más eficiente en las modernas arquitecturas.
LINPACK is a collection of FORTRAN subroutines that analyze and solve linear equations and linear least-squares problems. Linpack es una colección de subrutinas FORTRAN que analizar y resolver ecuaciones lineales y lineales de mínimos cuadrados problemas. The package solves linear systems whose matrices are general, banded, symmetric indefinite, symmetric positive definite, triangular, and tridiagonal square. El paquete que resuelve sistemas lineales de matrices son generales, bandas, simétrico indefinida, simétrica positiva definida, triangulares, cuadrados y tridiagonal. In addition, the package computes the QR and singular value decompositions of rectangular matrices and applies them to least-squares problems. Además, el paquete que calcula el QR y singular valor decompositions de matrices rectangulares y las aplica a los problemas de mínimos cuadrados. LINPACK uses column-oriented algorithms to increase efficiency by preserving locality of reference. Linpack utiliza algoritmos columna orientada a aumentar la eficiencia mediante la preservación de la localidad de referencia. The result is reported in millions of floating point operations per second (MFLOP/s, sometimes simply called FLOPS). El resultado es en millones de operaciones de punto flotante por segundo (MFLOP / s, a veces simplemente llamado FLOPS).
LAPACK can be seen as the successor to the original LINPACK, which was designed to run on the then-modern vector computers with shared memory. LAPACK puede considerarse como la sucesora de la original Linpack, el cual fue diseñado para ejecutarse en el entonces moderno vector computadoras con memoria compartida. LAPACK, in contrast, depends upon the Basic Linear Algebra Subprograms (BLAS) in order to effectively exploit the caches on modern cache-based architectures, and thus can run orders of magnitude faster than LINPACK on such machines, given a well-tuned BLAS implementation. LAPACK, en cambio, depende de los subprogramas Álgebra lineal básica (BLAS) con el fin de explotar las cachés en los modernos basados en las arquitecturas de memoria caché y, por tanto, puede ejecutar órdenes de magnitud más rápido que Linpack de dichas máquinas, un bien afinada aplicación BLAS . LAPACK has also been extended to run on distributed-memory systems in later packages such as ScaLAPACK and PLAPACK. LAPACK se ha ampliado también a ejecutarse en los sistemas de memoria distribuida en paquetes, como más tarde ScaLAPACK y PLAPACK.
5. Top supercomputers 5. Superordenadores Arriba
IBM Roadrunner currently occupies the first position in the 32 nd edition of the prestigious top500 ranking [8]. IBM Roadrunner ocupa actualmente la primera posición en la 32 ª edición del prestigioso ranking top500 [8]. It was built by IBM for the computer for the US Department of Energy's (DOE) National Nuclear Security Administration and it is located at Los Alamos National Laboratory. Fue construido por IBM para el equipo de los EE.UU. del Departamento de Energía (DOE), Administración Nacional de Seguridad Nuclear y se encuentra ubicado en Los Alamos National Laboratory. It is a hybrid design with 12,960 IBM PowerXCell 8i CPUs and 6,480 AMD Opteron dual-core processors in specially designed server blades connected by Infiniband. Es un híbrido de diseño de IBM con 12.960 procesadores PowerXCell 8i y 6.480 AMD Opteron de doble núcleo en procesadores diseñados especialmente para las hojas de servidor conectados por Infiniband. The Roadrunner uses Red Hat Enterprise Linux along with Fedora as its operating systems and is managed with xCAT distributed computing software. El Roadrunner utiliza Red Hat Enterprise Linux con Fedora como a lo largo de sus sistemas operativos y se gestiona con el software de informática distribuida xCAT. Top500 [8] reports an average performance of 1105000 GFLOPS and a peak performance of 1456704 GFLOPS for the LINPACK benchmark. Top500 [8] informa de un rendimiento medio de 1105000 GFLOPS y un máximo rendimiento de 1456704 GFLOPS Linpack para el punto de referencia. Roadrunner uses the Open MPI Message Passing Interface implementation. Roadrunner utiliza el Open MPI Message Passing Interface aplicación. Roadrunner occupies approximately 6,000 square feet (560 m2) and became operational in 2008. Roadrunner ocupa aproximadamente 6.000 pies cuadrados (560 m2) y entró en funcionamiento en 2008. The DOE plans to use the computer for simulating how nuclear materials age in order to predict whether the USA 's aging arsenal of nuclear weapons is safe and reliable. El DOE planes para usar la computadora para simular la forma en la edad de materiales nucleares con el fin de predecir si los EE.UU. 's envejecimiento arsenal de armas nucleares es seguro y fiable. Other uses for the Roadrunner include the sciences, financial, automotive and aerospace industries. Otros usos para la Roadrunner incluyen las ciencias, la financiera, las industrias automotriz y aeroespacial.
At second position is the Jaguar XT supercomputer by Cray, built for the US Department of Energy's Oak Ridge National Laboratory in Tennessee . En segunda posición es la Jaguar XT por superordenador Cray, construido por los EE.UU. Departamento de Energía del Laboratorio Nacional de Oak Ridge en Tennessee. Top500 reports currently the usage 150152 cores and an average performance of 1059000 GFLOPS and a peak performance of 1381400 GFLOPS for the LINPACK benchmark. Top500 informes en la actualidad el uso de 150.152 núcleos y un rendimiento promedio de 1059000 GFLOPS y un máximo rendimiento de 1381400 GFLOPS Linpack para el punto de referencia. DOE establishes the purpose of Jaguar as unclassified research. DOE, establece el propósito de Jaguar no clasificados como de investigación.
It is very interesting to highlight from the top500 ranking that from the top 500 supercomputers in the world, 290 are located in US (58%), followed by 49 in United Kingdom (9.20%), 26 in France (5.20%), 25 in Germany (5.00%), 17 in Japan (3.40%) and 15 in China (3.00%). Es muy interesante destacar top500 de la clasificación que de las 500 supercomputadoras en el mundo, 290 están situadas en EE.UU. (58%), seguido por 49 en Reino Unido (9,20%), 26 en Francia (5,20%), 25 en Alemania (5,00%), 17 en Japón (3,40%) y 15 en China (3,00%). Among Latin American countries, Brazil has 2 supercomputers and Mexico 1 supercomputer. Entre los países de América Latina, Brasil tiene 2 y superordenadores Mexico 1 superordenador. With respect to operating systems, 389 supercomputers use Linux which accounts for a 77.80% of the top500 ranking. Con respecto a los sistemas operativos, 389 superordenadores uso de Linux que representa un 77,80% de los top500 clasificación. However, the real percentage of supercomputers using Linux is higher is higher if we consider that specific Linux distributions as SUSE or Redhat are considered separately. Sin embargo, el porcentaje real de los superordenadores con Linux es más alto es mayor si tenemos en cuenta que las distribuciones de Linux específicos como Suse o Redhat se consideran por separado.
MIPS
MIPS es el acrónimo de "millones de instrucciones por segundo". Es una forma de medir la potencia de los procesadores. Sin embargo, esta medida sólo es útil para comparar procesadores con el mismo juego de instrucciones y usando benchmarks que fueron compilados por el mismo compilador y con el mismo nivel de optimización. Esto es debido a que la misma tarea puede necesitar un número de instrucciones diferentes si los juegos de instrucciones también lo son; y por motivos similares en las otras dos situaciones descritas. En las comparativas, usualmente se representan los valores de pico, por lo que la medida no es del todo realista. La forma en que funciona la memoria que usa el procesador también es un factor clave para la potencia de un procesador, algo que no suele considerarse en los cálculos con MIPS. Debido a estos problemas, los investigadores han creado pruebas estandardizadas tales como SpecInt para medir el funcionamiento real, y las MIPS han caído en desuso.
En el mundo de GNU/Linux se suelen referir a los MIPS como 'BogoMips'.
El equivalente en la aritmética de punto flotante de los MIPS son los flops.
Muchos microprocesadores de 8 y 16 bits han sido medidos con KIPS (kiloinstrucciones por segundo), que equivale a 0'001 MIPS. El primer microprocesador de propósito general, el Intel 8080 ejecutaba 640 KIPS. El Intel 8086 (16 bits), el primer microprocesador usado en PC, 800 KIPS. El Pentium 4 llega aproximadamente a 1'700 MIPS.
Los PC actuales realizan un máximo de 18.000 millones de operaciones lógicas por segundo. Si se ejecutan 6 instrucciones por ciclo y hay 3.000 millones de ciclos por segundo, se tienen 18.000 MIPS.

The CDC 6600 is believed to have been the first computer to be designated as a supercomputer , offering the fastest clock speed for its day (100 nanoseconds). El CDC 6600 se cree que ha sido el primer equipo para ser designado como un superordenador, que ofrece la velocidad de reloj más rápida de su día (100 nanosegundos). It was one of the first computers to use Freon refrigerant cooling and was also the first commercial computer to use a CRT console. Fue uno de los primeros ordenadores para el uso de refrigerantes freón de refrigeración y también fue la primera computadora comercial de usar un monitor CRT consola. The machine was operated for nearly a year at the 30th street location in Boulder until the Mesa Laboratory was ready in December 1966. La máquina fue operada durante casi un año en la 30 calle hasta la ubicación en el Condado de Boulder la Mesa de laboratorio estaba listo en diciembre de 1966. The CDC 6600 was a large-scale, solid-state, general-purpose computing system. El CDC 6600 fue un gran escala, de estado sólido, de uso general del sistema de computación. It had a distributed architecture (central scientific processor supported by ten very fast peripheral machines) and was a reduced instruction set (RISC) machine many years before such a term was invented. Tuvo una arquitectura distribuida (procesador central de científicos apoyados por diez máquinas periféricas muy rápido) y se redujo un conjunto de instrucciones (RISC) máquina de muchos años antes de este término fue inventado. Input to the computer was by punch cards or seven-channel digital magnetic tape. De entrada al equipo fue por tarjetas perforadas o siete canales digitales en cinta magnética. Output was available from two line printers, a cardpunch, a photographic plotter, and standard magnetic tape. Se dispone de salida de línea de dos impresoras, una cardpunch, un trazador de fotografía, y el nivel de cinta magnética. An interactive display console allowed users to view graphical results as data were being processed. Una consola de visualización interactiva permite a los usuarios ver los resultados gráficos de los datos se están procesando. The CDC 6600 had 65,000 60-bit words of memory. El CDC 6600 tenía 65.000 60-bits palabras de memoria. It was equipped with a large disk storage device and six high-speed drums as storage intermediate in speed and accessibility between the central core storage and magnetic tapes. Fue equipado con un gran dispositivo de almacenamiento en disco y seis de alta velocidad como los bidones de almacenamiento intermedio en la velocidad y la accesibilidad entre el núcleo central de almacenamiento y las cintas magnéticas. The 6600 supported the FORTRAN 66 compiler and a program library. El 6600 apoyó el compilador Fortran 66 y un programa de biblioteca. The CDC 6600 was decommissioned in 1977. El CDC 6600 fue desmantelada en 1977.
Modern supercomputing began in the 1970s with the introduction of vector processors. Supercomputación moderna comenzó en la década de 1970 con la introducción de los procesadores vectoriales. Many of the newer players developed their own such processors at a lower price to enter the market. In the early to mid 1980s, performance advancement was obtained through improvements in vector processor technology and the introduction of symmetric multiprocessors (SMPs). Dongarra [3] defined SMP as “[A] computer system that has two or more processors connected in the same cabinet, managed by one operating system, sharing the same memory, and having equal access to input/output devices.” Muchos de los nuevos jugadores desarrollado sus propios procesadores de este tipo a un precio inferior a entrar en el mercado. En la primera mitad del decenio de 1980, los resultados se obtuvo el progreso a través de mejoras en la tecnología de procesador de vectores y la introducción de multiprocesadores simétricos (SMPs). Dongarra [3 ] SMP define como "[A] sistema informático que tiene dos o más procesadores conectados en el mismo gabinete, dirigido por un sistema operativo, que comparten la misma memoria, y que tengan igualdad de acceso a los dispositivos de entrada / salida."
The early and mid-1980s saw machines with a modest number of vector processors working in parallel to become the standard. Los principios y mediados de los años 1980 vieron las máquinas con un modesto número de procesadores de vectores que trabajan en paralelo para convertirse en la norma. Typical numbers of processors were in the range of four to sixteen. Típico número de procesadores se encuentran en el rango de cuatro a dieciséis. During the first half of the 1980s, much attention was paid to the marketability of supercomputers so that manufactures were able to sell enough systems to stay in business. Durante la primera mitad de la década de 1980, se prestó mucha atención a la comercialización de los superordenadores a fin de que se fabrica en condiciones de vender lo suficiente para permanecer en los sistemas de negocio. This included development of “standard programming environments, operating systems, and key applications” [3]. Esto incluía el desarrollo de "entornos de programación estándar, sistemas operativos y aplicaciones clave" [3].
Supercomputers built in the early-80s used the shared memory model (SM), which limited scalability in such systems. Superordenadores construido a principios de los años 80 utilizó el modelo de memoria compartida (SM), que limita la escalabilidad de estos sistemas. In the later 1980s and early 1990s, attention turned from SM to distributed memory (DM) implemented by massive parallel processing systems with thousands of “ordinary” CPUs, some being off the shelf units and others being custom designs. En los últimos años 1980 y principios de 1990, la atención de SM convertido a memoria distribuida (DM), aplicadas por los sistemas de procesamiento paralelo masivo con miles de "ordinaria" CPU, algunos de ellos, frente a las estanterías y otros son diseños personalizados. This shift in focus was accompanied by an increase in performance of standard off-the-shelf processors due to the transition to RISC architectures and the introduction of CMOS technology. Este cambio de enfoque fue acompañado por un aumento en el rendimiento de la norma fuera de los procesadores de la plataforma debido a la transición a arquitecturas RISC y la introducción de la tecnología CMOS. This leads to the introduction of the concept of massively parallel processors (MPP) [3].Vaughan-Nichols [7] defines a MPP as a system using many CPUs, each with its own memory, running in parallel and linked by high-speed interconnections to execute the various parts of a program. Esto lleva a la introducción del concepto de procesadores masivamente paralelo (MPP) [3]. Vaughan-Nichols [7] define un PMP como un sistema que utiliza muchos CPUs, cada una con su propia memoria, funcionando en paralelo y conectados por alta velocidad de las interconexiones para la ejecución de las distintas partes de un programa. His use of “many” to describe the number of processors is a rather relative term. IBM Roadrunner, currently the world's fastest supercomputer is listed as a hybrid design with 12,960 IBM PowerXCell 8i CPUs and 6,480 AMD Opteron dual-core processors in specially designed server blades connected by Infiniband [8] but a computer with a few orders of magnitude fewer processors could also be described as having “many” processors. Dongarra suggests considering “many” to mean “larger than the current largest number of processors in a shared-memory machine.” Su uso de "muchos" para describir el número de procesadores es más bien un término relativo. Roadrunner de IBM, que actualmente es el superordenador más rápido del mundo se muestra como un híbrido de diseño de IBM con 12.960 procesadores PowerXCell 8i y 6.480 AMD Opteron de doble núcleo en procesadores diseñados especialmente para servidor hojas unidas por Infiniband [8], pero un equipo con algunas órdenes de magnitud menor número de procesadores también podrían ser descritos como "muchos" los transformadores. Dongarra sugiere considerar "muchos" en el sentido de "más grande que la actual mayor número de procesadores en un compromiso memoria-máquina ".
In order to provide a more reliable basis for statistics on high-performance computers, the Top500 list was introduced in 1993. Con el fin de proporcionar una base más fiable para las estadísticas sobre los ordenadores de alto rendimiento, la lista Top500 se introdujo en 1993. Initially this ranking made usage of the Linpack benchmark. Inicialmente hizo uso de esta clasificación de la referencia Linpack. LINPACK is a software library for performing numerical linear algebra on digital computers. Linpack biblioteca es un software para realizar el álgebra lineal numérica en ordenadores digitales. It was written in Fortran by Dongarra and other researchers between late 1970s and early 1980s for use with supercomputers. Fue escrito en Fortran Dongarra y por otros investigadores entre fines del decenio de 1970 y principios de 1980 para su uso con superordenadores. This decision was controversial since LINPACK is considered to over-estimate the capability of microprocessor-based machines [4]. Esta decisión fue polémica desde Linpack se considera a la sobre-estimación de la capacidad de las máquinas basadas en microprocesadores [4]. LINPACK has actually been largely superseded by LAPACK, which runs more efficiently on modern architectures. Linpack ha sido sustituida en gran parte por LAPACK, que será más eficaz en las modernas arquitecturas.
Until the introduction of the Earth Simulator supercomputer in 2002, MPP machines dominated the supercomputer industry [6]. The percentage of machines on the Top500 list utilizing vector processors had been steadily decreasing over the years, and had appeared to stabilize around 10% in 2003 (Feitelson 2005). When introduced, Earth Simulator was the world's fastest supercomputer and featured vector processors in a MPP architecture [4]. Hasta la introducción de la supercomputadora en el Simulador de la Tierra de 2002, dominó el MPP máquinas superordenador industria [6]. El porcentaje de las máquinas en la lista Top500 la utilización de procesadores de vectores se ha disminuido de manera constante en los últimos años, y ha aparecido a estabilizar en torno al 10% en 2003 (Feitelson 2005). Cuando se presentó, Simulador de la Tierra era el superordenador más rápido del mundo y figura en un vector de procesadores MPP arquitectura [4]. According to Dongarra, this “demonstrated that many scientific applications could benefit greatly from other computer architectures.” Feitelson highlights that researchers in Japan , where the Earth Simulator is located, have preferred the vector processing approach, while American companies have preferred to use commodity microprocessors. Según Dongarra, esto "demuestra que muchas aplicaciones científicas podrían beneficiarse en gran medida de otras arquitecturas de computadora." Feitelson destaca que los investigadores en Japón, donde el Simulador de la Tierra se encuentra, han preferido el enfoque de procesamiento de vectores, mientras que las empresas norteamericanas han preferido utilizar los microprocesadores .
Currently, the focus in supercomputing is on clustered systems, as Strohmaier and Meuer note that the number of clustered systems on the Top500 list has grown considerably. Dongarra defines “cluster” as a “commonly found computing environment consisting of many PCs or workstations connected together by a local-area network.” He also comments that a long running trend indicates that it is increasingly rewarding to aggregate the computational power of relatively small machines. As the typical desktop computer has become more powerful over the years, it can now be considered a significant computing resource [3]. Actualmente, en el centro de supercomputación se agrupan en sistemas, como Strohmaier Meuer y observar que el número de sistemas agrupados en la lista Top500 ha crecido considerablemente. Dongarra define el "grupo" como "se encuentran entorno compuesto de muchos ordenadores conectados entre sí o de trabajo por una red de área local. "También comenta que una larga tendencia indica que cada vez es más gratificante para agregar la potencia de cálculo de máquinas relativamente pequeño. Como la típica computadora de escritorio se ha vuelto más poderoso a través de los años, ahora puede ser considerada una parte significativa de recursos de computación [3]. Coupling groups of commodity computers together with high-speed interconnects has proved to be a successful venture, lowering costs and putting supercomputers within reach of new users [7]. As an example, Vaughan-Nichols [7] cites Viriginia Tech's new Terascale Cluster, built with 1,100 off-the-shelf Apple computers, Cisco Systems' 4500 Gigabit switches, and 24 96-port Infiniband switches. The Terascale cluster was built in 4 months and cost a relatively small $5.2 million. In summary, clusters of PCs and workstations have become the prevalent architecture for many HPC application areas in all ranges of performance in recent years [3]. Acoplamiento de los grupos de ordenadores, así como con interconexiones de alta velocidad ha demostrado ser una empresa exitosa, reduciendo los costos y la puesta superordenadores al alcance de los nuevos usuarios [7]. A modo de ejemplo, Vaughan-Nichols [7] cita Viriginia Tech nuevo Terascale grupo, con 1.100 construidos fuera de la plataforma con ordenadores Apple, Cisco Systems conmutadores Gigabit 4500, y 24 96-puerto Infiniband interruptores. Terascale El grupo fue construido en 4 meses y un costo relativamente pequeño 5,2 millones de dólares. En resumen, las agrupaciones de PC y estaciones de trabajo se han convertido en la prevalencia de la arquitectura HPC para muchas áreas de aplicación en todos los rangos de rendimiento en los últimos años [3].
4.
4. LINPACK and LAPACK Linpack y LAPACK
LINPACK is a software library for performing numerical linear algebra on digital computers. Linpack es una biblioteca de software para la realización de álgebra lineal numérica en ordenadores digitales. It was written in Fortran by Jack Dongarra, Jim Bunch, Cleve Moler, and Pete Stewart, and was intended for use on supercomputers in the 1970s and early 1980s. Fue escrito en Fortran por Jack Dongarra, Jim Bunch, Cleve Moler, y Pete Stewart, y fue destinado a ser utilizado en supercomputadoras en la década de 1970 y principios de 1980. It has been largely superseded by LAPACK, which will run more efficiently on modern architectures. Se ha sustituido en gran medida por LAPACK, que se desarrollará de manera más eficiente en las modernas arquitecturas.
LINPACK is a collection of FORTRAN subroutines that analyze and solve linear equations and linear least-squares problems. Linpack es una colección de subrutinas FORTRAN que analizar y resolver ecuaciones lineales y lineales de mínimos cuadrados problemas. The package solves linear systems whose matrices are general, banded, symmetric indefinite, symmetric positive definite, triangular, and tridiagonal square. El paquete que resuelve sistemas lineales de matrices son generales, bandas, simétrico indefinida, simétrica positiva definida, triangulares, cuadrados y tridiagonal. In addition, the package computes the QR and singular value decompositions of rectangular matrices and applies them to least-squares problems. Además, el paquete que calcula el QR y singular valor decompositions de matrices rectangulares y las aplica a los problemas de mínimos cuadrados. LINPACK uses column-oriented algorithms to increase efficiency by preserving locality of reference. Linpack utiliza algoritmos columna orientada a aumentar la eficiencia mediante la preservación de la localidad de referencia. The result is reported in millions of floating point operations per second (MFLOP/s, sometimes simply called FLOPS). El resultado es en millones de operaciones de punto flotante por segundo (MFLOP / s, a veces simplemente llamado FLOPS).
LAPACK can be seen as the successor to the original LINPACK, which was designed to run on the then-modern vector computers with shared memory. LAPACK puede considerarse como la sucesora de la original Linpack, el cual fue diseñado para ejecutarse en el entonces moderno vector computadoras con memoria compartida. LAPACK, in contrast, depends upon the Basic Linear Algebra Subprograms (BLAS) in order to effectively exploit the caches on modern cache-based architectures, and thus can run orders of magnitude faster than LINPACK on such machines, given a well-tuned BLAS implementation. LAPACK, en cambio, depende de los subprogramas Álgebra lineal básica (BLAS) con el fin de explotar las cachés en los modernos basados en las arquitecturas de memoria caché y, por tanto, puede ejecutar órdenes de magnitud más rápido que Linpack de dichas máquinas, un bien afinada aplicación BLAS . LAPACK has also been extended to run on distributed-memory systems in later packages such as ScaLAPACK and PLAPACK. LAPACK se ha ampliado también a ejecutarse en los sistemas de memoria distribuida en paquetes, como más tarde ScaLAPACK y PLAPACK.
5. Top supercomputers 5. Superordenadores Arriba
IBM Roadrunner currently occupies the first position in the 32 nd edition of the prestigious top500 ranking [8]. IBM Roadrunner ocupa actualmente la primera posición en la 32 ª edición del prestigioso ranking top500 [8]. It was built by IBM for the computer for the US Department of Energy's (DOE) National Nuclear Security Administration and it is located at Los Alamos National Laboratory. Fue construido por IBM para el equipo de los EE.UU. del Departamento de Energía (DOE), Administración Nacional de Seguridad Nuclear y se encuentra ubicado en Los Alamos National Laboratory. It is a hybrid design with 12,960 IBM PowerXCell 8i CPUs and 6,480 AMD Opteron dual-core processors in specially designed server blades connected by Infiniband. Es un híbrido de diseño de IBM con 12.960 procesadores PowerXCell 8i y 6.480 AMD Opteron de doble núcleo en procesadores diseñados especialmente para las hojas de servidor conectados por Infiniband. The Roadrunner uses Red Hat Enterprise Linux along with Fedora as its operating systems and is managed with xCAT distributed computing software. El Roadrunner utiliza Red Hat Enterprise Linux con Fedora como a lo largo de sus sistemas operativos y se gestiona con el software de informática distribuida xCAT. Top500 [8] reports an average performance of 1105000 GFLOPS and a peak performance of 1456704 GFLOPS for the LINPACK benchmark. Top500 [8] informa de un rendimiento medio de 1105000 GFLOPS y un máximo rendimiento de 1456704 GFLOPS Linpack para el punto de referencia. Roadrunner uses the Open MPI Message Passing Interface implementation. Roadrunner utiliza el Open MPI Message Passing Interface aplicación. Roadrunner occupies approximately 6,000 square feet (560 m2) and became operational in 2008. Roadrunner ocupa aproximadamente 6.000 pies cuadrados (560 m2) y entró en funcionamiento en 2008. The DOE plans to use the computer for simulating how nuclear materials age in order to predict whether the USA 's aging arsenal of nuclear weapons is safe and reliable. El DOE planes para usar la computadora para simular la forma en la edad de materiales nucleares con el fin de predecir si los EE.UU. 's envejecimiento arsenal de armas nucleares es seguro y fiable. Other uses for the Roadrunner include the sciences, financial, automotive and aerospace industries. Otros usos para la Roadrunner incluyen las ciencias, la financiera, las industrias automotriz y aeroespacial.
At second position is the Jaguar XT supercomputer by Cray, built for the US Department of Energy's Oak Ridge National Laboratory in Tennessee . En segunda posición es la Jaguar XT por superordenador Cray, construido por los EE.UU. Departamento de Energía del Laboratorio Nacional de Oak Ridge en Tennessee. Top500 reports currently the usage 150152 cores and an average performance of 1059000 GFLOPS and a peak performance of 1381400 GFLOPS for the LINPACK benchmark. Top500 informes en la actualidad el uso de 150.152 núcleos y un rendimiento promedio de 1059000 GFLOPS y un máximo rendimiento de 1381400 GFLOPS Linpack para el punto de referencia. DOE establishes the purpose of Jaguar as unclassified research. DOE, establece el propósito de Jaguar no clasificados como de investigación.
It is very interesting to highlight from the top500 ranking that from the top 500 supercomputers in the world, 290 are located in US (58%), followed by 49 in United Kingdom (9.20%), 26 in France (5.20%), 25 in Germany (5.00%), 17 in Japan (3.40%) and 15 in China (3.00%). Es muy interesante destacar top500 de la clasificación que de las 500 supercomputadoras en el mundo, 290 están situadas en EE.UU. (58%), seguido por 49 en Reino Unido (9,20%), 26 en Francia (5,20%), 25 en Alemania (5,00%), 17 en Japón (3,40%) y 15 en China (3,00%). Among Latin American countries, Brazil has 2 supercomputers and Mexico 1 supercomputer. Entre los países de América Latina, Brasil tiene 2 y superordenadores Mexico 1 superordenador. With respect to operating systems, 389 supercomputers use Linux which accounts for a 77.80% of the top500 ranking. Con respecto a los sistemas operativos, 389 superordenadores uso de Linux que representa un 77,80% de los top500 clasificación. However, the real percentage of supercomputers using Linux is higher is higher if we consider that specific Linux distributions as SUSE or Redhat are considered separately. Sin embargo, el porcentaje real de los superordenadores con Linux es más alto es mayor si tenemos en cuenta que las distribuciones de Linux específicos como Suse o Redhat se consideran por separado.
MIPS
MIPS es el acrónimo de "millones de instrucciones por segundo". Es una forma de medir la potencia de los procesadores. Sin embargo, esta medida sólo es útil para comparar procesadores con el mismo juego de instrucciones y usando benchmarks que fueron compilados por el mismo compilador y con el mismo nivel de optimización. Esto es debido a que la misma tarea puede necesitar un número de instrucciones diferentes si los juegos de instrucciones también lo son; y por motivos similares en las otras dos situaciones descritas. En las comparativas, usualmente se representan los valores de pico, por lo que la medida no es del todo realista. La forma en que funciona la memoria que usa el procesador también es un factor clave para la potencia de un procesador, algo que no suele considerarse en los cálculos con MIPS. Debido a estos problemas, los investigadores han creado pruebas estandardizadas tales como SpecInt para medir el funcionamiento real, y las MIPS han caído en desuso.
En el mundo de GNU/Linux se suelen referir a los MIPS como 'BogoMips'.
El equivalente en la aritmética de punto flotante de los MIPS son los flops.
Muchos microprocesadores de 8 y 16 bits han sido medidos con KIPS (kiloinstrucciones por segundo), que equivale a 0'001 MIPS. El primer microprocesador de propósito general, el Intel 8080 ejecutaba 640 KIPS. El Intel 8086 (16 bits), el primer microprocesador usado en PC, 800 KIPS. El Pentium 4 llega aproximadamente a 1'700 MIPS.
Los PC actuales realizan un máximo de 18.000 millones de operaciones lógicas por segundo. Si se ejecutan 6 instrucciones por ciclo y hay 3.000 millones de ciclos por segundo, se tienen 18.000 MIPS.


No hay comentarios:
Publicar un comentario