proyecto 3 cgmr, kdpc
TRANSCRIPT
-
8/16/2019 Proyecto 3 Cgmr, Kdpc
1/4
Arquitectura de Computadoras 400-cib
Proyecto 3: Tecnología AMDIntegrantes:
Méndez Ramos César Gabriel Patiño Cazares Karla Daniela
1. Procesador Multi-core x86- El desempeño de un procesador x86 proporciona velocidad en la accesibilidad, así como
agregar procesadores adicionales que proporcionan un extra rendimiento. Incluye sets deinstrucciones y mayores registros para agilizar las tareas. Se basa en la arquitectura CISC,que a pesar del mayor consumo de energía des obtiene un desempeño alto; incluyeinstrucciones para operar en coma flotante.
AMDOpteron
“Barcelona” “Shangai” “Istanbul” “MGNY -Cours” “Lisbon”
“Interlagos” /“Valencia”
Mfg.Process
130nm 65nm 45nm 45nm 45nm 32nm
CPUCore
K8 GHZ 2,3-2,9 GHZ 2,2-2,8 GHZ 2,0-2,6 GHZ 1,6-3,0GHZ
L2 Cache 1 MB 4x512 KB 4x512 KB 6x512 KB 8x512 KB 6 MBL3 Cache 0 2 MB 6 MB 6MB 2x6 MB
Compartida38 MBcompartida
HT Links 3 3 3 3 3 3HT Rate 1.6 GT/s 1 GHZ 2 GHZ 2 GHZ 3,1 a 3,2 GHZ 3,1 a 3,2
GHZMemory DDR DDR2 DDR2/DDR
3DDR2800MHZ
DDR3 133 MHZ DDR3 1866MHZ
MemoryChannels
2 4 4 4 4 4
MaxSpeed
333 333 540 660 1024 1024
Define como funciona la aqrquitectura MAgny Cours que se muestra en la figura con cada uno de suselementos:
- El fetch se encarga de la búsqueda de instrucciones.- El decode de la decodificación de instrucciones.- Integrer Scheduler: son dos planificadores que se encargan de ejecutar dos tareas de forma
simultánea y efectiva.
-
8/16/2019 Proyecto 3 Cgmr, Kdpc
2/4
Arquitectura de Computadoras 400-cib
- FP Scheduler: es un planificador que se usa para poder reducir el consumo de energía y hacerque sea mas eficiente.
- FPU: su principal función como componente de la unidad central del procesador, es en lasoperaciones de coma flotante. Esas operaciones básicas son la suma y la multiplicación,aunque en algunos sistemas se pueden realizar cálculos trigonométricos y exponenciales.
- Pipeling: es una técnica que implementa una forma de paralelismo. Permite al procesador irmás rápido, esto quiere decir que una instrucción es dividida en diferentes secuencias que seejecutan en paralelo y son procesadas concurrentemente.
- Cache: es una memoria especial que en esencia tiene el mismo funcionamiento que el de lamemoria principal pero a diferencia de esta, es de menor tamaño, y al momento de hacer unacceso a esta es más fácil y eficaz
Define como funciona la arquitectura Bulldozer Module que se muestra en la figura con cada uno desus elementos:
- Fetch: se encarga de la búsqueda de instrucciones.- Decode: se encarga de la decodificación de instrucciones.
- Integrer Scheduler: son dos planificadores que se encargan de ejecutar dos tareas de formasimultánea y efectiva.
- FP Scheduler: es un planificador que se usa para poder reducir el consumo de energía y hacerque sea mas eficiente.
- FPU: consta de dos unidades de 128 bits FMA, las cuales tienen la capacidad de combinarseen un FPU de 256 bits.
- Pipeling: es la etapa en donde la búsqueda y la decodificación se llevan a cabo.- Cache: L2 compartida.
Incluye las siguientes características:
Bulldozer modle: dos núcleos en una unidad simple que habilita dos hilos simultáneamente,los bloques de construcción del Bulldozer se destruyen.
Parallel Threads: la capacidad de ejecutar dos hilos en dos núcleos no compartidos sincomprometer o crear cuellos de botella.
Flex FP: una unidad de punto flotante flexible que puede ser dedicada o compartida entre dosnúcleos por ciclo.
Dedicated Scheduler: planificadores independientemente integrado y un planificador FP paramejorar la escalabilidad mediante una ejecución eficiente.
Escalabilidad para multihilos
2. Professional Graphics
- La arquitectura GPU enfatiza los shaders en vez de una función lógica arreglada.- Enorme capacidad computacional para el trabajo de datos en paralelo.- Balance potencial para mejorar el sistema.- Nuevas instrucciones matemáticas para los centros de datos: alto rendimiento.- Aplicaciones:
Cargas de trabajo paralelas, serie y tareas. Gráficos de cargas de trabajo. Cargas de trabajo de datos en paralelo.
-
8/16/2019 Proyecto 3 Cgmr, Kdpc
3/4
Arquitectura de Computadoras 400-cib
- Explica cómo se logra lo siguiente: 3D Accelerators For Visualization
Un gráfico 3D difiere de uno bidimensional principalmente por la forma en que hasido generado. Este tipo de gráficos se originan mediante un proceso de cálculosmatemáticos sobre entidades geométricas tridimensionales producidas en unordenador, y cuyo propósito es conseguir una proyección visual en dos dimensiones
para ser mostrada en una pantalla o impresa en papel.
Aceleración por hardware es el uso del hardware para realizar alguna función másrápido de lo que es posible usando software ejecutándose en una CPU de propósitogeneral. Ejemplos de aceleración por hardware incluyen aceleración de lafuncionalidad de Bit blit en GPUs e instrucciones para operaciones complejas enCPUs.
El hardware que realiza la aceleración, cuando se encuentra en una unidad separada
de la CPU, es denominado acelerador por hardware, o a menudo más específicamentecomo un acelerador gráfico o Unidad de coma flotante, etc. Estos términos, sinembargo, son antiguos y se han substituido por términos menos descriptivos como"placa de video" o "placa gráfica".
Ve y haz más con tus datos.
3. ATI Stream Computing
ATI Stream Technology:
- Heterogeneo: desarrolladores de apalancamiento AMD GPUs y CPUs para un óptimorendimiento de aplicaciones y experiencia de usuarios.
- Estándares de la Indu stria: OpenCL ™ y DirectCompute 11 permiten el desarrollomultiplataforma.
- Alto rendimiento: Masivamente en paralelo, la arquitectura programable de un GPU permiteun rendimiento y la eficiencia de energía avanzado.
ATI Stream SDK v2.0 Beta: OpenCL ™ En CPUs x86 multinúcleo y GPUs . El Poder de Fusión:Desarrolladores apalancamiento arquitectura heterogénea para ofrecer la experiencia de usuariosuperior.
- Primera plataforma completa de desarrollo OpenCL ™
- Certificado OpenCL ™ 1.0 compatible por el Grupo Khronos - Escribir códigos que pueden escalar bien en las CPUs multi-núcleo y GPUs.- AMD cumple con la promesa de OpenCL ™, con las ambas tecnologías de CPU y GPU de
alto rendimiento- Disponible para descarga gratuita como parte del programa beta ATI Stream SDK - incluye
documentación, muestras, y soporte para desarrolladores.
-
8/16/2019 Proyecto 3 Cgmr, Kdpc
4/4
Arquitectura de Computadoras 400-cib
Explica la frase “Moving Past Proprietary Solutions for Ease of Cross -Platform Programming”:
Por medio de las diferentes herramientas es como se manejan las interfaces estándar (OpneCL,DirectX, OpenGL). Desarrollo para el manejo simultáneo de estas tres interfaces y con los CPUsy GPUs hay un aprovechamiento balanceado de la plataforma.
- GPU Optimized For Computation :- Massive Data-parallel Processing: El procesamiento simultáneo de datos de forma
masiva.- High Performance Per Watt: El costo de alto rendimiento en una computadora, por
cuantos watts se requieren para mantener su uso óptimo.