juan david pineda-cárdenas - eafit...juan david pineda-cárdenas ciclo de conferencias centro de...

32

Upload: others

Post on 07-May-2020

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Juan David Pineda-Cárdenas - EAFIT...Juan David Pineda-Cárdenas  Ciclo de Conferencias Centro de Computación Científica APOLO Universidad EAFIT Optimizando

Juan David Pineda-Caacuterdenasltjpineda2eafiteducogt

Ciclo de ConferenciasCentro de Computacioacuten Cientiacutefica APOLO

Universidad EAFIT

Optimizando su coacutedigo serial y paralelo con algunas de las herramientas de desarrollo de Intel

Tomado de httpsnewsroomintelcomeditorialsadvancing-security-silicon-level

Avance de la seguridad a nivel del silicio

ldquoToday I want to provide several updates that show continued progress to fulfill that pledge First we have now released microcode updates for 100 percent of Intel products launched in the past five years that require protection against the side-channel method vulnerabilities discovered by Google As part of this I want to recognize and express my appreciation to all of the industry partners who worked closely with us to develop and test these updates and make sure they were ready for productionrdquo

By Brian Krzanich - CEO Intel Corp

Avance de la seguridad a nivel del silicio

ldquoWhile Variant 1 will continue to be addressed via software mitigations we are making changes to our hardware design to further address the other two We have redesigned parts of the processor to introduce new levels of protection through partitioning that will protect against both Variants 2 and 3 Think of this partitioning as additional ldquoprotective wallsrdquo between applications and user privilege levels to create an obstacle for bad actorsrdquo

By Brian Krzanich - CEO Intel Corp

Tomado de Fundamentals of Parallelism on Intel Architecture Colfax Research Intel Coursera httpsescourseraorglearnparallelism-ia

Tomado de Fundamentals of Parallelism on Intel Architecture Colfax Research Intel Coursera httpsescourseraorglearnparallelism-ia

Tomado de Fundamentals of Parallelism on Intel Architecture Colfax Research Intel Coursera httpsescourseraorglearnparallelism-ia

Capas de Programacioacuten Paralela

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Paralelismo Nuacutecleos y vectores

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Plataformas de Coacutemputo de Intel

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Intel Xeon

1- 2- 4 CPUs por Servidor Propoacutesito General Altamente Paralelos (44 nuacutecleos) Rico en recursos (+ cores + cache) ldquoForgiving Performancerdquo ~ 10 TFLOPs en DP (Teoacuterico) ~ 154 GBs de ancho de banda

(Medido)2-way Intel Xeon Broadwell architecture (2016) top of the line (eg E5-2699 V4)

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Intel Xeon Phi (2a Generacioacuten)

Booteable PCIe add-in card Especializado para HPC Altamente paralelo (72 nuacutecleos) Balanceado para coacutemputo ldquoLess forgiving than Xeonrdquo ~ 30 TFLOPs en DP (Teoacuterico) ~ 490 GBs de ancho de banda

(Medido) Intel Xeon Phi Knights Landing architecture (2016) top of the line (eg 7290P)

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Un coacutedigo para todas las plataformas

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Computacioacuten en Ciencia e Ingenieriacutea

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Aacutereas de Optimizacioacuten

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Experiencia en Modernizacioacuten de Coacutedigo Comuacuten

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Multihilos con OpenMP

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Vectorizacioacuten con Compiladores Intel

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Traacutefico de memoria

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Clusters y MPI

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Intel en Apolo

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones generales para optimizacioacuten -O1

Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto

Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos

-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel

Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito

OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones

-xHost Le dice al compilador que genere instrucciones para el

conjunto de instrucciones maacutes alto que esteacute disponible

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -mlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets

SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -xlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets

COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3

Math Kernel Library

Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo

Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial

Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo

iquestDoacutende Obtenerlo

bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator

Recurso Introduccioacuten a OpenMP

httpsyoutubenE-xN4Bf8XI

bull

Python Intel Distribution

httpssoftwareintelcomen-usdistribution-for-python

bull

httpcourseraorglearnparallelism-ia

Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture

httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials

httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++

httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization

Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction

httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization

httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation

httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783

Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining

Referencias y Recursos

Page 2: Juan David Pineda-Cárdenas - EAFIT...Juan David Pineda-Cárdenas  Ciclo de Conferencias Centro de Computación Científica APOLO Universidad EAFIT Optimizando

Tomado de httpsnewsroomintelcomeditorialsadvancing-security-silicon-level

Avance de la seguridad a nivel del silicio

ldquoToday I want to provide several updates that show continued progress to fulfill that pledge First we have now released microcode updates for 100 percent of Intel products launched in the past five years that require protection against the side-channel method vulnerabilities discovered by Google As part of this I want to recognize and express my appreciation to all of the industry partners who worked closely with us to develop and test these updates and make sure they were ready for productionrdquo

By Brian Krzanich - CEO Intel Corp

Avance de la seguridad a nivel del silicio

ldquoWhile Variant 1 will continue to be addressed via software mitigations we are making changes to our hardware design to further address the other two We have redesigned parts of the processor to introduce new levels of protection through partitioning that will protect against both Variants 2 and 3 Think of this partitioning as additional ldquoprotective wallsrdquo between applications and user privilege levels to create an obstacle for bad actorsrdquo

By Brian Krzanich - CEO Intel Corp

Tomado de Fundamentals of Parallelism on Intel Architecture Colfax Research Intel Coursera httpsescourseraorglearnparallelism-ia

Tomado de Fundamentals of Parallelism on Intel Architecture Colfax Research Intel Coursera httpsescourseraorglearnparallelism-ia

Tomado de Fundamentals of Parallelism on Intel Architecture Colfax Research Intel Coursera httpsescourseraorglearnparallelism-ia

Capas de Programacioacuten Paralela

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Paralelismo Nuacutecleos y vectores

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Plataformas de Coacutemputo de Intel

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Intel Xeon

1- 2- 4 CPUs por Servidor Propoacutesito General Altamente Paralelos (44 nuacutecleos) Rico en recursos (+ cores + cache) ldquoForgiving Performancerdquo ~ 10 TFLOPs en DP (Teoacuterico) ~ 154 GBs de ancho de banda

(Medido)2-way Intel Xeon Broadwell architecture (2016) top of the line (eg E5-2699 V4)

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Intel Xeon Phi (2a Generacioacuten)

Booteable PCIe add-in card Especializado para HPC Altamente paralelo (72 nuacutecleos) Balanceado para coacutemputo ldquoLess forgiving than Xeonrdquo ~ 30 TFLOPs en DP (Teoacuterico) ~ 490 GBs de ancho de banda

(Medido) Intel Xeon Phi Knights Landing architecture (2016) top of the line (eg 7290P)

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Un coacutedigo para todas las plataformas

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Computacioacuten en Ciencia e Ingenieriacutea

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Aacutereas de Optimizacioacuten

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Experiencia en Modernizacioacuten de Coacutedigo Comuacuten

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Multihilos con OpenMP

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Vectorizacioacuten con Compiladores Intel

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Traacutefico de memoria

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Clusters y MPI

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Intel en Apolo

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones generales para optimizacioacuten -O1

Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto

Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos

-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel

Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito

OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones

-xHost Le dice al compilador que genere instrucciones para el

conjunto de instrucciones maacutes alto que esteacute disponible

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -mlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets

SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -xlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets

COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3

Math Kernel Library

Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo

Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial

Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo

iquestDoacutende Obtenerlo

bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator

Recurso Introduccioacuten a OpenMP

httpsyoutubenE-xN4Bf8XI

bull

Python Intel Distribution

httpssoftwareintelcomen-usdistribution-for-python

bull

httpcourseraorglearnparallelism-ia

Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture

httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials

httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++

httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization

Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction

httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization

httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation

httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783

Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining

Referencias y Recursos

Page 3: Juan David Pineda-Cárdenas - EAFIT...Juan David Pineda-Cárdenas  Ciclo de Conferencias Centro de Computación Científica APOLO Universidad EAFIT Optimizando

Avance de la seguridad a nivel del silicio

ldquoToday I want to provide several updates that show continued progress to fulfill that pledge First we have now released microcode updates for 100 percent of Intel products launched in the past five years that require protection against the side-channel method vulnerabilities discovered by Google As part of this I want to recognize and express my appreciation to all of the industry partners who worked closely with us to develop and test these updates and make sure they were ready for productionrdquo

By Brian Krzanich - CEO Intel Corp

Avance de la seguridad a nivel del silicio

ldquoWhile Variant 1 will continue to be addressed via software mitigations we are making changes to our hardware design to further address the other two We have redesigned parts of the processor to introduce new levels of protection through partitioning that will protect against both Variants 2 and 3 Think of this partitioning as additional ldquoprotective wallsrdquo between applications and user privilege levels to create an obstacle for bad actorsrdquo

By Brian Krzanich - CEO Intel Corp

Tomado de Fundamentals of Parallelism on Intel Architecture Colfax Research Intel Coursera httpsescourseraorglearnparallelism-ia

Tomado de Fundamentals of Parallelism on Intel Architecture Colfax Research Intel Coursera httpsescourseraorglearnparallelism-ia

Tomado de Fundamentals of Parallelism on Intel Architecture Colfax Research Intel Coursera httpsescourseraorglearnparallelism-ia

Capas de Programacioacuten Paralela

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Paralelismo Nuacutecleos y vectores

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Plataformas de Coacutemputo de Intel

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Intel Xeon

1- 2- 4 CPUs por Servidor Propoacutesito General Altamente Paralelos (44 nuacutecleos) Rico en recursos (+ cores + cache) ldquoForgiving Performancerdquo ~ 10 TFLOPs en DP (Teoacuterico) ~ 154 GBs de ancho de banda

(Medido)2-way Intel Xeon Broadwell architecture (2016) top of the line (eg E5-2699 V4)

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Intel Xeon Phi (2a Generacioacuten)

Booteable PCIe add-in card Especializado para HPC Altamente paralelo (72 nuacutecleos) Balanceado para coacutemputo ldquoLess forgiving than Xeonrdquo ~ 30 TFLOPs en DP (Teoacuterico) ~ 490 GBs de ancho de banda

(Medido) Intel Xeon Phi Knights Landing architecture (2016) top of the line (eg 7290P)

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Un coacutedigo para todas las plataformas

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Computacioacuten en Ciencia e Ingenieriacutea

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Aacutereas de Optimizacioacuten

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Experiencia en Modernizacioacuten de Coacutedigo Comuacuten

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Multihilos con OpenMP

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Vectorizacioacuten con Compiladores Intel

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Traacutefico de memoria

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Clusters y MPI

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Intel en Apolo

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones generales para optimizacioacuten -O1

Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto

Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos

-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel

Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito

OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones

-xHost Le dice al compilador que genere instrucciones para el

conjunto de instrucciones maacutes alto que esteacute disponible

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -mlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets

SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -xlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets

COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3

Math Kernel Library

Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo

Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial

Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo

iquestDoacutende Obtenerlo

bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator

Recurso Introduccioacuten a OpenMP

httpsyoutubenE-xN4Bf8XI

bull

Python Intel Distribution

httpssoftwareintelcomen-usdistribution-for-python

bull

httpcourseraorglearnparallelism-ia

Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture

httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials

httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++

httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization

Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction

httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization

httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation

httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783

Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining

Referencias y Recursos

Page 4: Juan David Pineda-Cárdenas - EAFIT...Juan David Pineda-Cárdenas  Ciclo de Conferencias Centro de Computación Científica APOLO Universidad EAFIT Optimizando

Avance de la seguridad a nivel del silicio

ldquoWhile Variant 1 will continue to be addressed via software mitigations we are making changes to our hardware design to further address the other two We have redesigned parts of the processor to introduce new levels of protection through partitioning that will protect against both Variants 2 and 3 Think of this partitioning as additional ldquoprotective wallsrdquo between applications and user privilege levels to create an obstacle for bad actorsrdquo

By Brian Krzanich - CEO Intel Corp

Tomado de Fundamentals of Parallelism on Intel Architecture Colfax Research Intel Coursera httpsescourseraorglearnparallelism-ia

Tomado de Fundamentals of Parallelism on Intel Architecture Colfax Research Intel Coursera httpsescourseraorglearnparallelism-ia

Tomado de Fundamentals of Parallelism on Intel Architecture Colfax Research Intel Coursera httpsescourseraorglearnparallelism-ia

Capas de Programacioacuten Paralela

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Paralelismo Nuacutecleos y vectores

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Plataformas de Coacutemputo de Intel

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Intel Xeon

1- 2- 4 CPUs por Servidor Propoacutesito General Altamente Paralelos (44 nuacutecleos) Rico en recursos (+ cores + cache) ldquoForgiving Performancerdquo ~ 10 TFLOPs en DP (Teoacuterico) ~ 154 GBs de ancho de banda

(Medido)2-way Intel Xeon Broadwell architecture (2016) top of the line (eg E5-2699 V4)

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Intel Xeon Phi (2a Generacioacuten)

Booteable PCIe add-in card Especializado para HPC Altamente paralelo (72 nuacutecleos) Balanceado para coacutemputo ldquoLess forgiving than Xeonrdquo ~ 30 TFLOPs en DP (Teoacuterico) ~ 490 GBs de ancho de banda

(Medido) Intel Xeon Phi Knights Landing architecture (2016) top of the line (eg 7290P)

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Un coacutedigo para todas las plataformas

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Computacioacuten en Ciencia e Ingenieriacutea

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Aacutereas de Optimizacioacuten

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Experiencia en Modernizacioacuten de Coacutedigo Comuacuten

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Multihilos con OpenMP

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Vectorizacioacuten con Compiladores Intel

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Traacutefico de memoria

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Clusters y MPI

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Intel en Apolo

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones generales para optimizacioacuten -O1

Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto

Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos

-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel

Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito

OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones

-xHost Le dice al compilador que genere instrucciones para el

conjunto de instrucciones maacutes alto que esteacute disponible

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -mlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets

SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -xlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets

COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3

Math Kernel Library

Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo

Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial

Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo

iquestDoacutende Obtenerlo

bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator

Recurso Introduccioacuten a OpenMP

httpsyoutubenE-xN4Bf8XI

bull

Python Intel Distribution

httpssoftwareintelcomen-usdistribution-for-python

bull

httpcourseraorglearnparallelism-ia

Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture

httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials

httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++

httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization

Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction

httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization

httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation

httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783

Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining

Referencias y Recursos

Page 5: Juan David Pineda-Cárdenas - EAFIT...Juan David Pineda-Cárdenas  Ciclo de Conferencias Centro de Computación Científica APOLO Universidad EAFIT Optimizando

Tomado de Fundamentals of Parallelism on Intel Architecture Colfax Research Intel Coursera httpsescourseraorglearnparallelism-ia

Tomado de Fundamentals of Parallelism on Intel Architecture Colfax Research Intel Coursera httpsescourseraorglearnparallelism-ia

Tomado de Fundamentals of Parallelism on Intel Architecture Colfax Research Intel Coursera httpsescourseraorglearnparallelism-ia

Capas de Programacioacuten Paralela

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Paralelismo Nuacutecleos y vectores

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Plataformas de Coacutemputo de Intel

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Intel Xeon

1- 2- 4 CPUs por Servidor Propoacutesito General Altamente Paralelos (44 nuacutecleos) Rico en recursos (+ cores + cache) ldquoForgiving Performancerdquo ~ 10 TFLOPs en DP (Teoacuterico) ~ 154 GBs de ancho de banda

(Medido)2-way Intel Xeon Broadwell architecture (2016) top of the line (eg E5-2699 V4)

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Intel Xeon Phi (2a Generacioacuten)

Booteable PCIe add-in card Especializado para HPC Altamente paralelo (72 nuacutecleos) Balanceado para coacutemputo ldquoLess forgiving than Xeonrdquo ~ 30 TFLOPs en DP (Teoacuterico) ~ 490 GBs de ancho de banda

(Medido) Intel Xeon Phi Knights Landing architecture (2016) top of the line (eg 7290P)

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Un coacutedigo para todas las plataformas

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Computacioacuten en Ciencia e Ingenieriacutea

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Aacutereas de Optimizacioacuten

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Experiencia en Modernizacioacuten de Coacutedigo Comuacuten

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Multihilos con OpenMP

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Vectorizacioacuten con Compiladores Intel

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Traacutefico de memoria

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Clusters y MPI

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Intel en Apolo

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones generales para optimizacioacuten -O1

Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto

Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos

-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel

Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito

OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones

-xHost Le dice al compilador que genere instrucciones para el

conjunto de instrucciones maacutes alto que esteacute disponible

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -mlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets

SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -xlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets

COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3

Math Kernel Library

Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo

Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial

Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo

iquestDoacutende Obtenerlo

bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator

Recurso Introduccioacuten a OpenMP

httpsyoutubenE-xN4Bf8XI

bull

Python Intel Distribution

httpssoftwareintelcomen-usdistribution-for-python

bull

httpcourseraorglearnparallelism-ia

Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture

httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials

httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++

httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization

Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction

httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization

httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation

httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783

Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining

Referencias y Recursos

Page 6: Juan David Pineda-Cárdenas - EAFIT...Juan David Pineda-Cárdenas  Ciclo de Conferencias Centro de Computación Científica APOLO Universidad EAFIT Optimizando

Tomado de Fundamentals of Parallelism on Intel Architecture Colfax Research Intel Coursera httpsescourseraorglearnparallelism-ia

Tomado de Fundamentals of Parallelism on Intel Architecture Colfax Research Intel Coursera httpsescourseraorglearnparallelism-ia

Capas de Programacioacuten Paralela

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Paralelismo Nuacutecleos y vectores

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Plataformas de Coacutemputo de Intel

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Intel Xeon

1- 2- 4 CPUs por Servidor Propoacutesito General Altamente Paralelos (44 nuacutecleos) Rico en recursos (+ cores + cache) ldquoForgiving Performancerdquo ~ 10 TFLOPs en DP (Teoacuterico) ~ 154 GBs de ancho de banda

(Medido)2-way Intel Xeon Broadwell architecture (2016) top of the line (eg E5-2699 V4)

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Intel Xeon Phi (2a Generacioacuten)

Booteable PCIe add-in card Especializado para HPC Altamente paralelo (72 nuacutecleos) Balanceado para coacutemputo ldquoLess forgiving than Xeonrdquo ~ 30 TFLOPs en DP (Teoacuterico) ~ 490 GBs de ancho de banda

(Medido) Intel Xeon Phi Knights Landing architecture (2016) top of the line (eg 7290P)

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Un coacutedigo para todas las plataformas

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Computacioacuten en Ciencia e Ingenieriacutea

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Aacutereas de Optimizacioacuten

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Experiencia en Modernizacioacuten de Coacutedigo Comuacuten

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Multihilos con OpenMP

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Vectorizacioacuten con Compiladores Intel

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Traacutefico de memoria

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Clusters y MPI

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Intel en Apolo

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones generales para optimizacioacuten -O1

Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto

Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos

-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel

Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito

OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones

-xHost Le dice al compilador que genere instrucciones para el

conjunto de instrucciones maacutes alto que esteacute disponible

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -mlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets

SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -xlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets

COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3

Math Kernel Library

Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo

Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial

Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo

iquestDoacutende Obtenerlo

bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator

Recurso Introduccioacuten a OpenMP

httpsyoutubenE-xN4Bf8XI

bull

Python Intel Distribution

httpssoftwareintelcomen-usdistribution-for-python

bull

httpcourseraorglearnparallelism-ia

Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture

httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials

httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++

httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization

Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction

httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization

httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation

httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783

Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining

Referencias y Recursos

Page 7: Juan David Pineda-Cárdenas - EAFIT...Juan David Pineda-Cárdenas  Ciclo de Conferencias Centro de Computación Científica APOLO Universidad EAFIT Optimizando

Tomado de Fundamentals of Parallelism on Intel Architecture Colfax Research Intel Coursera httpsescourseraorglearnparallelism-ia

Capas de Programacioacuten Paralela

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Paralelismo Nuacutecleos y vectores

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Plataformas de Coacutemputo de Intel

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Intel Xeon

1- 2- 4 CPUs por Servidor Propoacutesito General Altamente Paralelos (44 nuacutecleos) Rico en recursos (+ cores + cache) ldquoForgiving Performancerdquo ~ 10 TFLOPs en DP (Teoacuterico) ~ 154 GBs de ancho de banda

(Medido)2-way Intel Xeon Broadwell architecture (2016) top of the line (eg E5-2699 V4)

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Intel Xeon Phi (2a Generacioacuten)

Booteable PCIe add-in card Especializado para HPC Altamente paralelo (72 nuacutecleos) Balanceado para coacutemputo ldquoLess forgiving than Xeonrdquo ~ 30 TFLOPs en DP (Teoacuterico) ~ 490 GBs de ancho de banda

(Medido) Intel Xeon Phi Knights Landing architecture (2016) top of the line (eg 7290P)

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Un coacutedigo para todas las plataformas

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Computacioacuten en Ciencia e Ingenieriacutea

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Aacutereas de Optimizacioacuten

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Experiencia en Modernizacioacuten de Coacutedigo Comuacuten

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Multihilos con OpenMP

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Vectorizacioacuten con Compiladores Intel

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Traacutefico de memoria

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Clusters y MPI

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Intel en Apolo

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones generales para optimizacioacuten -O1

Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto

Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos

-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel

Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito

OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones

-xHost Le dice al compilador que genere instrucciones para el

conjunto de instrucciones maacutes alto que esteacute disponible

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -mlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets

SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -xlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets

COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3

Math Kernel Library

Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo

Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial

Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo

iquestDoacutende Obtenerlo

bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator

Recurso Introduccioacuten a OpenMP

httpsyoutubenE-xN4Bf8XI

bull

Python Intel Distribution

httpssoftwareintelcomen-usdistribution-for-python

bull

httpcourseraorglearnparallelism-ia

Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture

httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials

httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++

httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization

Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction

httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization

httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation

httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783

Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining

Referencias y Recursos

Page 8: Juan David Pineda-Cárdenas - EAFIT...Juan David Pineda-Cárdenas  Ciclo de Conferencias Centro de Computación Científica APOLO Universidad EAFIT Optimizando

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Paralelismo Nuacutecleos y vectores

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Plataformas de Coacutemputo de Intel

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Intel Xeon

1- 2- 4 CPUs por Servidor Propoacutesito General Altamente Paralelos (44 nuacutecleos) Rico en recursos (+ cores + cache) ldquoForgiving Performancerdquo ~ 10 TFLOPs en DP (Teoacuterico) ~ 154 GBs de ancho de banda

(Medido)2-way Intel Xeon Broadwell architecture (2016) top of the line (eg E5-2699 V4)

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Intel Xeon Phi (2a Generacioacuten)

Booteable PCIe add-in card Especializado para HPC Altamente paralelo (72 nuacutecleos) Balanceado para coacutemputo ldquoLess forgiving than Xeonrdquo ~ 30 TFLOPs en DP (Teoacuterico) ~ 490 GBs de ancho de banda

(Medido) Intel Xeon Phi Knights Landing architecture (2016) top of the line (eg 7290P)

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Un coacutedigo para todas las plataformas

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Computacioacuten en Ciencia e Ingenieriacutea

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Aacutereas de Optimizacioacuten

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Experiencia en Modernizacioacuten de Coacutedigo Comuacuten

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Multihilos con OpenMP

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Vectorizacioacuten con Compiladores Intel

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Traacutefico de memoria

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Clusters y MPI

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Intel en Apolo

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones generales para optimizacioacuten -O1

Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto

Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos

-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel

Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito

OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones

-xHost Le dice al compilador que genere instrucciones para el

conjunto de instrucciones maacutes alto que esteacute disponible

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -mlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets

SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -xlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets

COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3

Math Kernel Library

Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo

Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial

Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo

iquestDoacutende Obtenerlo

bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator

Recurso Introduccioacuten a OpenMP

httpsyoutubenE-xN4Bf8XI

bull

Python Intel Distribution

httpssoftwareintelcomen-usdistribution-for-python

bull

httpcourseraorglearnparallelism-ia

Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture

httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials

httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++

httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization

Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction

httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization

httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation

httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783

Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining

Referencias y Recursos

Page 9: Juan David Pineda-Cárdenas - EAFIT...Juan David Pineda-Cárdenas  Ciclo de Conferencias Centro de Computación Científica APOLO Universidad EAFIT Optimizando

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Plataformas de Coacutemputo de Intel

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Intel Xeon

1- 2- 4 CPUs por Servidor Propoacutesito General Altamente Paralelos (44 nuacutecleos) Rico en recursos (+ cores + cache) ldquoForgiving Performancerdquo ~ 10 TFLOPs en DP (Teoacuterico) ~ 154 GBs de ancho de banda

(Medido)2-way Intel Xeon Broadwell architecture (2016) top of the line (eg E5-2699 V4)

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Intel Xeon Phi (2a Generacioacuten)

Booteable PCIe add-in card Especializado para HPC Altamente paralelo (72 nuacutecleos) Balanceado para coacutemputo ldquoLess forgiving than Xeonrdquo ~ 30 TFLOPs en DP (Teoacuterico) ~ 490 GBs de ancho de banda

(Medido) Intel Xeon Phi Knights Landing architecture (2016) top of the line (eg 7290P)

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Un coacutedigo para todas las plataformas

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Computacioacuten en Ciencia e Ingenieriacutea

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Aacutereas de Optimizacioacuten

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Experiencia en Modernizacioacuten de Coacutedigo Comuacuten

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Multihilos con OpenMP

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Vectorizacioacuten con Compiladores Intel

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Traacutefico de memoria

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Clusters y MPI

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Intel en Apolo

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones generales para optimizacioacuten -O1

Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto

Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos

-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel

Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito

OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones

-xHost Le dice al compilador que genere instrucciones para el

conjunto de instrucciones maacutes alto que esteacute disponible

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -mlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets

SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -xlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets

COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3

Math Kernel Library

Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo

Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial

Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo

iquestDoacutende Obtenerlo

bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator

Recurso Introduccioacuten a OpenMP

httpsyoutubenE-xN4Bf8XI

bull

Python Intel Distribution

httpssoftwareintelcomen-usdistribution-for-python

bull

httpcourseraorglearnparallelism-ia

Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture

httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials

httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++

httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization

Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction

httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization

httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation

httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783

Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining

Referencias y Recursos

Page 10: Juan David Pineda-Cárdenas - EAFIT...Juan David Pineda-Cárdenas  Ciclo de Conferencias Centro de Computación Científica APOLO Universidad EAFIT Optimizando

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Intel Xeon

1- 2- 4 CPUs por Servidor Propoacutesito General Altamente Paralelos (44 nuacutecleos) Rico en recursos (+ cores + cache) ldquoForgiving Performancerdquo ~ 10 TFLOPs en DP (Teoacuterico) ~ 154 GBs de ancho de banda

(Medido)2-way Intel Xeon Broadwell architecture (2016) top of the line (eg E5-2699 V4)

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Intel Xeon Phi (2a Generacioacuten)

Booteable PCIe add-in card Especializado para HPC Altamente paralelo (72 nuacutecleos) Balanceado para coacutemputo ldquoLess forgiving than Xeonrdquo ~ 30 TFLOPs en DP (Teoacuterico) ~ 490 GBs de ancho de banda

(Medido) Intel Xeon Phi Knights Landing architecture (2016) top of the line (eg 7290P)

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Un coacutedigo para todas las plataformas

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Computacioacuten en Ciencia e Ingenieriacutea

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Aacutereas de Optimizacioacuten

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Experiencia en Modernizacioacuten de Coacutedigo Comuacuten

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Multihilos con OpenMP

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Vectorizacioacuten con Compiladores Intel

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Traacutefico de memoria

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Clusters y MPI

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Intel en Apolo

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones generales para optimizacioacuten -O1

Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto

Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos

-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel

Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito

OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones

-xHost Le dice al compilador que genere instrucciones para el

conjunto de instrucciones maacutes alto que esteacute disponible

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -mlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets

SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -xlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets

COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3

Math Kernel Library

Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo

Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial

Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo

iquestDoacutende Obtenerlo

bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator

Recurso Introduccioacuten a OpenMP

httpsyoutubenE-xN4Bf8XI

bull

Python Intel Distribution

httpssoftwareintelcomen-usdistribution-for-python

bull

httpcourseraorglearnparallelism-ia

Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture

httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials

httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++

httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization

Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction

httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization

httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation

httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783

Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining

Referencias y Recursos

Page 11: Juan David Pineda-Cárdenas - EAFIT...Juan David Pineda-Cárdenas  Ciclo de Conferencias Centro de Computación Científica APOLO Universidad EAFIT Optimizando

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Intel Xeon Phi (2a Generacioacuten)

Booteable PCIe add-in card Especializado para HPC Altamente paralelo (72 nuacutecleos) Balanceado para coacutemputo ldquoLess forgiving than Xeonrdquo ~ 30 TFLOPs en DP (Teoacuterico) ~ 490 GBs de ancho de banda

(Medido) Intel Xeon Phi Knights Landing architecture (2016) top of the line (eg 7290P)

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Un coacutedigo para todas las plataformas

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Computacioacuten en Ciencia e Ingenieriacutea

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Aacutereas de Optimizacioacuten

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Experiencia en Modernizacioacuten de Coacutedigo Comuacuten

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Multihilos con OpenMP

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Vectorizacioacuten con Compiladores Intel

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Traacutefico de memoria

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Clusters y MPI

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Intel en Apolo

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones generales para optimizacioacuten -O1

Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto

Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos

-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel

Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito

OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones

-xHost Le dice al compilador que genere instrucciones para el

conjunto de instrucciones maacutes alto que esteacute disponible

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -mlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets

SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -xlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets

COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3

Math Kernel Library

Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo

Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial

Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo

iquestDoacutende Obtenerlo

bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator

Recurso Introduccioacuten a OpenMP

httpsyoutubenE-xN4Bf8XI

bull

Python Intel Distribution

httpssoftwareintelcomen-usdistribution-for-python

bull

httpcourseraorglearnparallelism-ia

Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture

httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials

httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++

httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization

Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction

httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization

httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation

httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783

Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining

Referencias y Recursos

Page 12: Juan David Pineda-Cárdenas - EAFIT...Juan David Pineda-Cárdenas  Ciclo de Conferencias Centro de Computación Científica APOLO Universidad EAFIT Optimizando

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Un coacutedigo para todas las plataformas

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Computacioacuten en Ciencia e Ingenieriacutea

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Aacutereas de Optimizacioacuten

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Experiencia en Modernizacioacuten de Coacutedigo Comuacuten

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Multihilos con OpenMP

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Vectorizacioacuten con Compiladores Intel

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Traacutefico de memoria

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Clusters y MPI

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Intel en Apolo

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones generales para optimizacioacuten -O1

Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto

Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos

-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel

Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito

OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones

-xHost Le dice al compilador que genere instrucciones para el

conjunto de instrucciones maacutes alto que esteacute disponible

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -mlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets

SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -xlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets

COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3

Math Kernel Library

Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo

Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial

Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo

iquestDoacutende Obtenerlo

bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator

Recurso Introduccioacuten a OpenMP

httpsyoutubenE-xN4Bf8XI

bull

Python Intel Distribution

httpssoftwareintelcomen-usdistribution-for-python

bull

httpcourseraorglearnparallelism-ia

Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture

httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials

httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++

httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization

Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction

httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization

httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation

httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783

Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining

Referencias y Recursos

Page 13: Juan David Pineda-Cárdenas - EAFIT...Juan David Pineda-Cárdenas  Ciclo de Conferencias Centro de Computación Científica APOLO Universidad EAFIT Optimizando

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Computacioacuten en Ciencia e Ingenieriacutea

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Aacutereas de Optimizacioacuten

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Experiencia en Modernizacioacuten de Coacutedigo Comuacuten

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Multihilos con OpenMP

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Vectorizacioacuten con Compiladores Intel

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Traacutefico de memoria

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Clusters y MPI

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Intel en Apolo

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones generales para optimizacioacuten -O1

Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto

Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos

-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel

Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito

OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones

-xHost Le dice al compilador que genere instrucciones para el

conjunto de instrucciones maacutes alto que esteacute disponible

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -mlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets

SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -xlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets

COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3

Math Kernel Library

Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo

Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial

Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo

iquestDoacutende Obtenerlo

bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator

Recurso Introduccioacuten a OpenMP

httpsyoutubenE-xN4Bf8XI

bull

Python Intel Distribution

httpssoftwareintelcomen-usdistribution-for-python

bull

httpcourseraorglearnparallelism-ia

Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture

httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials

httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++

httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization

Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction

httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization

httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation

httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783

Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining

Referencias y Recursos

Page 14: Juan David Pineda-Cárdenas - EAFIT...Juan David Pineda-Cárdenas  Ciclo de Conferencias Centro de Computación Científica APOLO Universidad EAFIT Optimizando

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Aacutereas de Optimizacioacuten

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Experiencia en Modernizacioacuten de Coacutedigo Comuacuten

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Multihilos con OpenMP

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Vectorizacioacuten con Compiladores Intel

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Traacutefico de memoria

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Clusters y MPI

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Intel en Apolo

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones generales para optimizacioacuten -O1

Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto

Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos

-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel

Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito

OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones

-xHost Le dice al compilador que genere instrucciones para el

conjunto de instrucciones maacutes alto que esteacute disponible

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -mlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets

SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -xlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets

COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3

Math Kernel Library

Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo

Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial

Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo

iquestDoacutende Obtenerlo

bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator

Recurso Introduccioacuten a OpenMP

httpsyoutubenE-xN4Bf8XI

bull

Python Intel Distribution

httpssoftwareintelcomen-usdistribution-for-python

bull

httpcourseraorglearnparallelism-ia

Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture

httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials

httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++

httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization

Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction

httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization

httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation

httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783

Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining

Referencias y Recursos

Page 15: Juan David Pineda-Cárdenas - EAFIT...Juan David Pineda-Cárdenas  Ciclo de Conferencias Centro de Computación Científica APOLO Universidad EAFIT Optimizando

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Experiencia en Modernizacioacuten de Coacutedigo Comuacuten

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Multihilos con OpenMP

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Vectorizacioacuten con Compiladores Intel

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Traacutefico de memoria

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Clusters y MPI

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Intel en Apolo

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones generales para optimizacioacuten -O1

Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto

Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos

-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel

Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito

OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones

-xHost Le dice al compilador que genere instrucciones para el

conjunto de instrucciones maacutes alto que esteacute disponible

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -mlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets

SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -xlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets

COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3

Math Kernel Library

Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo

Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial

Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo

iquestDoacutende Obtenerlo

bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator

Recurso Introduccioacuten a OpenMP

httpsyoutubenE-xN4Bf8XI

bull

Python Intel Distribution

httpssoftwareintelcomen-usdistribution-for-python

bull

httpcourseraorglearnparallelism-ia

Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture

httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials

httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++

httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization

Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction

httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization

httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation

httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783

Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining

Referencias y Recursos

Page 16: Juan David Pineda-Cárdenas - EAFIT...Juan David Pineda-Cárdenas  Ciclo de Conferencias Centro de Computación Científica APOLO Universidad EAFIT Optimizando

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Multihilos con OpenMP

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Vectorizacioacuten con Compiladores Intel

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Traacutefico de memoria

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Clusters y MPI

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Intel en Apolo

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones generales para optimizacioacuten -O1

Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto

Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos

-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel

Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito

OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones

-xHost Le dice al compilador que genere instrucciones para el

conjunto de instrucciones maacutes alto que esteacute disponible

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -mlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets

SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -xlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets

COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3

Math Kernel Library

Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo

Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial

Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo

iquestDoacutende Obtenerlo

bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator

Recurso Introduccioacuten a OpenMP

httpsyoutubenE-xN4Bf8XI

bull

Python Intel Distribution

httpssoftwareintelcomen-usdistribution-for-python

bull

httpcourseraorglearnparallelism-ia

Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture

httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials

httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++

httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization

Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction

httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization

httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation

httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783

Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining

Referencias y Recursos

Page 17: Juan David Pineda-Cárdenas - EAFIT...Juan David Pineda-Cárdenas  Ciclo de Conferencias Centro de Computación Científica APOLO Universidad EAFIT Optimizando

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Vectorizacioacuten con Compiladores Intel

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Traacutefico de memoria

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Clusters y MPI

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Intel en Apolo

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones generales para optimizacioacuten -O1

Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto

Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos

-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel

Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito

OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones

-xHost Le dice al compilador que genere instrucciones para el

conjunto de instrucciones maacutes alto que esteacute disponible

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -mlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets

SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -xlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets

COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3

Math Kernel Library

Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo

Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial

Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo

iquestDoacutende Obtenerlo

bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator

Recurso Introduccioacuten a OpenMP

httpsyoutubenE-xN4Bf8XI

bull

Python Intel Distribution

httpssoftwareintelcomen-usdistribution-for-python

bull

httpcourseraorglearnparallelism-ia

Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture

httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials

httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++

httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization

Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction

httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization

httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation

httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783

Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining

Referencias y Recursos

Page 18: Juan David Pineda-Cárdenas - EAFIT...Juan David Pineda-Cárdenas  Ciclo de Conferencias Centro de Computación Científica APOLO Universidad EAFIT Optimizando

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Traacutefico de memoria

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Clusters y MPI

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Intel en Apolo

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones generales para optimizacioacuten -O1

Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto

Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos

-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel

Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito

OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones

-xHost Le dice al compilador que genere instrucciones para el

conjunto de instrucciones maacutes alto que esteacute disponible

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -mlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets

SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -xlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets

COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3

Math Kernel Library

Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo

Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial

Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo

iquestDoacutende Obtenerlo

bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator

Recurso Introduccioacuten a OpenMP

httpsyoutubenE-xN4Bf8XI

bull

Python Intel Distribution

httpssoftwareintelcomen-usdistribution-for-python

bull

httpcourseraorglearnparallelism-ia

Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture

httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials

httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++

httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization

Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction

httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization

httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation

httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783

Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining

Referencias y Recursos

Page 19: Juan David Pineda-Cárdenas - EAFIT...Juan David Pineda-Cárdenas  Ciclo de Conferencias Centro de Computación Científica APOLO Universidad EAFIT Optimizando

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Clusters y MPI

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Intel en Apolo

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones generales para optimizacioacuten -O1

Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto

Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos

-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel

Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito

OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones

-xHost Le dice al compilador que genere instrucciones para el

conjunto de instrucciones maacutes alto que esteacute disponible

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -mlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets

SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -xlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets

COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3

Math Kernel Library

Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo

Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial

Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo

iquestDoacutende Obtenerlo

bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator

Recurso Introduccioacuten a OpenMP

httpsyoutubenE-xN4Bf8XI

bull

Python Intel Distribution

httpssoftwareintelcomen-usdistribution-for-python

bull

httpcourseraorglearnparallelism-ia

Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture

httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials

httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++

httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization

Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction

httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization

httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation

httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783

Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining

Referencias y Recursos

Page 20: Juan David Pineda-Cárdenas - EAFIT...Juan David Pineda-Cárdenas  Ciclo de Conferencias Centro de Computación Científica APOLO Universidad EAFIT Optimizando

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Intel en Apolo

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones generales para optimizacioacuten -O1

Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto

Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos

-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel

Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito

OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones

-xHost Le dice al compilador que genere instrucciones para el

conjunto de instrucciones maacutes alto que esteacute disponible

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -mlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets

SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -xlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets

COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3

Math Kernel Library

Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo

Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial

Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo

iquestDoacutende Obtenerlo

bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator

Recurso Introduccioacuten a OpenMP

httpsyoutubenE-xN4Bf8XI

bull

Python Intel Distribution

httpssoftwareintelcomen-usdistribution-for-python

bull

httpcourseraorglearnparallelism-ia

Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture

httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials

httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++

httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization

Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction

httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization

httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation

httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783

Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining

Referencias y Recursos

Page 21: Juan David Pineda-Cárdenas - EAFIT...Juan David Pineda-Cárdenas  Ciclo de Conferencias Centro de Computación Científica APOLO Universidad EAFIT Optimizando

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones generales para optimizacioacuten -O1

Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto

Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos

-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel

Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito

OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones

-xHost Le dice al compilador que genere instrucciones para el

conjunto de instrucciones maacutes alto que esteacute disponible

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -mlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets

SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -xlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets

COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3

Math Kernel Library

Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo

Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial

Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo

iquestDoacutende Obtenerlo

bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator

Recurso Introduccioacuten a OpenMP

httpsyoutubenE-xN4Bf8XI

bull

Python Intel Distribution

httpssoftwareintelcomen-usdistribution-for-python

bull

httpcourseraorglearnparallelism-ia

Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture

httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials

httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++

httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization

Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction

httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization

httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation

httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783

Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining

Referencias y Recursos

Page 22: Juan David Pineda-Cárdenas - EAFIT...Juan David Pineda-Cárdenas  Ciclo de Conferencias Centro de Computación Científica APOLO Universidad EAFIT Optimizando

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel

Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito

OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones

-xHost Le dice al compilador que genere instrucciones para el

conjunto de instrucciones maacutes alto que esteacute disponible

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -mlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets

SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -xlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets

COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3

Math Kernel Library

Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo

Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial

Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo

iquestDoacutende Obtenerlo

bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator

Recurso Introduccioacuten a OpenMP

httpsyoutubenE-xN4Bf8XI

bull

Python Intel Distribution

httpssoftwareintelcomen-usdistribution-for-python

bull

httpcourseraorglearnparallelism-ia

Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture

httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials

httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++

httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization

Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction

httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization

httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation

httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783

Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining

Referencias y Recursos

Page 23: Juan David Pineda-Cárdenas - EAFIT...Juan David Pineda-Cárdenas  Ciclo de Conferencias Centro de Computación Científica APOLO Universidad EAFIT Optimizando

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -mlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets

SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -xlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets

COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3

Math Kernel Library

Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo

Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial

Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo

iquestDoacutende Obtenerlo

bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator

Recurso Introduccioacuten a OpenMP

httpsyoutubenE-xN4Bf8XI

bull

Python Intel Distribution

httpssoftwareintelcomen-usdistribution-for-python

bull

httpcourseraorglearnparallelism-ia

Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture

httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials

httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++

httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization

Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction

httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization

httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation

httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783

Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining

Referencias y Recursos

Page 24: Juan David Pineda-Cárdenas - EAFIT...Juan David Pineda-Cárdenas  Ciclo de Conferencias Centro de Computación Científica APOLO Universidad EAFIT Optimizando

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones especiacuteficas por procesador -xlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets

COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3

Math Kernel Library

Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo

Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial

Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo

iquestDoacutende Obtenerlo

bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator

Recurso Introduccioacuten a OpenMP

httpsyoutubenE-xN4Bf8XI

bull

Python Intel Distribution

httpssoftwareintelcomen-usdistribution-for-python

bull

httpcourseraorglearnparallelism-ia

Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture

httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials

httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++

httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization

Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction

httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization

httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation

httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783

Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining

Referencias y Recursos

Page 25: Juan David Pineda-Cárdenas - EAFIT...Juan David Pineda-Cárdenas  Ciclo de Conferencias Centro de Computación Científica APOLO Universidad EAFIT Optimizando

Math Kernel Library

Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo

Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial

Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo

iquestDoacutende Obtenerlo

bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator

Recurso Introduccioacuten a OpenMP

httpsyoutubenE-xN4Bf8XI

bull

Python Intel Distribution

httpssoftwareintelcomen-usdistribution-for-python

bull

httpcourseraorglearnparallelism-ia

Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture

httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials

httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++

httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization

Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction

httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization

httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation

httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783

Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining

Referencias y Recursos

Page 26: Juan David Pineda-Cárdenas - EAFIT...Juan David Pineda-Cárdenas  Ciclo de Conferencias Centro de Computación Científica APOLO Universidad EAFIT Optimizando

iquestDoacutende Obtenerlo

bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator

Recurso Introduccioacuten a OpenMP

httpsyoutubenE-xN4Bf8XI

bull

Python Intel Distribution

httpssoftwareintelcomen-usdistribution-for-python

bull

httpcourseraorglearnparallelism-ia

Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture

httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials

httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++

httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization

Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction

httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization

httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation

httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783

Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining

Referencias y Recursos

Page 27: Juan David Pineda-Cárdenas - EAFIT...Juan David Pineda-Cárdenas  Ciclo de Conferencias Centro de Computación Científica APOLO Universidad EAFIT Optimizando

Recurso Introduccioacuten a OpenMP

httpsyoutubenE-xN4Bf8XI

bull

Python Intel Distribution

httpssoftwareintelcomen-usdistribution-for-python

bull

httpcourseraorglearnparallelism-ia

Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture

httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials

httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++

httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization

Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction

httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization

httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation

httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783

Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining

Referencias y Recursos

Page 28: Juan David Pineda-Cárdenas - EAFIT...Juan David Pineda-Cárdenas  Ciclo de Conferencias Centro de Computación Científica APOLO Universidad EAFIT Optimizando

Python Intel Distribution

httpssoftwareintelcomen-usdistribution-for-python

bull

httpcourseraorglearnparallelism-ia

Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture

httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials

httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++

httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization

Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction

httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization

httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation

httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783

Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining

Referencias y Recursos

Page 29: Juan David Pineda-Cárdenas - EAFIT...Juan David Pineda-Cárdenas  Ciclo de Conferencias Centro de Computación Científica APOLO Universidad EAFIT Optimizando

httpcourseraorglearnparallelism-ia

Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture

httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials

httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++

httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization

Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction

httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization

httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation

httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783

Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining

Referencias y Recursos

Page 30: Juan David Pineda-Cárdenas - EAFIT...Juan David Pineda-Cárdenas  Ciclo de Conferencias Centro de Computación Científica APOLO Universidad EAFIT Optimizando

Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture

httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials

httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++

httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization

Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction

httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization

httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation

httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783

Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining

Referencias y Recursos