juan david pineda-cárdenas - eafit...juan david pineda-cárdenas ciclo de conferencias centro de...

Juan David Pineda-Caacuterdenasltjpineda2eafiteducogt

Ciclo de ConferenciasCentro de Computacioacuten Cientiacutefica APOLO

Universidad EAFIT

Optimizando su coacutedigo serial y paralelo con algunas de las herramientas de desarrollo de Intel

Tomado de httpsnewsroomintelcomeditorialsadvancing-security-silicon-level

Avance de la seguridad a nivel del silicio

ldquoToday I want to provide several updates that show continued progress to fulfill that pledge First we have now released microcode updates for 100 percent of Intel products launched in the past five years that require protection against the side-channel method vulnerabilities discovered by Google As part of this I want to recognize and express my appreciation to all of the industry partners who worked closely with us to develop and test these updates and make sure they were ready for productionrdquo

By Brian Krzanich - CEO Intel Corp


ldquoWhile Variant 1 will continue to be addressed via software mitigations we are making changes to our hardware design to further address the other two We have redesigned parts of the processor to introduce new levels of protection through partitioning that will protect against both Variants 2 and 3 Think of this partitioning as additional ldquoprotective wallsrdquo between applications and user privilege levels to create an obstacle for bad actorsrdquo


Tomado de Fundamentals of Parallelism on Intel Architecture Colfax Research Intel Coursera httpsescourseraorglearnparallelism-ia



Capas de Programacioacuten Paralela

Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia

Paralelismo Nuacutecleos y vectores


Plataformas de Coacutemputo de Intel


Intel Xeon

1- 2- 4 CPUs por Servidor Propoacutesito General Altamente Paralelos (44 nuacutecleos) Rico en recursos (+ cores + cache) ldquoForgiving Performancerdquo ~ 10 TFLOPs en DP (Teoacuterico) ~ 154 GBs de ancho de banda

(Medido)2-way Intel Xeon Broadwell architecture (2016) top of the line (eg E5-2699 V4)


Intel Xeon Phi (2a Generacioacuten)

Booteable PCIe add-in card Especializado para HPC Altamente paralelo (72 nuacutecleos) Balanceado para coacutemputo ldquoLess forgiving than Xeonrdquo ~ 30 TFLOPs en DP (Teoacuterico) ~ 490 GBs de ancho de banda

(Medido) Intel Xeon Phi Knights Landing architecture (2016) top of the line (eg 7290P)


Un coacutedigo para todas las plataformas


Computacioacuten en Ciencia e Ingenieriacutea


Aacutereas de Optimizacioacuten


Experiencia en Modernizacioacuten de Coacutedigo Comuacuten


Multihilos con OpenMP


Vectorizacioacuten con Compiladores Intel


Traacutefico de memoria


Clusters y MPI


Intel en Apolo

Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction

Opciones generales para optimizacioacuten -O1

Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto

Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos

-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva


Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel

Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito

OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones

-xHost Le dice al compilador que genere instrucciones para el

conjunto de instrucciones maacutes alto que esteacute disponible


Opciones especiacuteficas por procesador -mlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets

SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32


Opciones especiacuteficas por procesador -xlttargetgt

Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets

COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3

Math Kernel Library

Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo

Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial

Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo

iquestDoacutende Obtenerlo

bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator

Recurso Introduccioacuten a OpenMP

httpsyoutubenE-xN4Bf8XI

bull

Python Intel Distribution

httpssoftwareintelcomen-usdistribution-for-python

bull

httpcourseraorglearnparallelism-ia

Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture

httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials

httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++

httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization

Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction

httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization

httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation

httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783

Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining

Referencias y Recursos

Tomado de httpsnewsroomintelcomeditorialsadvancing-security-silicon-level
















Intel Xeon






















Clusters y MPI


Intel en Apolo




















Math Kernel Library








bull



bull



























Intel Xeon






















Clusters y MPI


Intel en Apolo




















Math Kernel Library








bull



bull































Clusters y MPI


Intel en Apolo




















Math Kernel Library








bull



bull













Intel en Apolo




















Math Kernel Library








bull



bull































Math Kernel Library








bull



bull
















bull



bull














bull












juan david pineda-cárdenas - eafit...juan david pineda-cárdenas ciclo de conferencias centro de...

Documents