NOVA INFRAESTRUTURADE ALMACENAMENTO
Novas do Centro de Supercomputación de GaliciaDecembro 2017
InfraestructurasCientíticas y TecnicasSingulares
A Fundación CESGA é unha organización sen animo de lucro ao servizo da investiga-ción científica, o desenvolvemento tecnoló-xico e a innovación dende 1993. Participan na Fundación CESGA a Xunta de Galicia e o Consello Superior de Investigacións Científicas (CSIC).
As infraestruturas xestionadas pola Funda-ción CESGA foron parcialmente financiadas pola Unión Europea, a través do Fondo Europeo de Desenvolvemento Rexional (FEDER) e do Goberno de España, a través do Ministerio de Economía e Competitividade (MINECO), así como pola Xunta de Galicia e o CSIC.
A Fundación CESGA xestiona unha infraes-trutura integrada na Rede Española de Supercomputación, unha Infraestrutura Cien-tífico Tecnolóxica Singular (ICTS) do Estado.
2 díxitos decembro 2017
O Finisterrae, corazón tecnolóxico
do Centro de Supercomputación
de Galicia (CESGA), serviu de
apoio a un proxecto galardoado co
Premio Nobel de Física 2017, o proxecto
LiGO. O respaldo fornecido polo CES-
GA foi, ademais, de envergadura: tradu-
ciuse no subministro de 1,2 millóns de
horas de procesamento de altas presta-
cións para o desenvolvemento das ope-
racións de cálculo avanzados dos que
precisou LiGO. Esta iniciativa, para quen
non o saiba, diríxese a achar ondas gra-
vitacionais. A participación do CESGA
materializouse a través do doutor Sas-
cha Husa e dun grupo de investigación
adicado á Física Teórica da Universitat
das Illes Balears (entre cuxos usua-
rios está precisamente o doutor Husa).
Segundo explicou o devandito investi-
gador, no seu traballo cotiá tira proveito
das capacidades de cómputo avanzado
dos superordenadores para estudar os
sinais de ondas gravitacionais creadas
cando dous buratos negros chocan; nas
súas palabras “os eventos máis violentos
no universo”. O seu traballo en concreto
baséase en resolver ecuacións e calcu-
lar, utilizando cálculos moi extensos, que
aspecto teñen esas colisións, e como
son exactamente os sinais que emiten.
Por outra banda, cómpre ter en conta que
os investigadores que desenvolven o seu
labor ao abeiro de LiGO teñen que com-
parar, grazas á concorrencia dos super-
computadores, as predicións baseadas
nos cálculos dos mesmos cos datos ex-
perimentais que eles rexistran e atopar
que sistemas crearon eses sinais. Para
eses cálculos a comunidade de Física
Teórica precisa dispor de acceso a moi
grandes máquinas de computación de
altas prestacións, xa que sen elas este
tipo de avances en ciencia sería impen-
sable e non poderíamos chegar a com-
prender mellor o universo que habitamos.
O doutor Husa e o seu equipo de físicos
teóricos acceden a potentes máquinas
de cómputo como FinisTerrae a través
de diferentes convocatorias competitivas
da Rede Española de Supercomputación
(RES), á cal o CESGA achega o 20% do
superordenador galego. A RES, composta
por 13 nodos repartidos por todo o estado
é a Infraestrutura Científico Tecnolóxica
Singular en Computación de España.
Os cálculos en Física Teórica demandan
tantos recursos computacionais que ade-
mais do millón duascentas mil horas de
procesamento empregados no Centro de
Supercomputación de Galicia, o equipo
da UIB tamén utilizou os superodenado-
res Calendula, do Centro de Supercompu-
tación de Castela-León, MareNostrum no
Centro Nacional de Supercomputación ou
máquinas de PRACE a alianza europea
pola computación avanzada.
O CESGA contribuíu co seu cálculo ao desenvolvemento do proxecto galardoado este ano co Nobel de Física
1,2 millóns de horas de cálculo
Sala de control dos investigadores do proxecto LiGO
DIRECCIÓN
Javier García Tobío
COORDINACIÓN
Fernando Bouzas Sierra
COLABORANGrowcom
DESEÑO, GRAFISMO E MAQUETACIÓN
Grupo Código Cero Comunicación, S.L.
FOTOMECÁNICA E IMPRESIÓN
Gráficas Garabal, S.L.
DEPÓSITO LEGAL
C 1604-1998
ISSN
1139-563X
EDITAFUNDACIÓN CESGAAvenida de Vigo, s/n (Campus Vida)15705 Santiago de CompostelaTelf. 981 569 810 - Fax. 981 594 [email protected]
CONTIDOS
[ 2 ] 1,2 millóns de horas de cálculo
[ 3 ] Supercomputación biotecnolóxica
[ 4 - 5 ] O CESGA multiplica por 5 a capacidade
dos seus servidores de datos
[ 6 - 7 ] Faladoiros arredor do cálculo avanzado
[ 8 ] Simulación e HPC como vantaxes competitivas
[ 9 ] Sofisticadas quimiotecas para novos fármacos
[ 10 ] Montañas de datos para desvelar a historia do cancro
[ 11 ] Navegación de deseño contra vento e marea
[ 12 - 13 ] A importacia dos datos
[ 14 ] Educación rural na vangarda
[ 15 ] Novas do CESGA
Fundación Pública Galega Centro Tecnolóxico de Supercomputación de Galicia
InfraestructurasCientíticas y TecnicasSingulares
3decembro 2017 díxitos
O CESGA pon os seus recursos ao servizo das empresas de Bioga
O pasado venres 17 de novembro, o
Centro de Supercomputación de
Galicia acolleu unha xornada so-
bre cálculo avanzado e servizos na
nube en colaboración con Bioga, o Clúster
Tecnolóxico Empresarial das Ciencias da
Vida. A xornada, que se celebrou na sede
do CESGA en Santiago, serviu para mos-
trar as principais necesidades de computa-
ción das empresas integradas na entidade
e, tamén, para amosar o potencial e as
capacidades do Centro de Supercompu-
tación en materia de cálculo de alto ren-
demento e almacenamento de datos. Se-
gundo se fixo saber no encontro, o noso
sector “bio” consume a día de hoxe o 20%
da capacidade de computación do CESGA
e copa, ademais, o 30% dos recursos de
almacenamento do centro.
Na xornada interveu o director do CESGA,
Javier García Tobío, quen lembrou que o
centro “é unha ferramenta fundamental
para a competitividade do sector biotecno-
lóxico da nosa Comunidade”, un sector que
integra unhas empresas con “necesidades
moi relevantes de cálculo e de almacena-
mento de datos”. Segundo engadiu, ao día
de hoxe “algo máis dunha ducia de empre-
sas galegas deste ámbito traballan xa co
CESGA, así como diferentes grupos de
investigación das universidades galegas e
doutras Comunidades e do Centro Supe-
rior de Investigacións Científicas (CSIC)”.
Supercomputación biotecnolóxica
Entre estas empresas e grupos, recordou,
atópanse AllGenetics, MD Use!, Affinime-
ter o Glecex, cuxos casos de éxito foron
debullados no transcurso da xornada.
Segundo os cálculos de García Tobío, o
sector biotecnolóxico require dunha parte
importante dos recursos do CESGA, o que
vén motivado polas demandas especiais
de disciplinas como a xenómica ou a na-
nomedicina, ámbitos de investigación que
producen mancheas de datos que cómpre
almacenar para logo poder tratalos e tirar-
lles proveito.
Na xornada participaron medio centenar
de empresas de Bioga, abordando exem-
plos de computación, cloud e acubillos de
información. Impartiron charlas os douto-
res Aurelio Rodríguez e Carlos Fernandez,
técnico superior de Aplicacións e adminis-
trador da Área de Sistemas do CESGA,
respectivamente, tras unha presentación
de Ramón Basanta, responsable de Trans-
ferencia do centro. Os asistentes coñece-
ron diversos casos de uso e debateron
sobre as necesidades das empresas do
sector en computación, almacenamento
e comunicacións. O director do CESGA,
ao remate da xornada, mostrou as insta-
lacións.
Seguindo engadiu García Tobío, “para
estar na vangarda e sermos competitivos
é crucial que teñamos a capacidade de
manexar e almacenar información”. Neste
senso, engadiu, o CESGA ofrece o uso
de infraestruturas de computación e al-
macenamento de datos, define solucións
tecnolóxicas adaptadas ás necesidades
de cada empresa e fornece de consulto-
ría e asesoramento sobre plataformas de
computación, simulación, modelado, datos
inxentes (Big Data), aprendizaxe a distan-
cia (eLearning) ou GIS. Como exemplos
concretos destas demandas atendidas
das firmas de biotecnoloxías, puxo o foco
nas necesidades computacionais do dese-
ño de novos fármacos, un eido no que é
preciso coñecer a dinámica molecular ou
desenvolver novas moléculas, e para iso
“faise preciso elaborar simulacións sobre
cal vai ser o comportamento das mesmas”.
Segundo engadiu, no deseño de novos
medicamentos, antes e despois de probas
de laboratorio, cómpre levar a cabo centos
ou milleiros de simulacións.
Bioga é unha asociación empresarial sen
ánimo de lucro que aglutina ás organiza-
cións integradas na cadea de valor do sec-
tor biotecnolóxico que teñen a súa sede en
Galicia. O Clúster traballa para mellorar o
emprazamento competitivo do sector gale-
go, buscando melloras competitivas e a xe-
ración de negocio mediante o impulso de
accións e servizos directamente dirixidos
ás empresas deste ámbito.
4 díxitos decembro 2017
CESGA Centro de Supercomputación de Galicia
O CESGA multiplica por 5 a capacidade dos seus servidores de datos
As capacidades e a potencialidade de resposta do Centro de Super-computación de Galicia (CESGA) vanse ver reforzadas coa entrada
do novo ano. Máis polo miúdo, o centro afrontará a súa nova andaina con “azos” renovados en materia de traballo con grandes volumes de datos. O motivo? Pois a inclusión dun novo servidor de 1,54 millóns de xigabytes. Esta incorporación, financiada pola Consellería de Economía, Emprego e Industria, permitirá (entre ou-tras cousas) multiplicar por cinco a capa-cidade dos seus servidores de datos. En palabras do departamento da Xunta que dirixe Francisco Conde, o novo sistema tamén “aporta velocidade de acceso e fle-xibilidade na xestión da información”.
Máis en detalle, a tecnoloxía incorporada foi especialmente deseñada para facilitar un acceso inmediato á información alma-cenada, multiplicando por cinco a capa-cidade bruta do CESGA e, en concreto, a dos seus servidores de almacenamento de datos, ao dispor da comunidade cientí-fica e tecnolóxica usuaria do centro.
O novo equipamento, co-financiado con fondos FEDER (Fondo Europeo de Desen-volvemento Rexional), foi adquirido á mul-tinacional tecnolóxica Fujitsu e producido polos actuais líderes mundiais en almace-namento de datos, NetApp, e supuxo un investimento de 500.000 euros.
O equipo entrou a prestar servizo para a comunidade usuaria a principios de de-cembro. Neste sentido, permitirá a investi-gadores de institucións e empresas explo-tar de maneira máis eficiente os inxentes conxuntos de datos cos que traballan, xa que poderán acceder, procesar, manexar, explorar, ou comparar maiores cantida-des de datos a grande velocidade. Para facernos unha idea da importancia destas novidades, só ao longo do 2017 CESGA
A Xunta mellorou os servizos do centro cun novo equipo de 1,54 xigabytes
A tecnoloxía incorporada foi especialmente deseñada para facilitar un acceso inmediato á información almacenada, multiplicando por cinco a capacidade bruta do CESGA
5decembro 2017 díxitos
Centro de Supercomputación de Galicia CESGA
rexistrou máis de 50 grupos de usuarios traballando de maneira intensiva con grandes volumes de datos.
Entre as entidades que se beneficiarán deste sistema atopamos á Fundación Pú-blica Galega de Medicina Xenómica, de-pendente do SERGAS e dirixida por Ángel Carracedo, que precisa ampliar as súas capacidades de traballo con datos para dar resposta ás crecentes demandas im-postas polos avances en medicina perso-nalizada.
O servizo de predición meteorolóxica ga-lego, MeteoGalicia, ou o servizo europeo de predicións de estado do mar, Coper-nicus, liderado en España por Puertos del Estado, tamén se atopan entre as en-tidades que demandan capacidade para poder incrementar a resolución dos seus modelos e poder así mellorar a fiabilidade das súas predicións.
Investigadores galegos que participan na redacción dos informes do Panel Intergu-bernamental de Cambio Climático, como Juan Añel da Universidade de Vigo, pre-cisan igualmente manexar con axilidade maiores conxuntos de datos para testar e interrogar axeitadamente os modelos cos que traballan.
Pequenas empresas que medran a gran ritmo e que traballan na punta de lanza da innovación en Galicia, como a coruñe-sa Health in Code, especializada en pro-ver servizos de xenética médica, tamén demandan un acceso flexible a recursos especiais para seren quen de responder a picos de traballo.
Por outra banda, os centros do Instituto Español de Oceanografía (IEO) en Galicia contan con grupos de investigación que fan uso de complexos modelos oceano-gráficos nos que incorporan parámetros físicos e bioxeoquímicos para determinar o estado e predicir as dinámicas dos re-cursos mariños.
A maiores, grupos adicados a seguridade alimentaria e a mellora xenética animal e forestal do Instituto Nacional de Tecno-
loxía Agraria e Alimentaria (INIA) esperan dispor de servizos como os que fornece-rá o CESGA con esta infraestrutura para acelerar a súa produción de resultados.
De igual xeito, as novidades tecnolóxicas introducidas darán azos a proxectos de centros tecnolóxicos e de empresas da contorna de tres clústeres en Galicia; o Clúster Tecnolóxico Empresarial de Cien-cias da Vida (Bioga), o Clúster Audiovi-sual Galego (CLAG), e o Clúster TIC Ga-licia.
O Centro de Supercomputación de Gali-cia (CESGA) depende da Axencia Galega de Innovación (GAIN) da Consellería de Economía, Emprego e Industria da Xun-ta de Galicia e do Consello Superior de Investigacións Científicas (CSIC). É un or-ganismo cunha traxectoria de 24 anos. O seu obxecto é investigar, fomentar, difun-dir e prestar servizos de cálculo intensivo, almacenamento e comunicacións avan-zadas ás comunidades investigadoras galega e do CSIC, así como a empresas e institucións. Como nodo da Rede Es-pañola de Supercomputación, o Centro é recoñecido como Infraestrutura Científico Técnica Singular do Estado.
6 díxitos decembro 2017
O CESGA e a Rede Española de Supercomputación (RES) tive-ron unha importante actividade conxunta ao longo de 2017. Pri-
meiro, desenvolveuse en xullo un con-greso sobre as posibilidades do cómputo avanzado para incrementar o noso coñe-cemento sobre a atmosfera e os océanos e logo, en setembro, unha semana entei-ra de actividades de confraternización e intercambio de coñecemento e recursos. Esta “semana RES” incluíu un novo en-contro de investigadores arredor da su-percomputación e os océanos e, a xeito de culminación, a onceava edición da xornada anual de usuarios da Rede Es-pañola de Supercomputación (RES).
Respecto da cita de xullo, foi un semi-nario científico dirixido a avanzar no co-ñecemento do medio natural mediante simulación, cálculo de altas capacidades e outras metodoloxías TIC de deseño e predición de comportamentos, neste caso do sistema terrestre. Falamos do congre-so Computación de Altas Prestacións e Modelado de Ciencias da Atmosfera e do Océano. O seminario, que contou co apoio da Rede Española de Super-computación (RES), encamiñouse tamén a achandar o terreo (resolvendo retos, emendando posíbeis atrancos) para im-pulsar e estender o uso do modelado dos fenómenos da terra mediante sistemas de computación de altas prestacións, unha
práctica que, tendo en conta a deriva da Terra por mor da acción do home (princi-palmente o cambio climático), será cada vez máis demandada por todo tipo de entidades. O evento contou co apoio do Centro de Supercomputación de Galicia (CESGA) e da Universidade de Vigo, des-envolvéndose no Instituto de Investiga-cións Agrobiológicas-CSIC, no Campus Sur da Universidade de Santiago.
Respecto das actividades de setembro, incluíron como dixemos unha nova xeira de traballo arredor da supercomputación e os océanos. Foi, máis polo miúdo, un seminario científico que tivo como fío te-mático os Servizos mariños e a supercom-
putación, experiencias e retos futuros. A xornada, que se celebrou tamén na sede do Instituto de Investigacións Agrobioló-xicas de Santiago, dirixiuse a mostrar o amplo potencial do cómputo avanzado como ferramenta fundamental para as simulacións numéricas en oceanografía. Este potencial, impulsado pola mellora da potencia e da capacidade de almacena-mento dos equipos informáticos, xa per-mitiu o desenvolvemento de simulacións rexionais da circulación costeira a alta resolución e ao longo de períodos longos. Segundo se recordou na sesión de traba-
Faladoiros arredor do
cálculo avanzadoA Rede Española de Supercomputación e o CESGA afondaron nas posibilidades do cómputo para resolver os retos do noso mundo
Centro de Supercomputación de Galicia CESGA
7decembro 2017 díxitos
llo, a supercomputación está a posibilitar que varios usuarios da comunidade espa-ñola manteñan servizos de predición de curto prazo da circulación oceánica como o servizo IBI do programa Copernicus ma-riño ou servizos de predición autonómica en Galicia. Ademais o financiamento euro-peo e autonómico destes servizos permite o uso de cómputo avanzado dentro da RES (por exemplo os servizos devanditos execútanse no CESGA). Estes servizos de predición, así como simulacións costei-ras e rexionais están a utilizarse no des-envolvemento de solucións baseadas en observacións e modelados para distintos usuarios mariños (acuicultura, pesquei-ras, turismo...).
Polo que atinxe á onceava edición da xor-nada anual de usuarios da Rede Española de Supercomputación (RES), foi un rele-vante e multitudinario evento no que parti-ciparon unha manchea de investigadores de todos os recantos estatais, partillando
ideas e propostas para ampliar o que xa é de por si amplo: o abano de posibilida-des e aplicacións do cómputo avanzado en múltiples ámbitos do noso día a día. A xuntanza resultou de gran interese non só para os integrantes da RES e os seus usuarios (actuais e potenciais), senón ta-mén para a puxante comunidade de estu-dantes e investigadores en computación avanzada e, igualmente, para as empre-sas (cada vez máis) que precisan para os seus procedementos de potentes recur-sos de cálculo, predición e simulación. A xornada da RES celebrouse o 28 de setembro e complementouse, ao día se-guinte e tamén en Compostela, coa sexta Conferencia do HPC Advisory Council, as dúas citas organizadas polo CESGA.
No encontro da RES, amais de informar das novidades desta Rede Española, achegouse información de interese sobre os métodos de acceso aos recursos de seu e da PRACE (Partnership for Advan-
ced Computing in Europe). Na xornada fixeron acto de presenza, tamén, o con-selleiro de Economía, Francisco Conde, e a secretaria de Estado de Investigación, Carmen Vela, quen coincidiron en sa-lientar as importantes contribucións do CESGA ao impulso dos avances máis re-levantes que se están producindo en Ga-licia no ámbito da ciencia e a innovación. Conde engadiu que o labor do CESGA, é “unha proba do que a tecnoloxía contribúe á mellora da competitividade e da calida-de de vida”. Segundo fixo saber o gran
desafío do centro para os vindeiros anos é “fortalecerse como centro de excelen-cia en ciencia computacional aplicada, intensificar o grao de internacionalización da súa actividade e incrementar a súa presenza na industria para que o tecido empresarial galego poida beneficiarse
deste recurso, a supercomputación, que está detrás das previsións meteorolóxi-cas, a seguridade do tráfico marítimo, os estudos sobre cambio climático, o deseño de novos fármacos ou da dixi-talización da Industria 4.0, entre outros”. Tamén lembrou que o CESGA achega na actualidade un servizo diario a máis de 500 investigadores e tecnólogos das tres universidades galegas e do CSIC; par-ticipando en máis de 200 proxectos de I+D+i; manexando a maior plataforma de ensino en liña pública en Galicia e promo-vendo a xeración de talento formando a novos licenciados e profesionais de em-presas (“só o pasado ano colaborou con preto de 80 firmas”, dixo). Conde desta-cou tamén o papel do “buque insignia do CESGA”, o supercomputador Finisterrae, un dos 13 cos que conta a Rede Española de Supercomputación da que forma parte o CESGA desde hai 2 anos.
Polo que atinxe á sexta Reunión do HPC Advisory Council, tivo como fina-lidade promover a interacción entre as empresas e organizacións que traba-llan en tecnoloxías HPC (computación de alto rendemento polas súas siglas en inglés) cos usuarios finais, e abran-gueu un amplo rango de intereses e te-máticas como Deep Learning, Machine
Learning (aprendizaxe das máquinas) e Big Data (información a gran escala). O día 28 de setembro pola tarde, despois da Xornada de Usuarios, desenvolveuse unha actividade cultural que consistiu nunha visita guiada polo centro histórico de Santiago de Compostela.
O CESGA achega na actualidade un servizo diario a máis de 500 investigadores e tecnólogos das tres universidades galegas e do CSIC
Participantes na xuntanza anual da Rede Española de Supercomputación
8 díxitos decembro 2017
Simulación e HPC como vantaxes competitivas
Estufas, sistemas de ventilación e tubos de aceiro inoxidable integrados na paisaxe debuxan un novo panorama no consumo enerxético. A combus-
tión limpa chegou para quedar. Pero, como acadar chemineas sofisticadas e sostibles? Dinak, empresa galega punteira no sec-tor, recorre á simulación na nube mediante computación de alto rendemento (High Per-
formance Computing) como vantaxe com-petitiva. Este método de cálculo avanzado permítelle deseñar o produto máis axeitado para cada fogar ou industria nunha semana, minimizando o número de prototipos físicos necesarios.
Os gases liberados por estufas de gas, che-mineas de leña ou quentadores que funcio-nan mal poden chegar a ser moi perigosos. Calcúlase que cada ano en España sofren intoxicacións por monóxido de carbono (CO) entre 5.000 e 10.000 persoas. Pero o control dos gases e a procura dunha óptima ventilación é posible. O emprego de tecno-loxía de última xeración por parte do sector consegue emisións cero.
Onde está o segredo das novas chemineas? Na simulación numérica. A recreación da realidade empregando métodos matemáti-cos e potentes computadores permite xerar modelos a partir dunha serie de variables
A orixe dos traballos de Dinak está no seguinte: a necesidade de de avanzar na fabricación de chemineas modulares concéntricas de aceiro inoxidable cun cir-cuíto estanco de combustión. Para isto, e tendo en conta a elevada complexidade dos labores a desenvolver, Dinak apostou pola computación de altas prestacións con vistas a acadar unha simulación na nube o máis detallada posible, con pro-bas e visualizacións dixitais na procura do deseño máis axeitado para cada caso e sen necesidade de prototipos físicos.
A clave para acadar os ditos obxectivos residiu na concorrencia nun proxecto do Centro de Supercomputación de Galicia (CESGA), achegando unha solución tec-nolóxica baseada na simulación numéri-ca con código aberto OpenFoam. Deste xeito, Dinak foi quen de contar cun equi-pamento de cálculo exhaustivo e rápido para acadar chemineas optimizadas. O modelo de simulación deseñado polo Centro Tecnolóxico Aimen e a interface feita a medida polo Grupo de Arquitec-tura de Computadores da Universidade da Coruña permitiu a Dinak configurar as simulacións, executalas e visualizar os re-sultados de forma sinxela.
Tempos e custos inferiores
O máis sorprendente? Menos tempo e máis beneficios. Coa adopción da simu-lación numérica, a empresa pode aforrar máis dun 90% dos custos asociados ao deseño de cada modelo de nova chemi-nea. A maiores, o proceso pasa a realizar-se nunha semana cando antes levaba un mes. Actualmente Dinak, con presenza en sete países a través de delegacións en Francia, Italia, Bélxica, Alemaña, Rei-no Unido e Polonia, desenvolve entre tres e catro novos produtos ao ano.
A empresa galega Dinak deseñou chemineas á carta matematicamente respectuosas co medio ambiente
proporcionadas polo deseñador. A posibi-lidade de recrear e representar de forma virtual procesos e produtos sen necesida-de de prototipos físicos, tan custosos en tempo e diñeiro, empezou a incorporarse aos procesos industriais nos anos sesenta.
A empresa galega Dinak, con sede en Vigo e máis de tres décadas de andaina, atopou neste método a variña máxica para fabricar chemineas “á carta”. Buscaba unha solu-ción para gañar competitividade creando o deseño máis axeitado para cada fogar ou fábrica en función do espazo, as medidas, o aspecto e os estándares de calidade. Coa simulación dos seus deseños a través da computación de alto rendemento a em-presa é quen de aforrar, agora, ate 50.000 euros anuais e de obter o produto final nun-ha semana, cando antes tardaba ao redor dun mes.
O proxecto Fortissimo recebeu finaciamen-to do Séptimo Programa Marco para Inves-tigación, Desenvolvemento Tecnolóxico e Demostración da Unión Europea baixo o acordo Nº609029.
CESGA Centro de Supercomputación de Galicia
9
O CESGA dá soporte á inxente base de datos do grupo galego BioFarma
As primeiras probas de que os hu-
manos deixaron marcados os seus
dedos en tabliñas de arxila detec-
táronse nas antigas Babilonia e
Persia. Houbo que agardar a 1891 para a
auténtica descuberta do uso da pegada
dactilar, única en cada individuo e clave
para recoñecer persoas. O achado atribúe-
se ao policía arxentino Juan Vucetich. Un
ano despois, o seu equipo foi o primeiro en
identificar a unha asasina mediante rexistro
dactiloscópico.
A información que achegan as curvas da
pel dos dedos é moi sensible e por iso mes-
mo debe estar protexida. Esta esixencia de
confidencialidade non é exclusiva do ám-
bito da identificación das persoas. Trala re-
volución científica e tecnolóxica iniciada no
século XX e que continúa no actual, moitos
sectores xeran e manexan grandes volu-
mes de información, con necesidades para
a súa xestión e seguridade englobadas no
que hoxe coñecemos como Big Data. É o
caso do grupo galego de investigación Bio-
Farma, cunha base de datos que é un te-
souro para a industria farmacéutica.
O equipo dirixido por Mabel Loza, catedrá-
tica de Farmacoloxía da Universidade de
Santiago (USC), produce dende 1998 in-
formación para o descubrimento de novos
medicamentos. A tarefa dos máis de trinta
investigadores emprazados no Centro de
Investigación en Medicina Molecular e En-
Sofisticadas quimiotecas para novos fármacos
fermidades Crónicas (CiMUS) consiste en
identificar os compostos químicos máis
prometedores para o tratamento de pato-
loxías. “Creamos e gardamos a pegada
dactilar dos compostos”, explica cun símil
clarificador José Brea, responsable da
plataforma de cribado de fármacos (scree-
ning) do grupo.
Detectar os compostos que se activan so-
bre as células é clave, por exemplo, na pro-
cura de novos quimioterápicos para tratar o
cancro. A información de como reacciona
cada composto e a súa morfoloxía fica gar-
dada baixo chave a modo de historial. “De
cada composto almacenamos estrutura
química, procedencia, localización nas pla-
cas de ensaio e outros resultados obtidos”,
especifica José Manuel Santamaría, xestor
do grupo.
Con toda esta información, BioFarma foi
creando a súa propia quimioteca. Ao princi-
pio, cando o grupo traballaba con mostras
de 15.000 moléculas, o tratamento dos da-
tos non supoñía un problema no día a día
dos investigadores. Pero a actividade deste
equipo deu un paso de xigante a partir do
2012. Nacía InnoPharma, iniciativa galega
para o descubrimento temperá de fárma-
cos, na que participa tamén o equipo do
xenetista da USC Ángel Carracedo.
Cal era o reto? A busca de compostos
activos para desenvolver novas dianas
terapéuticas en neuroloxía, psiquiatría,
metabolismo, cancro, inflamación e enfer-
midades raras. O volume da quimioteca
disparouse xa que o grupo conseguiu reu-
nir para esta nova etapa 60.000 moléculas.
Con este panorama, BioFarma precisa-
ba máis capacidade para abordar tantas
análises de compostos e gardar toda a
información de xeito seguro. Como lembra
Santamaría, ao ampliarse a plataforma de
screening o grupo atopou a solución para
albergar os seus enormes volumes de da-
tos nos servidores do CESGA.
A actividade de BioFarma adquiríu outra
dimensión. O CESGA achegou a súa ex-
periencia en cálculo, computación de altas
prestacións e servizos avanzados para o
arranque de InnoPharma.
Pero, como foi a adaptación do traballo
no grupo? Brea fala de dous tipos de xes-
tión de datos, a través de dous servidores
aloxados no Centro de Supercomputación.
Un deles alberga a base de datos onde o
grupo almacena toda a información sobre
os compostos. O outro servidor emprégase
para a análise automatizada de imaxes de
microscopía e a súa almacenaxe.
BioFarma consegue con esta iniciativa re-
ducir a distancia entre a investigación bá-
sica en novos mecanismos terapéuticos e
a súa aplicación industrial. Trátase de que
as compañías farmacéuticas aproveiten o
know how dos científicos para apostar pola
elaboración de novos fármacos. A quimio-
teca ofrécelles sofisticada información de
partida para perfilar a potencia e o éxito
dun posible novo medicamento.
É moi probable que imaxes analizadas nos
últimos cinco anos no CiMUS sexan o piar
de fármacos para tratar o ictus, o cancro de
pulmón ou a asma nun futuro. A investiga-
ción e a tecnoloxía que o farán posible son
100% galegas.
decembro 2017 díxitos
CESGA Centro de Supercomputación de Galicia
10 díxitos decembro 2017
Montañas de datos para desvelar a historia do cancro
O equipo do xenetista David Posada, da Universidade de Vigo (UVigo), traballa nun escenario de informa-ción inxente, de datos que case su-
peran a nosa capacidade de análise e de coñecemento que xa non é posible enviar por Internet. Este é o “ambiente” no que traballa na actualidade o seu equipo, na análise de datos de secuenciado masivo (do termo orixinal en inglés Next Genera-
tion Sequencing ou NGS). David Posada foi o primeiro investigador galego que re-cibiu unha axuda europea Starting Grant hai unha década e no 2014 conseguía subir ao seguinte nivel coa Consolidator Grant.
Cunha longa traxectoria como biólogo evolutivo, Posada conseguiu os fondos de elite do Consello Europeo de Investiga-ción (ERC) para financiar o seu proxecto sobre a evolución somática das células canceríxenas. O enfoque da investigación é biolóxico, non médico. Trátase de exa-
Pero, como chegará o equipo de Posada á bioloxía básica do cancro? Con técnicas de xenómica de célula única. Se a maioría de estudos desta enfermidade analizan un anaco de tumor para lograr un xenoma promedio e comparalo con outros indivi-duos, neste caso o camiño é inverso. De cada persoa obteranse cen xenomas e o reto é estudar dez individuos. Isto permi-tirá ter datos da evolución da doenza en cada persoa, cun enfoque que permite ir cara a atrás no tempo e detectar as dife-renzas xenómicas. “Comparando os re-sultados cos de tecido san obteremos a película evolutiva”, apunta.
Nun exercicio aproximado, o secuenciado de mil xenomas tradúcese no manexo dun volume inxente de información. No grupo de Filoxenética, este equipo de investiga-dores traballa cun clúster propio de com-putación. Pero non era de abondo. Posada recorreu entón ao Centro de Supercompu-tación de Galicia (CESGA) por necesidade de “espazo, memoria e velocidade”. Este proxecto de grande alcance superou ex-pectativas no tratamento de datos.
Cada xenoma ten máis de 3.000 millóns de letras e, en termos de espazo, un xe-noma ocupa uns cen xigabytes. A xestión dos datos no CESGA permite ao grupo de Xenómica Evolutiva almacenar unha canti-dade de información que doutro xeito re-sultaría imposible, ademais de procesala a unha velocidade e tempo razoables. “Non podemos agardar tres anos para ter unha resposta a unha análise, por exemplo”, ex-plica o científico. Tanto é así que o plan de Posada é prescindir do clúster propio de supercomputación dentro de dous anos e trasladar toda a actividade computacional ao CESGA.
Este proxecto para entender a historia do cancro está no seu ecuador, pero a activi-dade do grupo de investigación co CES-GA continuará no tempo. Os resultados desvelarán se os tumores se producen só a partir da replicación de células nai ou en que fase aparece a metástase.
O CESGA subministra recursos ao equipo de David Posada (UVigo) para a súa análise de células tumorais
minar cando aparece un tumor e como foi o proceso de mutación celular para che-gar a esa alteración.
O estudo tamén permitirá comprobar se o cancro se manifestou dúas veces ou se o que se entende como metástase se corresponde co tumor primario. A través da análise de mostras de individuos con cancro, o grupo definirá o mapa histórico da enfermidade.
Unha das claves do comportamento dos tumores atópase na teoría de Darwin: as mutacións compiten entre si para repli-carse máis rápido. Conta o xenetista que, a través da bioloxía evolutiva, trazouse a traxectoria do espallamento da humani-dade polo planeta ou a chegada de de-terminadas especies a novos territorios, a partir dos xenomas. “Neste proxecto o corpo humano é o continente, os tumores primarios e secundarios o arquipélago e as células os individuos”, describe.
decembro 2017 díxitos 11
Vicusdt e Wavec botan man da computación avanzada para acadar a máxima seguridade nas estruturas flotantes
O transatlántico británico Olympic era xemelgo do Titanic. Me-
ses despois do afundimento deste último, no 1912, o Olym-
pic tiña que iniciar unha singradura dende Southampton, o
mesmo porto de partida do Titanic na fatídica viaxe trunca-
da polo choque contra un iceberg. Pero a tripulación do Olympic
negouse a navegar ata que se corrixisen os puntos febles en segu-
ridade, os mesmos cós do seu buque irmán accidentado, ao seren
de idéntica construción.
Logo de investigar o accidente, a Comisión Mersey do Reino Uni-
do redactou un informe con recomendacións sobre o deseño de
buques. Este documento supuxo o inicio das normativas sobre se-
guridade no mar.
No 1958 o enxeñeiro naval e matemático ruso Alekséi Krylov es-
cribía a definición de estabilidade, adoptada pola simulación nu-
mérica. Aplicou as matemáticas a problemas marítimos e as súas
táboas de inundabilidade empregáronse a partir daquela en todo
o mundo.
O panorama no que traballan hoxe empresas como Vicusdt e
Wavec é ben distinto. Están especializadas en servizos de consul-
toría e enxeñería para construción naval, armadores, plataformas
acuícolas e estruturas utilizadas polas industrias do petróleo e do
gas. E aplican os avances no estudo do comportamento dinámico
dun buque no mar, coñecido como seakeeping en inglés.
Navegación de deseño contra vento e marea
Vicusdt, compañía fundada en Vigo con experiencia na industria
pesqueira, e a lusa Wavec, máis centrada na industria das ener-
xías renovables mariñas, funcionan como auténticos laboratorios
de cálculo. Ambas empresas perseguen un mesmo horizonte:
conseguir a máxima seguridade, o maior rendemento e o deseño
máis sofisticado de buques e estruturas flotantes.
No seu día a día empregan modelos de simulación para reproducir
o deseño de barcos ou plataformas. Inclúen medicións e cálculos
obrigatorios e minimizan o número de prototipos físicos, de eleva-
do custo. Porén, neste camiño da experimentación, buscaban me-
llorar o proceso para seren máis competitivas. Desexaban unha fe-
rramenta de deseño poderosa, con maior potencia computacional.
Ambas compañías sabían que empregando computación de alto
rendemento na simulación avanzada obterían resultados en tem-
pos moi inferiores. Para ampliar a capacidade no manexo de da-
tos precisaban unha fonte externa e moi potente de recursos de
cálculo. Así entrou en escena neste experimento o Centro de Su-
percomputación de Galicia (CESGA), brindando as ferramentas
computacionais e un elevado volume de recursos para a simula-
ción considerando múltiples variables de comportamento no mar.
Unha vez localizadas as ferramentas, como incorporaron a com-
putación de altas prestacións nos seus procesos? Mediante a sin-
cronización integración do software de deseño e a plataforma de
simulación do CESGA. Para Wavec e Vicusdt, isto traduciuse na
implantación dunha interface o suficientemente intuitiva para que
o seu persoal o manexase sen dificultade dende os seus equipos.
A empresa catalana Compass (proveedora do software) e o Cen-
tro Internacional de Métodos Numéricos en Ingeniería (CIMNE)
fixeron posible a adaptación do software.
Vicusdt e Wavec estaban no certo. Os tempos para obter o produ-
to final reducíronse. Comprobaron que ao implementar a compu-
tación de alto rendemento resolven estes procesos ata 45 veces
máis rápido. Ademais, coa nova potencia son quen de realizar si-
mulacións que antes resultaban imposibles.
As vantaxes xeradas xa espertaron o interese do mercado eu-
ropeo. Os resultados da colaboración do CESGA con Vicusdt e
Wavec foron a base para ofertar un servizo de asesoramento e
análise do comportamento de barcos e estruturas flotantes no
"market place" nacido do proxecto Fortissimo. A fórmula? Un mo-
delo de pago por uso. Esta plataforma europea na nube simplifica
o acceso a simulacións de altas prestacións para pequenas e me-
dianas empresas de todo o mundo.
O proxecto Fortissimo recebeu finaciamento do Séptimo Programa Marco para Investigación, Desenvolvemento Tecnolóxico e Demos-tración da Unión Europea baixo o acordo Nº609029.
12 díxitos decembro 2017
CESGA Centro de Supercomputación de Galicia
A importancia dos datosA
transformación dixital ten un gran impacto no almacenamento requiri-do polas empresas. Máis fontes de datos xeran máis datos, que deben
consolidarase, transmitirse, procesarase e almacenarse. Os expertos predín un me-dre nos volumes de información por un factor de 10 nos vindeiros tres anos. Isto conducirá a máis esixentes demandas de almacenamento en termos de tempo de resposta, así como de maior e máis rápi-da capacidade de evolución. Para manter baixo control os custes deste explosivo crecemento, o prezo por terabyte de datos debe reducirse de maneira significativa.
Esta proliferación dos datos pode resultar difícil de xestionar se se empregan as fe-rramentas tradicionais de bases de datos relacionais. Para obter valor destes datos, é preciso contar cunha infraestrutura axei-tada para asumilos e acubillalos, e cunha plataforma analítica para extraer coñece-mento relevante deles.
As combinacións de tecnoloxías de Tercei-ra Plataforma están a transformar os sec-tores industriais, achegando acceso máis rápido á información de valor, potenciación do comercio dixital e habilitación dunha in-fraestrutura intelixente.
Para o devandito, é preciso que as novas tecnoloxías de xestión de datos permitan simplificar a infraestrutura tecnolóxica e reducir os custes, mello-rar o rendemento e a velocidade das análises de datos e mellorar a fiabilida-de e a visibilidade dos datos.
“NetApp estimula o rendemento de
aplicacións de Terceira Plataforma e
permite aos usuarios prosperar na
economía dixital” - Ashish Nadkarni, director de programas de IDC
Os sistemas de NetApp están dese-ñados para afrontar as necesidades desta terceira plataforma e conta con funcionalidades que subministran grandes vantaxes para o procesamen-to da información almacenada a través de ferramentas como Splunk, Hadoop ou Bases de datos NoSQL.
Splunk
A tecnoloxía de NetApp para Splunk ofrece un rendemento máis rápido, un TCO optimizado e unha fiabilidade me-llorada, en comparación con servido-res de consumo con almacenamento interno ou outras opcións.
Hai varias vantaxes a salientar:
•Aumento do rendemento de busca nun 69 %
•Optimización dos grupos de capacidade para os niveis de datos quente, tépedo, frío e conxelado de Splunk.
•107 % de media de aumento do rendemen-to das procuras en streaming fronte á dos servidores de consumo que teñen discos internos.
•Redución das copias de réplica de tres a dous, con fiabilidade mellorada.
•Escalado independente dos sistemas infor-máticos e do almacenamento para axustar mellor a carga de traballo das aplicacións.
•Cifrado de datos en repouso con pouco ou nulo impacto no rendemento.
“Dada a gran cantidade de datos xerados por
máquinas confiamos en E-Series de NetApp
para pór en marcha solucións de Splunk di-
rixidas a supervisar e resolver problemas nas
diferentes plataformas que se atopan na nosa
contorna”. - ING DIRECT Australia
Plataformas tecnolóxicas
Terceira plataformaTerceira plataforma
Primeira plataforma
Segunda plataforma
MILLÓNSDE APLIACIÓNS
DECENAS DE MILES DE APLIACIÓNS
CENTOS DE MILLÓNS DE USUARIOS
MILLÓNS DE USUARIOS
MILES DE APLIACIÓNS
MILES DE MILLÓNS
DE USUARIOS
Redes, móbil, análise, cloudDispositivos móbiles
LAN/Internet Cliente/ServidorPC
Cotorna mainframe, miniordenadorTerminais
E-series de NetAppSSD quente - SAS frío
50
45
40
35
30
25
20
15
10
5
Servidor xenéticoSSD quente - SAS frío
Denso Moi denso
NetApp® E5760(SSDs, NL-SAS)
Búsquedas densas
Búsquedas estáticas e de streaming (promedio)
Hot/Warm/Cold Data(searchableand actively
writing to disk)
Tem
po to
tal (
en s
)
Hadoop
Hadoop deseñouse pensando nas em-presas que querían xestionar, analizar e explotar o Big Data co fin de obter infor-mación relevante. Con Hadoop, agora é posible procesar e aproveitar datos sen estruturar ou estruturados de forma ma-siva. Cada vez máis empresas adoptan Hadoop para as súas aplicacións.
Porén, Hadoop presenta desafíos no ámbito empresarial, en termos de dis-poñibilidade, eficiencia e flexibilidade. E para iso NetApp fornece de solucións para o sistema de arquivos distribuí-dos de Hadoop (HDFS) que ofrecen un rendemento máis rápido, un tempo de inactividade inferior do clúster e capa-cidade evolutiva lineal cun conxunto de ferramentas moi variado para dar resposta á demanda de análise de Big
Data.
Esta solución optimizouse tendo en con-ta o equilibrio entre servidores e alma-cenamento, os custos, a fiabilidade e a capacidade de servizo, o rendemento e a densidade de almacenamento. A súa prioridade é proporcionar opcións flexibles baseadas en factores como o número de clústeres, os servidores e as opcións de soporte. As organizacións que utilizan Hadoop teñen con frecuen-cia servidores básicos con almacena-mento de acceso directo (DAS) interno.
A solución de NetAPP está deseñada para utilizar ou modelo de DAS exter-no, que fornece de almacenamento
O almacenamento All-flash de NetApp está deseñado para axudar aos clientes a crear solucións de alto rendemento, rendibles e de alta dispoñibilidade para bases de datos NoSQL. As bases de datos NoSQL valida-das a día de hoxe son Couchbase, Mongo-DB e Cassandra, aínda que tamén é com-patible con outras bases de datos NoSQL, como HBase, Redis e MarkLogic.
Entre as vantaxes que podemos obter deste tipo de almacenamento utilizado para Bases de Datos NoSQL podemos salientar as se-guintes:
•Rendemento superior e predicible.
•Acceso a datos de NoSQL con maior fre-cuencia.
• Escalado sinxelo con computación e al-macenamento desasociados.
• Menor número de servidores, así como de menor capacidade, reducindo o custe de propiedade.
dedicado e fiabilidade e escalabilida-de óptimas para empresas, ademais de reducir os custos operativos. O fir-mware RAID proporciona operacións transparentes e practicamente ininte-rrompidas sen a carga da replicación baseada en servidor, que adoita nece-sitar normalmente tres copias de datos para Hadoop. As solucións de NetApp para Hadoop soamente requiren dúas copias dos datos, polo que reducen a conxestión da rede e aumentan o ren-demento.
BBDD no SQL
NoSQL, que abrangue unha ampla gama de tecnoloxías e arquitecturas, busca resolver os problemas de esca-labilidade e rendemento de Big Data que as bases de datos relacionais non foron deseñadas para abordar. NoS-QL é especialmente útil cando unha empresa necesita acceder e analizar grandes cantidades de datos non es-truturados ou datos que se almacenan de maneira remota en varios servidores virtuais na nube.
MongoDB 3.0
On Premises
NetApp®SnapMirror®Backup/DR
to the Cloud
SnapMirror®Backup/DR
to the NPS/SecondaryNetApp Private Storage
AFF A300
MicrosoftAzure
MongoDB
RHELRHELONTAP
MongoDB
AmazonWeb Services
Google CloudPlatform
AFF A300
13decembro 2017 díxitos
Centro de Supercomputación de Galicia CESGA
Autor do artigo: Manuel Millares, Storage Technology Consultant Solution
Design de Fujitsu
HDFS as Primary and NFS as Secondary
Hadoop/Spark Cluster
HDFS NFS
Centro de Supercomputación de Galicia CESGA
E-Series de NetApp
E-Series de NetApp
E-Series de NetApp
Nodo de nombre
Nodo en espera
Softw
are
de H
adoo
p
Red
dat
aNod
e de
10
GB
NodosDatos
NodosDatos
SAS/ISCSI/
FC
SAS/ISCSI/
FC
SAS/ISCSI/
FC
NodosDatos
CESGA Centro de Supercomputación de Galicia
14 díxitos decembro 2017
Educación rural na vangarda
O proxecto Rede de Escolas na Nube vaise ampliar a todas as Es-colas Rurais Agrupadas de Gali-cia. Así o deu a coñecer en no-
vembro o Centro de Supercomputación de Galicia (CESGA), impulsor actual do proxecto xunto coa empresa Balidea e máis a Xunta (AMTEGA e a Consellería de Educación e Cultura). Como lembra-remos, a Rede foi creada hai case oito anos co obxectivo de explorar (e ex-plotar) as vantaxes da computación na nube (cloud computing) desenvolvidas na contorna das nosas pequenas esco-las rurais, os Centros Rurais Agrupados (CRA). O dito traballo foi posíbel na súa orixe grazas ao apoio financeiro que HP Labs emprestaba ao CESGA e en 2014 recibiu un importante pulo orzamenta-rio para un proxecto europeo de cara a validar e mellorar os achados obtidos noutras zonas rurais e illadas de Euro-pa. Agora, a Rede de Escolas de Nube (www.escolasnanube.es) volve recibir impulso coa posibilidade de espallarse a todo o noso rural.
Segundo se lembrou na xuntanza, a Rede de Escolas na Nube supón “un modelo de infraestrutura, servizos e metodoloxía de traballo baseado en computación cloud e software aberto ao servizo do ensino e a colaboración entre as escolas rurais dis-tribuídas, creando unha rede na que se poidan compartir de maneira segura expe-riencias educativas, materiais e aprendiza-xe, adaptada a contorna ás necesidades deste modelo de escola rural distribuída e multinivel”.
Asemade, fíxose fincapé nos bos prece-dentes abertos polo proxecto: “A Rede de Escolas na Nube é un claro exemplo dun-ha colaboración de éxito entre institucións públicas e privadas galegas”, unha inicia-tiva que, neste caso concreto, é quen de “repercutir nun beneficio directo para a so-ciedade, así como nunha aposta de futuro para a creación de produtos innovadores made in Galicia”.
Poboación dispersa
Entre os porqués da posta en marcha da Rede de Escolas na Nube atópase a nece-sidade dar resposta ás demandas de cali-dade educativa que esixe unha poboación tan espallada e dispersa coma a nosa. De feito, malia a importancia crecente das cidades e vilas grandes, é certo que o ru-ral aínda pesa moito e que neste ámbito viven moitas nenas e nenos que precisan ter as mesmas oportunidades formativas e tecnolóxicas cós demais. Esta foi a base orixinaria da iniciativa: loitar contra as eivas comunicativas, tecnolóxicas ou de ensino que puideran frear o desenvolvemento da ensinanza nestas áreas e engadir aínda máis distancia na chamada fenda dixital ur-bano-rural. As “armas” empregadas nestas loita foron, entre outras, a computación na nube e as tecnoloxías avanzadas de comu-nicación (por exemplo a videoconferencia), todo concibido dunha maneira aberta e sen cancelas (open source), prontas para ser adoptadas e aproveitadas noutras contor-nas semellantes.
A Rede de Escolas na Nube senta os alicerces para estenderse a todo o noso ámbito non urbano
A dita nova (o espallamento da iniciativa) deuse a coñecer nunha xuntanza entre a Consellería de Educación e AMTEGA, por unha banda, e os equipos directivos de todos os Centros Rurais Agrupados (CRAs) de Galicia. Na presentación da Rede de Escolas na Nube ofrecéuse-lles a posibilidade de incorporarse ao proxecto.
Como recordaremos, catro deles (o CRA Boqueixón - Vedra Neira Vilas, o CRA de Vilaboa Consuelo González Martínez, o CRA Amencer de Ribadavia, e o CRA Nosa Señora do Faro de Ponteceso) es-tán a participar desde 2012 como cen-tros piloto ao abeiro da iniciativa.
O proxecto de innovación educativa Rede de Escolas na Nube xurdiu como colaboración entre o CESGA, quen coor-dinou a iniciativa, a empresa galega Balidea Consulting & Programming, a Consellería de Educación e a Axencia de Modernización Tecnolóxica de Galicia da Xunta de Galicia (AMTEGA).
Tomás Fernández Pena
Entre o 6 e o 19 de novembro celebrouse en diferentes puntos do ámbito esta-tal e galego a Semana da Ciencia, edición 22. Houbo actividades de divulga-ción, visitas guiadas, obradoiros e conferencias en centros de investigación e universidades, co obxectivo de achegar a actividade científica á sociedade e concienciar da importancia da investigación e a innovación. Participaron neste programa de accións, moi envorcadas cos escolares, cinco centros da Rede Española de Supercomputación, entre os que se conta o CESGA, o Centro de Supercomputación de Castela e León, o CSUC de Barcelona, o Computaex de Estremadura e o IFCA de Cantabria. Polo que se refire ao CESGA, abriu as súas portas á cidadanía entre os días 13 e 17 de novembro en diferentes ho-rarios. Os participantes puideron visitar as instalacións do centro e coñecer o supercomputador Finisterrae II, os servidores de almacenamento de datos, os servidores que soportan a nube para cómputo científico e un dous principais nodos da Rede de Ciencia e Tecnoloxía de Galicia.
O Instituto NVIDIA de Deep Lear-ning (www.nvidia.co.uk/dli) está a poñer ao alcance dos desenvolve-dores, científicos da información e investigadores en xeral adestramen-to avanzado en aprendizaxe profun-da, o que se coñece, precisamente como Deep Learning. O obxectivo: que teñan a capacidade de solucio-nar todo tipo de problemas e retos vencellados coa análise e a inter-pretación avanzada da información. Froito deste compromiso foi a cita organizada o 20 de outubro no Cen-tro de Supercomputación de Gali-cia, de mans do devandito Instituto e da compañía Hewlett Packard. Resultou ser, en termos concretos, unha xornada de traballo con forma-to de obradoiro sobre Deep Lear-ning práctico. Na cita os asistentes recibiron formación en adestramen-to básico en DL empregando redes neuronais e en cuestións como a ex-perimentación cos datos, a prepa-ración de parámetros, as estruturas de redes e outras estratexias para incrementar rendemento e capaci-dade. Asemade, convidouse aos presentes a despregar as súas pro-pias redes para comezar a solucio-nar problemas reais da actualidade mundial. Como lembraremos, o concepto Deep Learning abrangue un conxunto de algoritmos de clase aprendizaxe automática (Machine Learning) que se dirixe a modelar abstraccións de alto nivel en da-tos usando arquitecturas compos-tas de transformacións non lineais múltiples.
O CESGA organizou os días pasados (21, 22, 23 e 24 de novembro) un curso sobre Big Data especialmente indica-do para investigadores e profesionais das uni-versidades, centros de investigación e PEME que queiran extraer o máximo partido aos seus grandes volumes de da-
tos. Con esta actividade, o CESGA quixo cumprir dous obxectivos: por unha banda dar resposta ás demandas formativas crecentes en materia de ana-lítica de grandes volumes de coñecemento (tecnoloxías fundamentais para o desenvolvemento de proxectos de I+D+i, tanto en universidades como en centros de investigación como en empresas), e pola outra, dar a coñe-cer as posibilidades da plataforma de Big Data do CESGA, que permite explorar eses grandes volumes de datos ou facer probas de concepto. No curso exploráronse as capacidades de análises estatísticas e de Machine
Learning da dita plataforma en particular e, en xeral, da plataforma Spark. Foi impartido polos profesores e investigadores Tomás Fernández Pena e David E. Losada.
Portas abertas na Semana da Ciencia
Todo o que quixemos saber sobre o Deep Learning
Curso Big Data (ou información inxente)
No
vas d
o C
ES
GA
15decembro 2017 díxitos
Centro de Supercomputación de Galicia CESGA
Acelere la investigación y desarrollo con HPC en su escritorio
Más potencia HPC, menos problemas
Intel Inside®. Para un mundo de nuevas posibilidades.
Usted es la clave para solucionar complejos problemas técnicos y científicos. Si trabaja con ingenieros o científicos, necesita proporcionarles potencia de computación para tomar las decisiones correctas. Ahora le resultará todavía más fácil darles lo que necesitan.
Ultrabook, Celeron, Celeron Inside, Core Inside, Intel, el logotipo de Intel, Intel Atom, Intel Atom Inside, Intel Core, Intel Inside, el logotipo de Intel Inside, Intel vPro, Itanium, Itanium Inside, Pentium, Pentium Inside, vPro Inside, Xeon, Xeon Phi y Xeon Inside son marcas registradas de Intel Corporation en Estados Unidos y/o en otros países.
Visite: bcis.es.fujitsu.com/HPC
Descubra cómo el Sistema Integrado FUJITSU PRIMEFLEX para HPC puede ayudarle:
■SimplifiqueHPC,aumentelaproductividadyestimuleelrendimiento■Despliegueclústeresrápidamenteynavegueconfacilidadporlastareasdiarias■ Flujos de trabajo automáticos para aplicaciones comunes
Equipadoconprocesador Intel® Xeon®.