Download - Juan Pablo Martínez Beltrán - Unilibre
Conociendo los beneficios de la relación de Big Data y Cloud
Computing
Juan Pablo Martínez Beltrán
Universidad Libre
Facultad de Ingeniería
Ingeniería de Sistemas
Bogota D.C.
Septiembre 2017
Conociendo los beneficios de la relación de Big Data y Cloud
Computing
Resumen
La presente monografía pretende expresar las ventajas de la relación entre las
herramientas Big Data y Cloud Computing como facilitadores en el proceso de
administración de datos.
El avance de las tecnologías de la información pretende generar mejoras en los
procesos de una organización y para ello es esencial que la gestión y análisis de
datos masivos, evite el uso de herramientas convencionales.
Big Data ha permitido que los datos sean fáciles de entender sin importar su origen
estructurado o no estructurado, haciendo uso de la minería de datos y estadística.
Introducción
La administración de información masiva y su disponibilidad son aspectos
fundamentales que debe tener en cuenta una organización, por lo tanto, es
necesario definir conceptos como Big data y Cloud Computing. Además, de
establecer la planeación para lograr implementar de manera adecuada estas
tecnologías.
El propósito fundamental del presente documento es identificar la relación y los
beneficios que existen en la utilización de Cloud Computing y Big Data en una
organización, resaltando los atributos de cada una de ellas.
A continuación, se destacan importantes conceptos a tener en cuenta para
determinar la relación que los asocia.
Que es Big data
Es la tendencia en el avance de la tecnología que ha abierto las puertas hacia un
nuevo enfoque de entendimiento y toma de decisiones, es utilizada para describir
cantidades de datos (estructurados, no estructurados y semi estructurados) y
cargarlos a una base de datos relacional para su análisis. La finalidad del Big data
es obtener resultados en tiempo real
La importancia de tener un conjunto de datos Big Data es el análisis de datos para
obtener un resultado predictivo a través de estadística inferencial y minería de datos.
En la actualidad existen diversas herramientas como Hados, avro, Cassandra,
chukwa, Flume, Hbase y Hive, que permiten el manejo y la implementación de Big
Data.
Ventajas de Big data
Diariamente, se generan grandes volúmenes de información no estructurada pero
que debe estar disponible en cualquier momento. Para ello el Big Data proporciona
distintos métodos como filtrados de datos, análisis semántico y clasificación de
datos, para realizar la gestión de estos datos y convertirlos en datos estructurados.
Además, se puede hablar de que cada vez existen más medios de información.
Actualmente la información la obtenemos de periódicos digitales, Twitter, Facebook
u otros medios sociales a nuestro alcance, generando más fuentes de datos.
Big data ha llegado precisamente para cubrir las deficiencias que dejan las
herramientas analíticas convencionales y permite cantidad de nuevas
oportunidades.
Herramientas
Hoy en día para hablar de Big data es necesario mencionar algunas plataformas de
las Hadoop, Cassandra, chukwa, Flume, Hbase y Hive para gestionar proyectos
de Big data, permiten el procesamiento en paralelo de grandes cantidades de
datos (estructurados y desestructurados) a través de clústeres de servidores.
Hadoop, además, ofrece la posibilidad de crecer de manera escalable y llegar a
trabajar con miles de nodos y un volumen de datos del orden de peta bytes.
A continuación, describiré una serie de requerimientos recomendables en cualquier
proyecto de Big data:
• Capacidad de almacenamiento y procesamiento: Big data necesita una
gran cantidad de almacenamiento y capacidad de computación
(CPU). Hadoop funciona, separando los datos capturados en pequeños
bloques y distribuyéndolos entre varios servidores, lo que permite el
procesamiento de grandes volúmenes de datos con un mejor rendimiento y
latencias mínimas, con la posibilidad de análisis en tiempo real.
• Escalabilidad: Un proyecto de Big data se caracteriza por tener una serie de
picos de demanda con grandes necesidades en cuanto a almacenamiento y
procesamiento de datos, seguidos de periodos de poca actividad en los
servidores. Sería deseable, por tanto, poder incrementar o disminuir la
infraestructura tecnológica según las necesidades de cada momento.
• Control de costo: Abordar cualquier proyecto de este tipo mediante la
adquisición de un modelo en propiedad de toda la infraestructura necesaria
implica una inversión inicial, lo que provocaría que muchas compañías
desistieran de utilizar Big Data.
Tendencias
Las smart cities, Smart grids, la industria 4.0, las redes sociales, las tecnologías
cognitivas, el wifi óptico, los sistemas ciber-físicos, la tecnología móvil, las redes 5G
y las nuevas formas de pago (como las tarjetas contactless y las aplicaciones
móviles que permiten realizar pagos) son herramientas que hacen uso del Big Data.
Big Data, el Cloud Computing y el Internet de las Cosas marcan las principales
tendencias en el sector de las TIC. Así se desprende del informe “Tendencias en el
Mercado de la Ciberseguridad” publicado por el Instituto Nacional de
Ciberseguridad.
En cuanto al internet de las cosas, es un paradigma en el que los objetos cotidianos
estarán conectados a Internet.
A medida que se produzca el despegue del “Internet de las cosas” y los dispositivos
portátiles, se producirán cada vez más datos generados por máquinas de los que
podrán aprovecharse las organizaciones.
¿Qué es Cloud Computing?
En la actualidad el Cloud Computing es un servicio reconocido en todo el mundo,
por lo que brinda la oportunidad de tener un gran almacenamiento, sin necesidad
de tener una infraestructura amplia, ajustándose a los requerimientos de cada
cliente.
Cloud Computing es la mejor alternativa de almacenamiento para Big Data, porque
ofrece alta disponibilidad de la información en tiempo real y soporta el cargue
masivo de datos.
Esta información es guardada en data centers que actualmente existen y cuyas
empresas grandes como IBM, Microsoft, Apple, Amazon, entre otros; almacenan
una gran cantidad datos diarios que son generados por los usuarios.
“Inicialmente beneficia financieramente a la empresa, le permite controlarse a través
de presupuestos flexibles, utilizar modelos de economía de escala y destinar
recursos financieros a diferentes inversiones, sin tener que recurrir a procesos de
descapitalización o financiamientos con un costo del dinero que en ocasiones es
bastante alto. Por otro lado, impacta en el modelo de compensación salarial, hoy
por hoy, podemos pensar de manera más tangible, en esquemas de pago basados
cien por ciento en resultados (para ciertos niveles de la organización), y no por
cumplir horarios frente a una computadora, invariablemente esto obligará a los
funcionarios de la empresa a ser más productivos e impactar en la efectividad de la
empresa.”
(“Cloud Computing: definición y como impacta a una organización”,2015)
Ventajas de Cloud
Una ventaja del uso del Cloud Computing es que no debe ser una preocupación la
disposición, desarrollo, operación y mantenimiento de una infraestructura de
almacenamiento propia, compuesta por software y hardware, esta tarea la realiza el
proveedor del servicio. Además del almacenamiento de datos, con el Cloud
Computing se pueden disponer de otras herramientas como aplicaciones y redes
internas para la empresa.
La necesidad de las empresas de sacar valor a los datos ha hecho aumentar las
necesidades de tecnologías Cloud o de computación en la nube. Entre estas
tecnologías nos encontramos con la computación elástica, un sistema de
computación similar al uso eficiente de electricidad. El servicio se da o no,
dependiendo de la demanda de uso de un determinado recurso. El sistema de
computación elástico permite adaptar el uso de los recursos computacionales
dependiendo del aluvión de datos, su tamaño, tipo, velocidad de estos, para dar una
respuesta más efectiva.
Seguridad en Cloud
En cuanto a ubicación y nivel de seguridad, las empresas de servicios en la nube
cuentan con varios servicios: Público, Privado dedicado o compartido e Híbrido.
En el servicio nube pública se tiene acceso general a servicios y recursos de
computación Cloud mediante una conexión pública a través de Internet.
La nube privada, es donde los servicios y recursos de computación en la nube están
en una red privada, con acceso restringido a usuarios de la organización. Los
sistemas de seguridad son más altos, debido al tipo de sensibilidad de los datos que
se almacenan, siendo necesario mantener la confidencialidad, la privacidad y la
integridad de los datos.
La nube híbrida, es el nivel que combina las características de los servicios Cloud
públicos y privados. Estos servicios se utilizan cuando existen datos Cloud privados
que se ofertan en Cloud públicos o cuando existe una colaboración de distintos
proveedores de servicios en la nube. Estos servicios ofrecen ahorro, seguridad,
flexibilidad y escalabilidad.
Ventajas de la relación
“La alianza entre Big Data y el Cloud facilita métodos de análisis nuevos e
integrados, cuyos resultados están incluidos directamente en decisiones
empresariales y aún pueden generar nuevos procesos de negocio”.
(“El big data requiere aportación tecnológica”, 2013)
Big data y Cloud Computing son herramientas que han permitido innovar y han
cambiado los modelos de negocio y funcionamiento de las tecnologías, además de
mejorar el manejo de la información.
En el siguiente grafico se pueden observar las características que diferentes
sectores con la implementación del Big Data y Cloud Computing.
Tabares Hernandez. 2014. Resumen de aplicaciones de Big Data. Imagen 1. Tomado de Big Data Analytics
De acuerdo con lo que se establece en el cuadro, la implementación del Big data
optimiza los diferentes procesos en un sector determinado, además se puede
identificar que se puede aplicar a cualquier situación sin alguna restricción, también
muestra el impacto que puede generar en la realización de alguna actividad
científica, en temas de mercadeo y el sector salud.
En la imagen 2 se observan las ventajas y beneficios de cada herramienta y los
resultados que se obtienen al implementar estás dos tecnologías, mostrando como
se pueden relacionar, adicionalmente el uso de Cloud con Big Data proporciona un
complemento adecuado para que los resultados sean precisos ante la necesidad de
cada organización.
SAS Colombia on SAS Latín América. 2014. "Big Data y la nube: Un matrimonio bien avenido". Imagen 2
El camino que marca la imagen se puede entender que son las características que
genera en la relación de estas dos tecnologías y como, paso a paso se realiza la
implementación. También se exponen aspectos para tener en cuenta durante la
planeación estratégica de ambas herramientas en una organización.
El Big Data brinda Veracidad, Velocidad, Valor y Volumen, conceptos conocidos
como las 4 V. Con esto las organizaciones obtienen como ventaja eficiencias
operativas, reducción de costos en infraestructura y mayor transformación de las
tecnologías.
En el Cloud Computing ofrecen implementación a sistemas CRM y ERP, además
de ofrecer infraestructura como servidores, bases de datos y seguridad, permitiendo
agilidad y escalabilidad en sus procesos.
Modalidades de Cloud para Big Data
La modalidad infraestructura facilita el uso de servidores a bajo nivel controlando el
sistema operativo, el uso de memoria, tecnología de almacenamiento en disco.
Con la modalidad de entorno pre configurado, el proveedor ofrece el servicio Cloud
con los lenguajes de programación necesarios (Java, Python, Ruby, entre otros) y
con esto alguna de la herramientas que se utilicen se encargara de recoger y
analizar los datos.
La última modalidad es la de software como servicio Cloud, que te proporciona un
entorno para trabajar directamente con Big Data. Se realiza el procesamiento y
análisis de los datos de manera transparente, almacenando la información
generada.
Seguridad y privacidad Big data
Algo que preocupa a los usuarios del Big Data es su privacidad, por lo que
desconocen la ubicación de los dispositivos que almacenan su información.
Mientras la mayor preocupación por parte de las organizaciones es que sus datos
estén mal gestionados, generando complejidad en el análisis de su información.
Las compañías deben garantizar una administración adecuada a los datos, para ello
se debe contar con la autorización de los usuarios para su uso.
t-Systems, 2013. “Big data y el Cloud para recursos”. Imagen 3. Tomado de T – Systems
En la imagen 3 se puede identificar los pasos que se deben desarrollar para un
proyecto con Big Data y Cloud Computing. Además, se basa en seguridad y
privacidad para brindar una satisfacción al cliente final. También se es necesario
establecer estrategias para su implementación.
Conclusiones
Durante más de 10 años el uso de estas tecnologías ha permitido conocer la
relación que existe entre Big Data y el Cloud Computing, además, de lograr
establecer las características y los beneficios que se obtienen realizando la
implementación de las dos herramientas.
Identificar el impacto que puede generar para una organización el uso de Cloud
Computing para el almacenamiento de la información, relacionado con la
administración de los datos que permite Big Data, brindara un objetivo para el
manejo correcto para lograr la optimización de los recursos y de los procesos
establecido para una entidad.
Estas tecnologías han permitido que la información pueda ser de utilidad y genere
ventajas económicas y competitivas en una organización.
Bibliografía
• Maté Jiménez, C. (2014). Big data. Un nuevo paradigma de análisis de datos.
• Torres, J. (2012). Del cloud computing al big data. Visión introductoria para
jóvenes emprendedores.
• i Viñals, J. T. (2012). Del cloud computing al big data. universitat oberta de
catalunya, Barcelona.
• Purcell, B. M. (2014). Big data using cloud computing. Journal of Technology
Research, 5, 1.
• Purohit, P., Apoorva, D. R., & Lathashree, P. V. (2017). Big Data in Cloud
Computing. International Journal of Advance Research, Ideas and
Innovations in Technology, 3(3), 1312-1318.
• Tanque, M., & Foxwell, H. J. (2017). Big Data and Cloud
Computing. Exploring the Convergence of Big Data and the Internet of
Things, 1.
Webgrafía
• Incibe. 2016. Tendencias en el Mercado de la Ciberseguridad. Audea.
http://www.audea.com/es/big-data-cloud-computing-internet-las-cosas-
principales-tendencias-sector-las-tic/.
• Lidia Montes. 2016. 'Cloud Computing' y 'Big data' para el turismo. El Mundo.
http://www.elmundo.es/economia/2016/04/20/57174807e5fdea8d5c8c0696.
html
• BBVA. 2015. BBVA Api Market. https://bbvaopen4u.com/es/actualidad/la-
union-hace-la-fuerza-big-data-mas-cloud-computing
• Ahmed Banafa. 2015. Cloud Computing, Big Data y movilidad en 2015.
OpenMind. https://www.bbvaopenmind.com/cloud-computing-big-data-y-
movilidad-tendencias-tecnologicas-en-2015/
• Carlos Santana. 2013. Cloud Computing para empresas, las ventajas de la
nube. http://blog.acsendo.com/cloud-computing-para-empresas-las-
ventajas-de-la-nube/
• T Systems. 2013. BIG DATA Y CLOUD – UNA ALIANZA PERFECTA. T
Systems. https://www.t-systems.com/es/es/soluciones/cloud/topics/big-
data/big-data-109832.
• Julian Garcia Barbosa. 2013. Cloud computing, el mejor camino para acceder
al big data. Telefonica. https://aunclicdelastic.blogthinkbig.com/cloud-
computing-mejor-camino-para-acceder-al-big-data/
• IIC. 2016. Big Data y la nube: los servicios Cloud. Instituto de Ingeniería del
Conocimiento. España. http://www.iic.uam.es/innovacion/big-data-la-nube-
servicios-cloud/