hive.ppt

Post on 11-Jul-2016

4 Views

Category:

Documents

3 Downloads

Preview:

Click to see full reader

TRANSCRIPT

HIVE

©

¿Qué es?

Hive es almacén de datos creado específicamente para Hadoop que nos facilita la tarea de sumarizar los datos pre-existentes en HDFS. La idea principal de Hive es la de funcionar como capa externa a Hadoop a modo de envoltorio, donde vamos a poder realizar consultas sobre el sistema de archivos que serán tratadas como MapReduces en modo nativo en HDFS.

Para poder realizar estas operaciones, los de Apache crearon un lenguaje de consultas a "base de datos" (recordemos que HDFS es un sistema de ficheros) muy similar a SQL, que denominaron HiveQL o HQL (dependiendo de en que libro lo leas lo verás de una manera u otra).

¿Qué es?

El corazón de esta idea se basa en el denominado MetaStore, que es un "lugar" donde se van a ir guardando toda la información relacionada con las operaciones en Hive,

Características Principales

Una sintaxis concisa, elegante y flexibles

Programas Scala tienden a ser cortosUna estimación más conservadora sería que un programa típico Scala debería tener aproximadamente la mitad del número de líneas del mismo programa escrito en Java. Menos líneas de código significan no sólo escribir menos, sino también menos esfuerzo en lectura y comprensión de los programas.La inferencia de tipos minimiza la necesidad de información de tipo explícito en muchos contextos. Las declaraciones de tipos y funciones son muy concisas.

Características Principales

Contacto

www.saxsa.com.mx

Info@saxsa.com.mx

@BigData_WG

/bigdatamx

top related