cassandra presentacion base de datos no sql

Upload: giancarlo1396

Post on 08-Mar-2016

256 views

Category:

Documents


1 download

DESCRIPTION

Presentacion sobre algunos conceptos de CASSANDRA

TRANSCRIPT

BASE DE DATOS NO SQL CASSANDRA

-Alarcn Quispe Kevin-Ccopa Marin Franco-Llana Chavez Walter-Pavn Cuellar KeilaINTEGRANTES :Este Esta presentacin, que se recomienda ver en modo de presentacin, muestra las nuevas funciones de PowerPoint. Estas diapositivas estn diseadas para ofrecerle excelentes ideas para las presentaciones que crear en PowerPoint 2010.

Para obtener ms plantillas de muestra, haga clic en la pestaa Archivo y despus, en la ficha Nuevo, haga clic en Plantillas de muestra.1CONCEPTOCassandra es un motor de base de datos NoSQL, open source e implementado en Java.Es una base de datos NoSQL mas relevantes a nivel mundial.Cassandra puede manejar muchos terabytes de datos.La informacin en la base de datos relacionales, se almacenan en forma de filas, pero en Cassandra la informacin se almacena en columnas con pares key-value.Distribuye los datos mediante funciones hash.Se diseo Cassandra para que las configuraciones de explotacin fuesen altamente escalables, horizontales y relativamente econmicas.

2HISTORIAFue desarrollado inicialmente en Facebook para impulsar su Bandeja de entrada y funciones de bsqueda.En julio del 2008 fue lanzado como un proyecto de cdigo abierto . En marzo de 2009, fue donada a Apache como software libre.En los prximos aos se les fue agregando mas caractersticas importantes como ndices secundarios, CQL, trigger, mejoras en el rendimiento de lecturas, etc.Actualmente se encuentra en la versin 2.1.4

3CASSANDRA - BIGDATAActualmente los sistemas de informacin sobre todo en las redes sociales, servicios de mensajeras, correos elctricos, entre otros; manejan grandes cantidad de datos(entre texto, imgenes, audio y videos)Hoy en da, de acuerdo con Apache, "Cassandra gestiona masivos cantidades de datos de forma rpida y fiable sin comprometer el rendimiento, independientemente si se ejecuta en la nube o parcialmente en las instalaciones de un almacn de datos hbrido. Su arquitectura totalmente distribuida proporciona tolerancia a fallos sin precedentes para asegurar que las aplicaciones no pierdan conexin, y su escalabilidad lineal les permite llegar a tamaos enormes durante la manipulacin con xito a miles de peticiones por segundo.

CARACTERISTICASMODELADO ColumnFamily: Contenedor de Columnas que se asemeja a las tablas. Se guarda en un fichero Ordenado por clave de fila.SuperColumn: Elemento compuesto por varias columnas y sus nombres SuperColumna(Columna1()Columna2())Column: Elemento mas bsico que se asemeja al concepto de campo. Columna(Nombre->Nombre del campoValor->Valor del campoTimestamp->Marca del tiempo)SuperColumnFamilySimpleColumnFamily

KeySpace: Contiene familia de columnas y se asemeja a la Base de Datos relacional.CDIGO

PROYECTOSTwitter abandon MySQL para empezar a utilizarCassandracomo base de datos, y no es el nico que se ha decidido por Cassandra, tal es el caso de:

FacebookDiggCisco

El por qu Facebook usa Cassandra es una cuestin simple de responder, ya que ellos son los desarrolladores iniciales y lo han desarrollado de acuerdo con sus necesidades.

9Por qu Facebook desarrollo Cassandra?Prashant Malik, del equipo de bsqueda, estaba pensando cmo resolver el problema de la bandeja de entrada. El desafo se centraba en cmo almacenar ndices inversos de los mensajes que los usuarios de Facebook envan y reciben entre ellos. La gran cantidad de datos almacenados, su ratio de crecimiento y los requerimientos para servir la informacin, hacan aparente la necesidad de una nueva solucin de almacenamiento, que fuera capaz de escalar incrementalmente.

Por qu la han elegido sitios como Digg/Twitter?Segn palabras de Ian Eure:

Despus de considerar HBase, Hypertable, Cassandra, Tokyo Cabinet/Tyrant, Voldemort y Dynomite, nos quedamos con Cassandra. Cada sistema tiene sus puntos fuertes y sus debilidades, pero Cassandra es una buena mezcla de todo. Ofrece almacenamiento orientado a columnas, por lo que tienes algo ms de estructura que los acercamientos de clave/valor. Opera en un cluster distribuido, de alto rendimiento y peer-to-peer. Y aunque le faltan algunas caractersticas necesarias, nos deja ms cerca de dnde queremos llegar que otras soluciones.Tenemos una gran cantidad de datos, y con un factor de crecimiento muy elevado y encima acelerndose. Tenemos un sistema con mysql + memcache pero se est convirtiendo en algo costosamente prohibitivo en trminos de esfuerzo (personal trabajando para el sistema). Necesitamos un sistema que pueda crecer de una forma ms automatizada y que presente alta disponibilidad.Las principales razones por las que migramos a Cassandra se resumen en: 1) No tiene puntos de fallo, 2) las escrituras son altamente escalables y 3) una comunidad open source saludable y productiva.Por su parte, Ryan King de Twitter:

http://eventos.citius.usc.es/bigdata/workshops/Cassandra.pdf?hc_location=ufihttps://msdn.microsoft.com/en-us/magazine/jj553519.aspxhttp://www.zdnet.com/article/cassandra-2-0-the-next-generation-of-big-data/http://www.nosql.es/blog/nosql/cassandra.html?hc_location=ufihttp://www.rackspace.com/blog/cassandra-by-example/?hc_location=ufihttp://www.acens.com/wp-content/images/2014/02/bbdd-nosql-wp-acens.pdf?hc_location=ufi

BIBLIOGRAFIAVIDEO