tecnología de aplicación sobre el tema

10
Tecnología de aplicación sobre el tema (servidor proxy CACHE) Introducción En informática, desde hace mucho tiempo se utilizan sistemas caché, que almacenan temporalmente la información utilizada, porque está comprobado que esa misma información suele volver a necesitarse. Este truco tiene cierto sentido cuando el sistema de almacenamiento temporal es mucho más ágil (rápido de consultar) que la fuente original que contenía la información. Por ejemplo, muchos sistemas operativos almacenan en memoria RAM la información obtenida del disco duro; hay bastantes posibilidades de que posteriormente vuelva a necesitarse esa misma información, y ya no será necesario volver a consultar el disco duro; podrá obtenerse directamente de la copia que se guarda en memoria RAM, con la ventaja de que es mucho más rápido consultar la memoria RAM que el disco duro. Otro ejemplo: quizá hayas visto que algunos microprocesadores anuncian como una de sus características que disponen de memoria caché. En esa pequeña memoria (incluida en el propio microprocesador) se va guardando una copia de la información recientemente obtenida de la memoria RAM, que proporcionalmente es mucho más lenta. De esa forma se agiliza el trabajo, puesto que muchas veces el microprocesador necesita volver a consultar los mismos datos dela memoria RAM, así puede obtenerlos más

Upload: raul-quispe-vasquez

Post on 25-Sep-2015

212 views

Category:

Documents


0 download

DESCRIPTION

un breve resumen sobre la tecnologia de aplicacion

TRANSCRIPT

Tecnologa de aplicacin sobre el tema (servidor proxy CACHE)

IntroduccinEn informtica, desde hace mucho tiempo se utilizan sistemas cach, que almacenan temporalmente la informacin utilizada, porque est comprobado que esa misma informacin suele volver a necesitarse. Este truco tiene cierto sentido cuando el sistema de almacenamiento temporal es mucho ms gil (rpido de consultar) que la fuente original que contena la informacin. Por ejemplo, muchos sistemas operativos almacenan en memoria RAM la informacin obtenida del disco duro; hay bastantes posibilidades de que posteriormente vuelva a necesitarse esa misma informacin, y ya no ser necesario volver a consultar el disco duro; podr obtenerse directamente de la copia que se guarda en memoria RAM, con la ventaja de que es mucho ms rpido consultar la memoria RAM que el disco duro. Otro ejemplo: quiz hayas visto que algunos microprocesadores anuncian como una de sus caractersticas que disponen de memoria cach. En esa pequea memoria (incluida en el propio microprocesador) se va guardando una copia de la informacin recientemente obtenida de la memoria RAM, que proporcionalmente es mucho ms lenta. De esa forma se agiliza el trabajo, puesto que muchas veces el microprocesador necesita volver a consultar los mismos datos dela memoria RAM, as puede obtenerlos ms rpidamente de sus propios circuitos.

En Internet ocurre algo muy parecido. Muchas pginas son consultadas repetidamente al cabo del da; el proveedor de conexin puede instalar un sistema que acte como memoria temporal intermedia para guardar una copia de las pginas que han visitado los usuarios. As, cuando otro usuario (o el mismo) quiera volver a consultar esa pgina, el proveedor de Internet ya no necesita solicitarla al servidor que la aloja en otro ordenador remoto: puede pasarle al usuario los datos que estn almacenados en alguno de sus propios ordenadores. Este sistema se le suele denominar PROXY-CACH o PROXY-TRANSPARENTE.Servidor proxy cache propiedades

El uso de un proxy-cach nunca introducir retardos apreciables en la obtencin de la informacin ya que en el peor de los casos (cuando la pgina solicitada no este en ninguno de los proxies de la jerarqua) el inicio de la bsqueda en la direccin fuente se retrasar apenas unas dcimas de segundo. En caso de que la pgina que se desee conseguir se encuentre en la base de datos de nuestro proxy-cach, el acceso a dicha pgina ser el que permite el ancho de banda de nuestra red interna, es decir aproximadamente igual a lo que tardamos en acceder a las pginas del web de la universidad. En caso de que la pgina que quiere conseguir no se encuentre en el proxy-cach, pero s en uno de los proxies de la jerarqua el acceso a dicha pgina ser tambin bastante ms rpido que si se tuviera que acceder a la fuente original.Segn algunas pruebas realizadas en proxies similares al nuestro el nmero de peticiones donde el acceso se ve mejorado llega a obtener porcentajes superiores a 50%. El primero que cargue una determinada pgina sufrir, como hasta ahora, la lentitud de Internet, pero el siguiente que cargue dicha pgina se la proporcionar nuestro servidor proxy-cach y la respuesta ser mucho ms rpida. Otra ventaja ser que al utilizar el proxy-cach ser este el que se comunique con el exterior, pudiendo funcionar como firewall, esto es, aumentar nuestra seguridad respecto a la informacin a la que accedemos.

Qu es un servidor proxy-cach?

Proxy cach: Su mtodo de funcionamiento es similar al de un proxy HTTP o HTTPs. Su funcin es precargar el contenido web solicitado por el usuario para acelerar la respuesta Web en futuras peticiones de la misma informacin de la misma mquina u otras.Es un servidor situado entre la mquina del usuario y otra red (a menudo Internet) que acta como proteccin separarando las dos redes y como zona cach para acelerar el acceso a pginas web o poder restringir el acceso a contenidos.Es decir, la funcin de un servidor proxy es centralizar el trfico de una red local hacia el exterior (Internet). Slo el equipo que incorpora el servicio proxy debe disponer de conexin a Internet y el resto de equipos salen a travs de l.Como las peticiones haca Internet de los equipos de la red local son interceptadas por el servidor proxy, ste puede realizar una tarea de filtrado de accesos, impidiendo aquellos destinos que estn expresamente prohibidos en los archivos de configuracin del servicio. Squid no es un filtro de contenidos pero puede actuar como tal.En el aula se suele utilizar este servicio ya que permite llevar un control sobre la actividad de la red hacia el exterior del aula. En este caso lo usual es que el equipo que hace la funcin de servidor proxy disponga de dos interfaces de red. Una de ellas es utilizada para atender a la red local y la otra proporciona la conexin con Internet. Las peticiones de pginas web que se realizan desde el aula son interceptadas por la interfaz interna y reenviadas a la interfaz externa si cumplen los requisitos establecidos desde el servicio proxy.Hay que tener en cuenta que la mayora de los servidores web permiten la configuracin como proxy-cach (Apache, IIS,...), pero Squid slo es un proxy y no puede servir pginas por s mismo.Funcionamiento El funcionamiento de unproxy cachees el siguiente: cuando un cliente realiza una peticin a un servidor web, en la que genera X peticiones a todos los objetos que componen dicha web, la peticin llega alproxy, que revisa su cache para comprobar si dispone de los objetos que se van solicitando. En el caso de que el objeto buscado se encuentre en cache, elproxyverifica que no ha expirado: que el objeto se corresponde con el actual, y en ese caso se produce unHITy el sistema devuelve al cliente el objeto en cuestin. Si por el contrario el objeto buscado no se encuentra en cache o la versin encontrada no est actualizada, se produce unMISSen cache, tras lo cual el proxy descarga el elemento solicitado y lo sirve al cliente.

Como puede verse, en el mejor de los casos nos ahorramos el enrutamiento desde el proxy al servidor sobre el que se realiza la peticin y la transferencia de la informacin solicitada a travs de Internet, mientras que en el peor de los casos aadimos un salto ms en el enrutamiento. Por supuesto, cunto ms accedido sea un determinado contenido por los usuarios de la red interna, mayor probabilidad de que el objeto se encuentre en cache y por tanto, mayor incremento del rendimiento del sistema.Veamos ahora un ejemplo enfocado a nuestro entorno. Como todos saben, la Ley 11/2007 de 22 de junio, de Acceso electrnico de los ciudadanos a los Servicios Pblicos, promueve el ofrecimiento de los servicios prestados por las administraciones pblicas a travs de la web. El enfoque que se le est dando es que los organismos ms grandes actuarn de prestadores de servicios para aquellos organismos ms pequeos y con menores recursos; por ejemplo, una diputacin presta la plataforma para los ayuntamientos. Teniendo en cuenta que las cifras empleadas nicamente van a servir de ejemplo y en ningn caso reflejan la realidad, apliquemos esto a lo que hemos visto hasta el momento.Imaginemos que todas las peticiones web realizadas a los servicios prestados por los ayuntamientos se realizaran directamente contra el servidor de la diputacin, que acta no slo de repositorio de contenidos, sino que adems de frontal web para los usuarios finales. Qu ancho de banda consumira nicamente sirviendo las imgenes de la web? Qu carga va a soportar el servidor? En este caso, el servidor de la diputacin debera responder a cada peticin de los usuarios. Sin embargo, si cada ayuntamiento dispone de unproxy cache, las peticiones de cada usuario repercutir en una respuesta por parte del servidor del ayuntamiento, y el servidor de la diputacin recibir nicamente aquellas peticiones que correspondan a material que se encuentre obsoleto en el servidor del ayuntamiento (obviamente la parte dinmica siempre se trasladar al servidor de la diputacin, por su imposibilidad de hacer uso deproxy cachepara ello).Hagamos algunos nmeros, aunque de manera muy simplificada. Supongamos no hacemos uso de proxy cach, y que la pgina de un ayuntamiento est formada por 30 objetos, de los cuales 10 se actualizan cada minuto. Tenemos un total de 100 ayuntamientos que reciben 1000 peticiones por minuto, por lo que estamos hablando de un total de 3.000.000 de peticiones por minuto (30 objetos * 100 ayuntamientos * 1000 peticiones) directamente sobre el servidor de la diputacin, lo que lo hace mucho ms vulnerable a cadas y prdidas de servicio en caso de existir un pico de carga que no pueda gestionar. Sin embargo, si se implementan proxys cache al nivel de los ayuntamientos, cada uno de stos recibe un total de 30.000 peticiones por minuto (30 objetos * 1000 peticiones), y el servidor de la diputacin 1000 peticiones por minuto (10 objetos que hay que actualizar cada minuto * 100 ayuntamientos). Como puede verse, ambos nmeros son mucho ms razonables y reducen tanto las necesidades de hardware como el impacto de un pico de carga. Por supuesto, para trasladar esto a un ejemplo real, deberamos contemplar tanto el impacto de las verificaciones contra la fuente original del objeto demandado, adems del impacto que tiene la cache de los propios navegadores sobre el trfico soportado por los servidores. En cualquier caso, no es el propsito de la entrada elaborar un modelo elaborado, sino nicamente mostrar una aproximacin numrica a las ventajas de la utilizacin de losproxy cache.Como herramientas de servidor cache destacaSQUID, un programa de software libre que implementa un servidor proxy y un demonio para cach de pginas web, publicado bajo licencia GPL. SQUID es un proyecto que lleva tiempo disponible y que tiene muy buena aceptacin por parte de la comunidad. Aunque orientado a principalmente a HTTP y FTP, es compatible con otros protocolos como Internet Gopher (s, Gopher, se acuerdan?). Implementa varias modalidades de cifrado como TLS, SSL, y HTTPS. Como herramientas para analizar los logs generados por elproxy, tenemos ACALAMARISySARG. Ambas ayudan a entender el funcionamiento de la red y permiten reconfigurar el proxy para mejorar las prestaciones del mismo.Resumiendo, unproxy cachepermite optimizar y mejorar las prestaciones, reduciendo (y limitando si es preciso) el consumo de ancho de banda, que puede ser utilizado para otros aspectos como puede ser trafico QoS (aunque este es ms dependientes de latencias y jitter que de ancho de banda). En cualquier caso, aunque son patentes los beneficios de esta tecnologa, es obvio que est enfocada a infraestructuras que soportan un importante nmero de peticiones web. Por otra parte, para mejorar su eficiencia es importante que exista un proceso de mejora continua, de modo que se aproveche elfeedbackque proporcionan los registros producidos por el servidor, ajustando la configuracin del proxy a los requisitos de nuestra organizacin.Cuando decimos que Squid tambin funciona como cach significa que est guardando copia de los datos obtenidos de otras peticiones y de esa forma acelera el acceso a estos datos si se producen peticiones similares. Slo se acceder de nuevo a las pginas originales cuando se detecte que se han producido modificaciones, es decir los datos almacenados difieren de los datos en el servidor web de origen.Normalmente no existe una sola cach, sino que se tienen varios servidores (en mquinas diferentes) relacionados entre s mediante una estructura en rbol.