modelo para la recuperación de las estadísticas de uso de ... · análisis de datos por medio de...

30
3/35 Modelo para la recuperación de las estadísticas de uso de recursos electrónicos de información. Información del autor(es): Nombres y apellidos: Laura Ortigoza Jiménez Grado académico: Maestra en Ciencias Cargo: Analista de la Unidad de Inteligencia Perfil profesional: Es Ingeniero Químico por la Universidad Veracruzana, recibió el grado de Maestra en Ciencias por el Centro de Investigación Avanzada del IPN. Obtuvo un diplomado en “Gestión de Proyectos e Inteligencia Competitiva” por el Consejo Nacional de Ciencia y Tecnología (CONACYT). Cuenta con un diplomado por Harvard Manage Mentor en Innovation Implementation Tiene un diplomado profesional otorgado por Microsoft de “Minería de datos con SQL Server”. Se le otorgo una certificación en conocimientos sobre propiedad intelectual otorgada por el Instituto Mexicano de la Propiedad Intelectual (IMPI) y la Organización Mundial de la Propiedad Intelectual (WIPO). Su experiencia laboral se ha desarrollado en generación de modelos de Unidades de Vigilancia Tecnológica, creación de modelos para implementar metodologías sistemáticas para el buen aprovechamiento y explotación de los recursos electrónicos de información y análisis de datos por medio de herramientas de B.I. Participó en el Consejo Nacional de Ciencia y Tecnología (CONACYT) en el diseño e implementación de su herramienta de análisis estadístico de recursos electrónicos de información para medir el uso de las bases de datos que suscriben para 520 instituciones de educación e investigación superior. Institución: Instituto Mexicano de la Administración del Conocimiento Correo electrónico: [email protected]

Upload: others

Post on 23-Jun-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Modelo para la recuperación de las estadísticas de uso de ... · análisis de datos por medio de herramientas de B.I. Participó en el Consejo Nacional de Ciencia y Tecnología

3/35

Modelo para la recuperación de las estadísticas de uso de recursos

electrónicos de información.

Información del autor(es):

Nombres y apellidos: Laura Ortigoza Jiménez

Grado académico: Maestra en Ciencias

Cargo: Analista de la Unidad de Inteligencia

Perfil profesional:

Es Ingeniero Químico por la Universidad Veracruzana, recibió el grado de Maestra en

Ciencias por el Centro de Investigación Avanzada del IPN. Obtuvo un diplomado en

“Gestión de Proyectos e Inteligencia Competitiva” por el Consejo Nacional de Ciencia y

Tecnología (CONACYT). Cuenta con un diplomado por Harvard Manage Mentor en

Innovation Implementation Tiene un diplomado profesional otorgado por Microsoft de

“Minería de datos con SQL Server”. Se le otorgo una certificación en conocimientos sobre

propiedad intelectual otorgada por el Instituto Mexicano de la Propiedad Intelectual (IMPI) y

la Organización Mundial de la Propiedad Intelectual (WIPO).

Su experiencia laboral se ha desarrollado en generación de modelos de Unidades de

Vigilancia Tecnológica, creación de modelos para implementar metodologías sistemáticas

para el buen aprovechamiento y explotación de los recursos electrónicos de información y

análisis de datos por medio de herramientas de B.I.

Participó en el Consejo Nacional de Ciencia y Tecnología (CONACYT) en el diseño e

implementación de su herramienta de análisis estadístico de recursos electrónicos de

información para medir el uso de las bases de datos que suscriben para 520 instituciones

de educación e investigación superior.

Institución: Instituto Mexicano de la Administración del Conocimiento

Correo electrónico: [email protected]

Page 2: Modelo para la recuperación de las estadísticas de uso de ... · análisis de datos por medio de herramientas de B.I. Participó en el Consejo Nacional de Ciencia y Tecnología

4/35

Tema desarrollado: Modelo para la recuperación de las estadísticas de uso de recursos

electrónicos de información.

Resumen

Existe un reto en las Bibliotecas cuando se requiere conocer las necesidades de información de la comunidad, las tendencias de los intereses de sus usuarios, estadísticas de uso de los recursos electrónicos de información que contratan y los movimientos detallados que hacen los usuarios dentro del catálogo OPAC de la Biblioteca. Para trabajar de manera precisa y oportuna con este reto, se requiere romper la barrera de la recuperación y homologación de estadísticas de uso. En este trabajo se muestra una metodología que permite identificar las preguntas básicas e indispensables que lleven a la generación de indicadores que midan el uso de los diferentes servicios electrónicos que ofrece la Biblioteca. Además se identificarán las fuentes de datos disponibles para la generación de indicadores de uso y finalmente se muestran las diferentes alternativas en el tema de soluciones tecnológicas para la consolidación de estadísticas de uso de los diferentes recursos electrónicos de información. El enfoque principal en este trabajo es la generación de indicadores de uso en las Bibliotecas que permitan tomar decisiones, justificar presupuestos y trabajar con un plan estratégico anticipado respecto a lo que se suscribe o renueva de recursos electrónicos de información. Con el fin de contar con datos reales para la generación de indicadores de uso de los recursos electrónicos de información, se solicitó el apoyo de algunas Bibliotecas Digitales, de las cuales por convenio de confidencialidad se hace referencia a ellas como los casos de estudio: Caso de Estudio 1.- Biblioteca Digital de Nivel Superior. Caso de Estudio 2.- Biblioteca Digital Consorcial para 500 Instituciones de Educación Superior. Palabras clave: bibliominería estadísticas de uso en bibliotecas, gestión de datos, herramienta, indicadores de bibliotecas, minería de datos, solución.

Introducción

Las bibliotecas y centros de información han asumido nuevas e importantes responsabilidades en un mundo lleno de información. Se enfrentan a un universo cada vez más amplio de acceso a recursos electrónicos de información; Bases de Datos, Libros Electrónicos, Revistas Electrónicas, Catálogo OPAC, etc., todos en diferente plataforma, lo cual resulta en un problema, cuando el interés es conocer el uso que se le está dando a todos estos recursos. Además de lo anterior, es necesario conocer quien está utilizando el recurso, por cuanto tiempo y si ese acceso culmina o no en una descarga de texto

Page 3: Modelo para la recuperación de las estadísticas de uso de ... · análisis de datos por medio de herramientas de B.I. Participó en el Consejo Nacional de Ciencia y Tecnología

5/35

completo. El tema de estadísticas de uso en el ámbito Bibliotecario no es un tema nuevo. Diferentes Instituciones han estudiado los diferentes indicadores en Bibliotecas desde 1995. En la Tabla 1, se muestra a los diferentes Organismos y las Iniciativas que se han publicado al paso del tiempo:

Tabla 1. Estado del arte en el tema de indicadores en Bibliotecas.

Hay un gran interés en el ámbito bibliotecario por medir y evaluar el rendimiento de las bibliotecas. Las bibliotecas siempre han analizado estadísticas del uso de sus acervos, colecciones e instalaciones. Sin embargo los datos que analizan ofrecen información

Organismo Iniciativa

Comisión Europea Library Performance Indicators and Library

Management Tools [1].

SEDIC

Guía para la aplicación de la norma ISO

9000 a bibliotecas y servicios de

información y documentación [2].

International Federation of Library

Associations and Institutions (IFLA)

Directrices Internacionales para la medición

del rendimiento en las bibliotecas

Universitarias [3].

Joint Funding Councils (JFC)

The effective academic library: a framework

for evaluating the performance of UK

academic libraries [4].

Red Española de Bibliotecas

Universitarias (REBIUN)

Guía para indicadores de rendimiento y

calidad de bibliotecas [5].

Normas ISO y UNE

Norma ISO 11620 Indicadores de

rendimento de bibliotecas [6].

UNE-ISO 2789, Información y

documentación. Estadísticas

internacionales de bibliotecas, 2014 [7].

Norma Española UNE 50137 Indicadores

de rendimiento bibliotecario [8].

Comité de Bibliotecas Universitarias de

Perú (COBUN)

Indicadores de Gestión Bibliotecaria emitido

por el COBUN [9].

Page 4: Modelo para la recuperación de las estadísticas de uso de ... · análisis de datos por medio de herramientas de B.I. Participó en el Consejo Nacional de Ciencia y Tecnología

6/35

cuantitativa y por lo tanto es difícil asociarlo a una planeación estratégica en la gestión de la Biblioteca, ya que no hay forma de hilar las estadísticas con las metas, objetivos y toma de decisión para mejorar los servicios.

En el caso de las estadísticas de uso de los recursos electrónicos de información, se debe buscar la medición objetiva de los servicios Bibliotecarios por medio de indicadores que permitan mejorar el servicio, detectar oportunidades o debilidades y ajustar acciones que ayuden a cumplir el objetivo de la planeación estratégica de la Biblioteca. El manual “Claves para el éxito: indicadores de rendimiento para bibliotecas públicas” [11], sugiere los siguientes puntos a considerar al generar indicadores:

Planificar, conocer qué está consiguiendo la biblioteca y establecer los objetivos y prioridades para el futuro.

Comunicación, reportar el rendimiento del servicio a toda la organización (equipo directivo, personal y usuarios).

Resolver problemas antes de que surjan, en lugar de reaccionar tarde a una crisis, identificar áreas problemáticas y analizar sus causas.

Tomar decisiones a partir de datos pertinentes.

Estar pendientes de las mejoras y documentarlas.

En este trabajo se plantea un modelo que da a las Bibliotecas la opción de ser generadores de sus propios datos para la estandarización de reportes. El tema de la autonomía en la generación de estadísticas de uso, es con el fin de evitar la dependencia que en estos días se vive, al tener que solicitar a los proveedores el envío de las estadísticas de uso. En un entorno tan cambiante, donde se deben justificar presupuestos, tomar decisiones con información confiable y oportuna, las Bibliotecas requieren indicadores que ofrezcan información cuantitativa y cualitativa haciendo evidente el detalle de quienes están utilizando los recursos electrónicos de información.

Page 5: Modelo para la recuperación de las estadísticas de uso de ... · análisis de datos por medio de herramientas de B.I. Participó en el Consejo Nacional de Ciencia y Tecnología

7/35

Método utilizado

En el modelo propuesto permite identificar las necesidades y la metodología a considerar para la generación y recuperación de indicadores de uso de los recursos electrónicos de información. El modelo propuesto se basa en el Proceso de Bibliomining de Nicholson, Scott. y Stanton, J [12], asimilando las siguientes etapas:

Proceso de Bibliomining Modelo propuesto

1 Determinación de áreas a medir

Generación de preguntas claras y concisas: ¿Qué áreas quiero medir en la Biblioteca? ¿Cuáles son mis indicadores emergentes?

2 Definición de qué se quiere

conocer

Identificación de los indicadores necesarios que fundamente la toma de decisiones en el tema de contratación de recursos electrónicos de información.

3 Identificación de las fuentes de datos internas y externas

Sistema de validación (Log del proxy)

Iniciativa COUNTER

4 Selección de la herramienta tecnológica

Piwik

Google Analitycs

InfoIntelligen

5 Descubrimiento de patrones a través de la minería de datos y creación de informes con herramientas de análisis de datos

Transformar el análisis de datos en indicadores que me apoyen en la toma de decisiones. Análisis de datos, sin miedo a los resultados.

6 Análisis e implementación de los resultados

Aplicar los indicadores definidos, establecer estrategias a corto plazo, que permitan hacer ajustes y mejoras a las áreas analizadas.

Tabla 3: Adecuación de proceso Bibliomining al modelo propuesto.

Page 6: Modelo para la recuperación de las estadísticas de uso de ... · análisis de datos por medio de herramientas de B.I. Participó en el Consejo Nacional de Ciencia y Tecnología

8/35

Modelo propuesto aplicado

Etapa 1.- Determinación de áreas a medir

El objetivo de esta primer etapa es que por medio de preguntas claras y concisas se

definan qué áreas se someterán a medición y cuáles serán los indicadores que requiero

conocer.

I. ¿Qué áreas quiero medir en la Biblioteca?

Revisión de la inversión que se hace en la suscripción/renovación de los

recursos electrónicos de información que brinda la Biblioteca

II. ¿Cuáles son mis indicadores emergentes de acuerdo al área definida?

Recursos con mayor consulta y con menor consulta

Información cualitativa del uso de los recursos electrónicos de

información: de qué departamento, carrera, programa académico, tipo

de usuario, ID de usuario

Conocer si los recursos están siendo utilizados por la carrera/programa

académico para los cuales fueron contratados

Descargas en texto completo que se hacen por título de revista

Las revistas contratadas y utilizadas por los usuarios se encuentran

rankeadas dentro de un Factor de Impacto

Page 7: Modelo para la recuperación de las estadísticas de uso de ... · análisis de datos por medio de herramientas de B.I. Participó en el Consejo Nacional de Ciencia y Tecnología

9/35

Etapa 2.- Definición de qué quiero conocer

En esta etapa se definieron los indicadores a considerar para la “Revisión de la inversión

que se hace en la suscripción/renovación de los recursos electrónicos de información que

brinda la Biblioteca”:

Indicador Detalle del indicador

Uso de las Bases de datos

Número de accesos a las bases de datos por carrera, departamento, sede, persona, IP, etc.

Usuarios potenciales con respecto a los reales por carrera o departamento.

Análisis de colecciones

Uso de las colecciones electrónicas.

Traslape entre títulos dentro de las colecciones.

Descargas en texto completo por editor-revista

Textos completos descargador por revista, costo por artículo.

Factor de impacto de las revistas disponibles.

Inversión a la suscripción de los recursos electrónicos de información

Inversión en suscripción a bases de datos con respecto al uso.

Desarrollo de colecciones con respecto al interés de los usuarios.

Negociación con los editores/proveedores y/o agregadores.

Infraestructura Tecnológica adecuada

Plataforma intuitiva para la búsqueda y recuperación de contenido electrónico.

Validación de los usuarios para la autenticación.

Integración de los recursos electrónicos de información.

Tabla 2. Indicadores de una Biblioteca

Los indicadores que se muestran en la Tabla 2, brindan a los directores de las Bibliotecas

los elementos para hacer una suscripción o renovación de los recursos electrónicos de

información con fundamento en si se utiliza el recurso y quien lo utiliza. Con esta

información se tiene apoyo para la toma de decisiones, respecto a:

• Fijación de objetivos

• Asignación de presupuesto

• Plan operativo

Page 8: Modelo para la recuperación de las estadísticas de uso de ... · análisis de datos por medio de herramientas de B.I. Participó en el Consejo Nacional de Ciencia y Tecnología

10/35

Etapa 3.- Identificación de las fuentes de datos internas y externas

La materia prima de los indicadores son datos, por lo que se requiere que estos se

extraigan de fuentes confiables, que estén disponibles de manera inmediata y que se

encuentren en formatos manejables. En esta etapa se exponen las fuentes de datos

externas e internas que se utilizaron para la generación de los indicadores establecidos en

la “Revisión de la inversión que se hace en la suscripción/renovación de los recursos

electrónicos de información que brindan las Bibliotecas”.

Fuentes de datos externas

Podemos definir como fuente de datos externa a las estadísticas de uso por recurso

electrónico de información que envían o que se recuperan por medio de la plataforma de

los proveedores. Las características principales de esta fuente externa son que implican de

tiempo y esfuerzo en la recuperación de los datos, son estadísticas muy limitadas, ya que

no se obtiene el detalle de quien está haciendo las consultas, descargas o accesos. El

tener estadísticas globales, no permiten a la Dirección de Bibliotecas contar con elementos

que ayuden a la planeación estratégica de contratación, suscripción o renovación de

recursos electrónicos de información.

Otra fuente externa, de la cual las Bibliotecas son dependientes, son los archivos que

muestran los títulos de revistas, libros, etc, por colección, en este caso, se depende de que

dichas listas estén actualizadas o que brinden el detalle de la colección, por ejemplo:

tiempo de embargo, full text start o full text stop, tipo de fuente: revista académica, libro

electrónico, periódico, etc.

Fuentes de datos internas

A continuación se muestran las fuentes que se determinaron como internas, ya que son

fuentes de datos disponibles en las Bibliotecas y que además se pueden extraer de forma

automática, pudiendo así eliminar la dependencia que se tiene con el proveedor en el tema

de estadísticas de uso. Las fuentes de datos internas que se sugiere se exploten son:

a) Sistema de validación (Log del proxy)

Page 9: Modelo para la recuperación de las estadísticas de uso de ... · análisis de datos por medio de herramientas de B.I. Participó en el Consejo Nacional de Ciencia y Tecnología

11/35

Es un sistema de validación de usuarios que controla el acceso a los

recursos ofrecidos por la biblioteca. Es muy común que por cuestiones de política

institucional el modelo de configuración del sistema Proxy o Sistema de validación

se utiliza sólo para acceso remoto o acceso fuera del campus de la Institución. Sin

embargo se debe trabajar en la validación aun dentro del campus, con el fin de que

se aloje en las bitácoras del Proxy los datos de acceso dentro y fuera del campo y

evitar sesgo en la información, que pueden dar indicadores incorrectos, ya que el

escenario no estará completo.

En cuanto a la autentificación de usuarios, existen en el mercado varios

sistemas de validación. El más común en las bibliotecas es el EZ-Proxy, el cual es

capaz de guardar bitácoras de sesiones, que alojan de acuerdo a la configuración

el detalle de lo que hace el usuario al acceder por medio de su clave y contraseña a

los recursos electrónicos de información. Algunos datos almacenados en la bitácora

del Proxy o Sistema de validación pueden ser:

a. Recurso al que ingresó.

b. Institución afiliada.

c. Fecha y hora de ingreso al recurso.

d. IP (Dirección de Internet) desde donde ingresó el usuario.

e. Cuenta del usuario.

f. Programa académico.

g. Tiempo de estancia dentro de un recurso.

Los datos que se alojan en la bitácora dependen de la configuración del Proxy.

Los detalles del usuario se obtienen del Directorio Activo, LDAP o Base de datos de

usuarios, donde se aloja: Nombre del usuario-Carrera a la que pertenece-

Departamento al que pertenece-ID de usuario-Tipo de usuario, etc.

b) Iniciativa COUNTER (Counting Online Usage of Networked Electronic Resources)

[13], lanzada en 2002 y adoptada por los proveedores de los recursos electronicos

de información, como un estándar de medición de sesiones, búsquedas, servicios y

Page 10: Modelo para la recuperación de las estadísticas de uso de ... · análisis de datos por medio de herramientas de B.I. Participó en el Consejo Nacional de Ciencia y Tecnología

12/35

textos completos descargados. Algunos de los reportes COUNTER que se

consideraron en este trabajo son:

Journal Report 1 – full-text article requests (Artículos en texto completo

solicitados).

Database Report 1 – searches and sessions by database (Accesos y

búsquedas totales por base de datos)

Database Report 2 – turnaways by Month and Service (Rechazos del

proveedor al solicitante por mes).

Database Report 3 – searches and sessions by service (Total de búsquedas

y sesiones por servicio).

Los reportes COUNTER, son denominados como una fuente interna, porque son

datos disponibles, sin embargo, hay ciertas realidades que se deben tomar en

cuenta:

Los principales proveedores y/o agregadores han asimilado la iniciativa

COUNTER. Sin embargo aún hay proveedores que no se han sumado a

dicha iniciativa.

Los reportes COUNTER pueden descargarse directamente de la plataforma

del proveedor en formato Excel, XLS, HTML, entre otros, siempre y cuando

se tenga una clave y contraseña de administrador.

Los reportes COUNTER pueden descargarse de forma automática a través

del protocolo SUSHI (Standardized Usage Statistics Harvesting Initiative) [14],

protocolo para la extracción y consolidación de las estadísticas provenientes

de diferentes proveedores de información. Es importante mencionar que no

todos los proveedores lo tienen.

Uno de los puntos a considerar al pasar a la siguiente etapa, es la automatización para la

recuperación de los reportes COUNTER.

Page 11: Modelo para la recuperación de las estadísticas de uso de ... · análisis de datos por medio de herramientas de B.I. Participó en el Consejo Nacional de Ciencia y Tecnología

13/35

Etapa 4.- Selección de la herramienta tecnológica

El análisis de los datos puede ser complejo y tardado, si no se cuenta con una

herramienta que facilite el manejo de miles de datos y guardar históricos. La herramienta

que se utilizó en este trabajo funge como un semáforo, que permite conocer la evolución

de los indicadores, el impacto de las actividades realizadas y la formulación de estrategias

que ayuden a mejorar el servicio bibliotecario.

A continuación se presentan los resultados de la evaluación que se hizo a diversas

herramientas con las que se pueden generar estadísticas de uso de los recursos

electrónicos de información:

Características Piwik Google Analytics

InfoIntelligen Otros

Herramienta intuitiva SI SI SI SI

Herramienta especializada NO NO SI SI

Analiza diferentes fuentes de datos al mismo tiempo

NO NO SI NO

Relaciona precios por descarga

NO NO SI NO

Permite conocer factores de impacto de las revistas descargadas

NO NO SI NO

Analiza reportes COUNTER NO NO S NO

Analiza el proxy NO NO SI SI

Permite descargar los reportes en Excel

SI SI S SI

Es una plataforma a la medida de las necesidades de las instituciones

NO NO SI NO

Permite cambiar los tipos de gráficos

NO NO S SI

Permite guardar historiales SI SI SI SI

Tiene soporte técnico SI SI S SI

Tiene mantenimientos NO SI SI SI

Hay actualizaciones SI SI S SI

Puedes generar nuevos indicadores

NO NO SI NO

Hace conteos de entradas SI SI S SI

Analiza archivos o fuentes de datos adicionales en Excel

NO NO SI SI

Se conecta a la base de datos NO NO SI SI

Page 12: Modelo para la recuperación de las estadísticas de uso de ... · análisis de datos por medio de herramientas de B.I. Participó en el Consejo Nacional de Ciencia y Tecnología

14/35

de usuarios

Solución Web SI SI SI SI

Se instala en servidor institucional

SI NO NO AMBOS

Es por suscripción NO NO SI AMBOS

Solución Licenciada OPEN SOURCE

HOSTEADO SI NO

Usuarios ilimitados SI SI NO NO

Análisis de múltiples páginas web

SI SI SI NO

Tabla 3. Comparación de sistemas para estadísticas de uso

Google Analytics, es una solución para las Bibliotecas que requieren conocer accesos a

la plataforma de su Biblioteca Digital. Se utiliza Google Analytics, para conocer visitas al

sitio de la Universidad o bien visitas a la plataforma de Biblioteca Digital, el detalle es

acceso por IP´s y número de visitas. Google Analitycs es un sistema que se descarga a

partir de una suscripción y se coloca el script en el sitio web que se desea evaluar.

Piwik es un sistema web que se descarga y aloja en servidor. Este sistema es Open

Source y permite conocer, al igual que Google Analytics los accesos o visitas a la

plataforma de Biblioteca Digital. La diferencia es que con Piwik se puede configurar para

conocer el detalle de accesos por cada uno de los módulos que componen la plataforma

de la Biblioteca Digital, sin embargo no podemos conocer el detalle de quién está haciendo

uso de los recursos electrónicos de información, ni si está descargando algún título de

revista en particular.

Es importante enfatizar que los accesos, entradas o visitas hacen referencia y se

contabilizan cada vez que un usuario hace click sobre alguno de los módulos de la

Biblioteca Digital.

InfoIntelligen es una herramienta especializada para Bibliotecas, es parametrizable y

configurable a las necesidades de los usuarios finales (Dirección de Biblioteca).

Es una herramienta que tiene la capacidad de conexión automática a las fuentes de datos

ya sean internas o externas de la Biblioteca. Puede alimentarse de distintas fuentes de

datos, entre ellas la bitácora del Proxy o Sistema de Validación y vincular el Directorio

Page 13: Modelo para la recuperación de las estadísticas de uso de ... · análisis de datos por medio de herramientas de B.I. Participó en el Consejo Nacional de Ciencia y Tecnología

15/35

Activo o Base de Datos de los usuarios, del cual se desglosan accesos a los recursos

electrónicos de información, con el detalle de accesos por el perfil de los usuarios (carrera,

departamento, sede, ID, matrícula, cédula, tipo de usuario, etc). Debido a sus

características únicas de configuración puede suministrar reportes específicos

configurables a la Universidad.

Una de las principales potencialidades de InfoIntelligen es brindar a los usuarios

diferentes perspectivas a través de analizar datos asociados y no asociados. Con este

enfoque único, el análisis de datos es flexible. Los usuarios pueden navegar e interactuar

con los datos de cualquier manera, no están limitados a solamente seguir los caminos

predefinidos o utilizar los tableros de control o reportes pre configurados.

Características detalladas de InfoIntelligen:

I. Configuración de filtros de búsqueda de acuerdo a las necesidades de reportes

y análisis de datos que el usuario requiera.

II. Acceso Web, por medio de una URL y usuario y contraseña

III. Permite hacer múltiples cruces de búsqueda:

a. Accesos por recurso electrónico de información

b. Accesos por instituciones

c. Accesos por tipo de usuarios

d. Manejo de grupos y subgrupos:

i. Por región geográfica

ii. Por tipo de recurso electrónico

iii. Por tipo de institución

iv. Por programa académico

v. Por editoriales

vi. Por periodo de tiempo: año, semestre, mes, día, hora

IV. Análisis de datos: los usuarios pueden navegar, interactuar y analizar los datos

de diferentes formas, no están limitados a solamente reportes predefinidos.

Otras herramientas analizadas, aunque son herramientas especializadas en el tema de

Bibliotecas, no analizan los reportes COUNTER, ni hacen el análisis de los títulos de las

Page 14: Modelo para la recuperación de las estadísticas de uso de ... · análisis de datos por medio de herramientas de B.I. Participó en el Consejo Nacional de Ciencia y Tecnología

16/35

colecciones, lo cual para este caso de estudio son vitales, ya que requerimos conocer el

uso de los recursos electrónicos de información, relacionar los costos por descargas en

texto completo por título de revista, factor de impacto de las revistas consultadas, entre

otros. Los resultados de este análisis comparativo muestran que la herramienta más

conveniente para este estudio es InfoIntelligen ya que es la única herramienta que permite

conocer las necesidades, tendencias de los intereses de sus usuarios, estadísticas de uso

de los recursos electrónicos de información y movimientos detallados del catálogo OPAC.

Etapa 5.- Operación de InfoIntelligen

A continuación se expone el diagrama conceptual que utiliza InfoIntelligen para la

generación de indicadores de uso de las Bibliotecas:

Esquema 1: Diagrama conceptual de generación de Indicadores de uso de los recursos

electrónicos de información.

Data Mining

Archivos de colecciones

Log Proxy

LDAP, Directorio Activo, B.D. Usuarios

Estándar COUNTER

Homologación y estandarización de los datos

Conectividad Generación y análisis de indicadores de uso

InfoIntelligen

Page 15: Modelo para la recuperación de las estadísticas de uso de ... · análisis de datos por medio de herramientas de B.I. Participó en el Consejo Nacional de Ciencia y Tecnología

17/35

InfoIntelligen extrayendo y haciendo análisis de los datos del Sistema de Validación

o Proxy

InfoIntelligen se conecta directamente con la bitácora del sistema de validación, realiza el

análisis por sesión (cada login que hace un usuario o institución a un recurso) para

generar los reportes. Algunos de los reportes que se pueden recuperar de analizar la

bitácora de un sistema de validación son:

Accesos totales por recurso, institución, región, estado.

Uso por institución y/o grupos de instituciones filtrado por recurso y período de tiempo.

Entradas y tendencias a los recursos por unidad de tiempo.

Uso mensual por institución y por recurso.

Análisis de tendencias.

Top de los recursos más utilizados.

Los recursos menos utilizados.

Instituciones que tengan cero uso de los recursos electrónicos.

Top de instituciones que más utilizan los recursos electrónicos.

InfoIntelligen extrayendo y haciendo análisis de los reportes COUNTER

En el caso de los reportes COUNTER, se diseñó una estrategia para la recuperación o

extracción de estos reportes, de acuerdo a las siguientes condiciones:

i. Proveedores, Agregadores y/o editores que han asimilado COUNTER y SUSHI. La

conexión es automática por medio de la llave SUSHI.

ii. Proveedores, Agregadores y/o editores que han asimilado COUNTER, pero no SUSHI.

Se lleva el siguiente procedimiento:

a) Solicitar al proveedor las claves de administrador para ingresar a la plataforma del

proveedor y ejecutar la descarga manual de los reportes COUNTER.

Page 16: Modelo para la recuperación de las estadísticas de uso de ... · análisis de datos por medio de herramientas de B.I. Participó en el Consejo Nacional de Ciencia y Tecnología

18/35

b) Cargar los reportes a la plataforma que brinda InfoIntelligen, denominada “Módulo

de administración de reportes COUNTER”, la cual permite cargar los reportes en

formato Excel y se alojaran en una base de datos que será leída por InfoIntelligen

para su análisis.

Figura 1.- Módulo de Administración de reportes COUNTER. Carga masiva en web.

Page 17: Modelo para la recuperación de las estadísticas de uso de ... · análisis de datos por medio de herramientas de B.I. Participó en el Consejo Nacional de Ciencia y Tecnología

19/35

A continuación se presenta el esquema de la situación que se presenta con los

proveedores en la actualidad ante el tema de SUHI & COUNTER:

Esquema 2: Esquema de la extracción de los reportes COUNTER

Etapa 6.- Análisis y resultados

Se utilizó InfoIntelligen para generar los indicadores que se definieron en la Etapa 2. En

este caso todos se relacionan con el tema de uso de los recursos electrónicos de

información y justificación de presupuesto asignado para los mismos.

¿Cuentan con la iniciativa COUNTER?

Proveedores/ agregadores

y/o editores

Sí No

InfoIntelligen, se conecta, extrae los datos de

cualquiera de los dos casos.

Se solicita al proveedores/ agregadores y/o editores que estandarice un reporte y que lo cargue en el módulo de administración de reportes COUNTER.

Conexión automática por medio de la llave de SUSHI, el cual sirve de cosechador de los datos. Por default todos los proveedores que cuentan con COUNTER, tienen SUSHI.

Page 18: Modelo para la recuperación de las estadísticas de uso de ... · análisis de datos por medio de herramientas de B.I. Participó en el Consejo Nacional de Ciencia y Tecnología

20/35

Caso de estudio 1.- Biblioteca Digital con 420,099 ejemplares, compuesta de: 72 bases

de datos indizadas con 170,000 títulos distintos con texto completo, libros y revistas en

formato electrónico.

Algunas características de la Plataforma de la Biblioteca Digital del caso de estudio 1 son:

Cuentan con sistema de validación: EZ-Proxy.

Validan a los usuarios dentro y fuera del campus.

Cuentan con la relación de alumnos inscritos por carrera.

Los resultados que se obtuvieron de hacer análisis con InfoIntelligen en el caso de estudio

1 se muestran a continuación:

Indicador.- Uso de las Bases de datos

El primer análisis que se realiza es identificar las bases de datos que más se utilizan y las

que menos se utilizan. Esta información muestra los dos extremos del aprovechamiento

que le da la comunidad a los recursos electrónicos de información que brinda la Biblioteca

a la comunidad.

Figura 1. Accesos totales por recurso. Los mayores y menores utilizados por los usuarios

Page 19: Modelo para la recuperación de las estadísticas de uso de ... · análisis de datos por medio de herramientas de B.I. Participó en el Consejo Nacional de Ciencia y Tecnología

21/35

Este primer análisis es una estadística muy general, que en la actualidad la Biblioteca ya está

obteniendo con fuentes externas (solicitadas al proveedor). Con la finalidad de justificar la

inversión que se hace al suscribir y renovar los recursos electrónicos de información, se

generó un indicador que relacione el uso por base de datos con información cualitativa,

identificando quiénes son los usuarios con mayor consulta, de qué carreras, departamento e

inclusive qué tipo de usuario son.

La Figura 2 hace referencia a un cruce de información, que permite al caso de estudio 1,

justificar por carrera o departamento la inversión de los recursos electrónicos.

Figura 2. Accesos por carrera, departamento, sede, tipo de usuario

Conocer los accesos con un desglose detallado, por carrera, departamento tipo de sede, deja

ver los puntos de principal enfoque y los objetivos primordiales para capacitar y exhortar para

el Uso de los recursos electrónicos de información. Este tipo de indicadores permite crear una

alianza Biblioteca-Académico- Usuario y trabajar en conjunto para el aprovechamiento de los

recursos contratados.

Page 20: Modelo para la recuperación de las estadísticas de uso de ... · análisis de datos por medio de herramientas de B.I. Participó en el Consejo Nacional de Ciencia y Tecnología

22/35

Indicador.- Descargas en texto completo por editor-revista

Con los datos extraídos de los reportes COUNTER, se identificaron las descargas que se

hicieron en texto completo de un agregador, siguiendo la lógica de agregador-editor-

revista-descarga de título de revista. En la figura 3, se muestran los textos completos

descargados anualmente.

Figura 3. Total de textos completos descargados por editor por año.

En este caso de estudio se sometió a análisis un agregador, del cual se pudieron analizar

datos de los reportes COUNTER, que detallan la descarga por título de revista y hacer un

empate con las búsquedas y sesiones que hacen los usuarios de la Biblioteca, ya que no

toda búsqueda termina en descarga de texto completo.

Page 21: Modelo para la recuperación de las estadísticas de uso de ... · análisis de datos por medio de herramientas de B.I. Participó en el Consejo Nacional de Ciencia y Tecnología

23/35

Figura 4. Detalle a nivel de título de revista descargado en texto completo por año y mes,

con posibilidad de filtrar por revista y/o editorial.

Indicador.- Total de sesiones y búsquedas por base de datos

En la figura 5 se observa el análisis de los datos de los reportes COUNTER donde se

muestran el total de sesiones y búsquedas por base de datos. La diferencia entre una

búsqueda y una sesión se marca en la descarga de texto completo, una sesión se

completa cuando un usuario hace la descarga del texto completo, de otra forma sin

descarga, la acción queda en una búsqueda.

Los resultados observados después de analizar los reportes COUNTER son que del total

de búsquedas más sesiones. Las búsquedas corresponden al 80% del total, de ahí la

importancia de hacer la separación de las búsquedas y las sesiones, de otra forma el

indicador puede darnos información incorrecta.

Page 22: Modelo para la recuperación de las estadísticas de uso de ... · análisis de datos por medio de herramientas de B.I. Participó en el Consejo Nacional de Ciencia y Tecnología

24/35

Figura 5.- Total de sesiones y búsquedas por base de datos

Indicador.- Relación entre usuarios potenciales y reales filtrados por recurso, institución

o carrera

Para poder generar este indicador se requiere de datos que se generan en Servicios

Escolares, donde se lleva un control de la cantidad de alumnos que se inscriben por año,

semestre, por carrera o programa académico, denominados como “Usuarios Potenciales”.

Esta información muestra en la Figura 6 relacionando usuarios potenciales contra reales.

Este indicador hace evidente las carreras que más utilizan los recursos electrónicos de

información y las carreras a las cuales debemos enfocarnos para promover el uso los

recursos brindados por la Biblioteca.

Page 23: Modelo para la recuperación de las estadísticas de uso de ... · análisis de datos por medio de herramientas de B.I. Participó en el Consejo Nacional de Ciencia y Tecnología

25/35

Figura 6.- Relación entre usuarios potenciales y reales filtrados por recurso, institución o

carrera

Los resultados obtenidos en la relación de usuarios potenciales vs reales ayudaron a

generar un porcentaje de uso por carrera, el cual se utilizó para la definición de metas de

uso por carrera. Se utilizó un semáforo de aprovechamiento de los recursos, donde las

carreras que tienen un porcentaje de uso del 0-50 % están dentro del color rojo, mostrando

las carreras de las que hay que preocuparse. Inclusive se presentaron estos resultados

ante los decanos o jefes de las carreras y se expuso la preocupación de que los usuarios

no están utilizando los recursos contratados. Se diseñaron cursos de capacitación de las

plataformas de los recursos electrónicos de información, siendo las primeras invitadas las

carreras que cayeron dentro del color rojo.

En el color amarillo se encuentran las carreras que oscilan entre el 50-70 % de uso. Con

estas carreras se estableció una campaña de difusión: carteles, campañas de correo

electrónico. El caso de las carreras que se encuentran en color verde son las del

Page 24: Modelo para la recuperación de las estadísticas de uso de ... · análisis de datos por medio de herramientas de B.I. Participó en el Consejo Nacional de Ciencia y Tecnología

26/35

porcentaje del 70-100 % pocas carreras caen en este color. Se observa que son los

usuarios de posgrado que utilizan en mayor porcentaje las bases de datos.

Indicador.- Accesos a detalle, por usuario, tipo de usuario

Utilizando el directorio activo del caso de estudio 1, se pudo conocer el detalle de quién

accede, a qué recurso, desde que ubicación (dentro o fuera del campus), incluso desde

que dirección IP.

Figura 7.- Nivel de detalle por usuario

En este caso de estudio, los resultados generados del análisis de la bitácora del Proxy +

Directorio Activo + Base de datos de usuarios inscritos, permiten obtener diversos

indicadores, que apoyan la toma de decisiones sobre qué recursos electrónicos de

información renovar y con cuáles gestionar una estrategia de promoción y capacitación

Page 25: Modelo para la recuperación de las estadísticas de uso de ... · análisis de datos por medio de herramientas de B.I. Participó en el Consejo Nacional de Ciencia y Tecnología

27/35

para los usuarios. No se encontraron anomalías de abuso de acceso a las bases de datos,

los porcentajes de uso con respecto al total son de menos del 1% por alumno.

Caso de estudio 2. Biblioteca Digital para 500 Instituciones de Educación Superior:

cuentan con 30 recursos electrónicos de información contratados que incluye: Plataforma de

ebooks, Bases de datos de Revistas Científicas y Catalogo OPAC.

Algunas características de la Plataforma de la Biblioteca del caso de estudio 2

Cuentan con sistema de validación EZ-Proxy

Todos los usuarios que quieren acceder a la Biblioteca Digital, pasan por una única

validación que les permite consultar todos los recursos dentro de la Plataforma de

Biblioteca Digital.

Cuentan con una plataforma de administración de usuarios, donde el usuario

genera su cuenta por medio del llenado de un formulario electrónico. La Plataforma

de administración de usuarios guarda la información de los usuarios en una

bitácora o base de datos de usuarios.

Indicador.- Accesos totales a los recursos electrónicos por estado, institución, servicio,

tipo de usuario y carrera

Figura 8. Accesos por carrera, departamento, sede, tipo de usuario

Page 26: Modelo para la recuperación de las estadísticas de uso de ... · análisis de datos por medio de herramientas de B.I. Participó en el Consejo Nacional de Ciencia y Tecnología

28/35

Indicador.- Análisis de colecciones

A continuación se muestra el traslape de títulos entre las colecciones electrónicas

contratadas. En este gráfico se puede observar la importancia de hacer un análisis

detallado del contenido de las colecciones, ya que pueden existir títulos repetidos entre las

plataformas Open Access y Bases de datos por suscripción. Se pudieron identificar la

cantidad de títulos repetidos entre dos colecciones y los títulos repetidos.

Figura 9. Traslape entre colecciones

Aunque se utilizaron los archivos que el proveedor proporcionó como los más actualizados,

se encontró que algunos de los proveedores, ni siquiera tienen actualizados los archivos

de títulos que contienen sus colecciones, lo cual es un problema al hacer análisis de

colecciones a nivel de título.

Aunque se hizo el traslape de colecciones, hay un tema importante que resaltar: en el caso

de revistas habría que conocer los tiempos de embargo, las ediciones y volúmenes, ya que

el estudio de análisis de colección debe ser mucho más fino que una coincidencia entre

títulos.

En el caso del indicador: análisis de colecciones, se identificaron traslape de títulos entre

una colección Open Acces y una colección contratada, se pudo conocer el detalle de

cantidad de títulos traslapados, que títulos son los que se están traslapando y con esta

Page 27: Modelo para la recuperación de las estadísticas de uso de ... · análisis de datos por medio de herramientas de B.I. Participó en el Consejo Nacional de Ciencia y Tecnología

29/35

información la Biblioteca del caso de estudio 2 tuvo elementos suficientes para negociar

con el proveedor la renovación a menor costo, con un tema de traslape de títulos.

Indicador.- Entradas y tendencias a los recursos por unidad de tiempo

La Figura 10 muestra las tendencias de uso de los recursos electrónicos de información, se

observa una proyección del uso que se tendrá al termino del año, lo que permite trabajar

en una planeación anticipada de contratación, renovación de los recursos y estrategias que

anticipen el escenario de una falta de uso de los recursos. Además de un plan para la

implementación de cursos de capacitación a los usuarios que menos utilizan los recursos

que ofrece la Biblioteca.

Figura 10.- Entradas y tendencias a los recursos por unidad de tiempo

Page 28: Modelo para la recuperación de las estadísticas de uso de ... · análisis de datos por medio de herramientas de B.I. Participó en el Consejo Nacional de Ciencia y Tecnología

30/35

Conclusiones

Se puede concluir que la generación de indicadores de uso de los recursos electrónicos de

información permite a las Bibliotecas conocer el comportamiento de los usuarios y generar

reportes con información estratégica que nos lleven a conocer si hay impacto en la

formación académica de los usuarios potenciales o no, además detonan acciones de

mejora continua. Los indicadores de uso de los recursos electrónicos generados para los

dos casos de estudio presentados en este trabajo brindaron a la Biblioteca información

precisa y oportuna para una adecuada inversión en recursos electrónicos, les permitió

clarificar el proceso de toma de decisiones con respecto a:

Uso eficiente de los recursos

Potenciar patrocinios

Alianzas con los proveedores

Compras por medio de consorcio

Hay factores críticos de éxito al implementar este tipo de procesos. Los principales son: Conexión al servidor proxy.

Adecuada configuración del proxy.

Definir adecuadamente los indicadores requeridos.

Estatus de los proveedores ante la iniciativa COUNTER.

Validación de usuarios dentro de la institución.

Los indicadores generados en los casos de estudio dieron elementos de retroalimentación

a la académica sobre la utilización de los recursos, además de establecer estrategias que

incrementen y mejoren la selección de los recursos de información. El conocer el detalle a

nivel de tipo de usuario, permite ver una realidad en el aprovechamiento de los recursos

electrónicos de información, se encontró que los académicos son usuarios no tan

frecuentes, lo cual es preocupante, pero teniendo conocimiento de esto, le permite a la

Dirección de Biblioteca definir una estrategia en cascada: capacitar a los maestros y

hacerlos conscientes de que los principales promotores de la utilización de los recursos

deben ser ellos, ya que la interacción con la comunidad de estudiantes es diaria.

Page 29: Modelo para la recuperación de las estadísticas de uso de ... · análisis de datos por medio de herramientas de B.I. Participó en el Consejo Nacional de Ciencia y Tecnología

31/35

La validación de los usuarios tanto dentro como fuera del campus Universitario es muy

importante, ya que de otra forma hay un sesgo en los datos que se alojan en la bitácora del

Proxy.

En el tema de las herramientas tecnológicas para estadísticas de uso, se requiere de una

evaluación basada en la necesidad que se quiere cubrir. Se debe tomar en cuenta que la

herramienta debe ayudar a la recopilación, generación y análisis de datos, que permita

disminuir el tiempo de trabajo en el proceso de compilación, la elaboración de reportes

para mejorar la atención de los usuarios.

Bibliografía

[1] European Comission, Library Performande indicators and library management tools, Office for Official Publications of the European Communities, Luxembourg, Suzanne Ward, John Sumsion, David Fuegi, Ian Bloor, 1995. [2] SEDIC, Guía para la aplicación de la norma ISO 9000 a bibliotecas y servicios de información y documentación, Madrid, 1998. [3] International Federation of Library Associations and Institutions (IFLA). Directrices Internacionales para la medición del rendimiento en las Bibliotecas Universitarias, IFLA, 1998. [4] Joint Funding Councils, The effective academic library: a framework for evaluating the performance of UK academic libraries, Bristol: HEFCE Publications, 1995. [5] REBIUN (Red Española de Bibliotecas Universitarias), Informe estadístico anual de las bibliotecas universitarias y científicas españolas, 1997. Castellón: Biblioteca de la Universitat Jaume I, 1998. [6] ISO 11660. Information and Documentation-Librery performande indocators. Gevene: ISO, 1998. [7] UNE-ISO 2789, Información y documentación. Estadísticas internacionales de bibliotecas, 2014. [8] Norma Española UNE 50137 Indicadores de rendimiento bibliotecario, 2005.

[9] Indicadores de Gestión Bibliotecaria emitido por el COBUN, Deposito Legal en la biblioteca Nacional del Perú, 2008.

Page 30: Modelo para la recuperación de las estadísticas de uso de ... · análisis de datos por medio de herramientas de B.I. Participó en el Consejo Nacional de Ciencia y Tecnología

32/35

[10] Claves para el éxito: indicadores de rendimiento para bibliotecas públicas. Barcelona:

Eumo Editorial, Ediciones Octaedro, 1995.

[11] COUNTER (Counting Online Usage of Networked Electronic Resources),

http://www.projectcounter.org/.

[12] NICHOLSON, Scott. and STANTON, J., Data mining for management decisions in corporate, special, digital, and traditional libraries. In Nemati, H. & Barko, C., 2003.

[13] Protocolo SUSHI (Standardized Usage Statistics Harvesting Initiative), http://www.niso.org/workrooms/sushi.