plataforma para el análisis de la opinión de los consumidores y ciudadanos

33
PLATAFORMA PARA EL ANÁLISIS DE LA OPINIÓN DE LOS CONSUMIDORES Y CIUDADANOS Subprograma INNPACTO Ministerio de Economía y Competitividad E1.1 Casos de uso y requerimientos del sistema Fecha de la entrega del entregable: 30/09/2011 Fecha real del envío del entregable: 31/12/2011 Comienzo del proyecto: 01/07/2011 Duración: 24 meses Institución responsable de este entregable: Agoranet

Upload: josymar-mayhua-naveros

Post on 14-Apr-2017

152 views

Category:

Technology


0 download

TRANSCRIPT

PLATAFORMA PARA EL ANÁLISIS DE LA OPINIÓN DE LOS CONSUMIDORES Y CIUDADANOS

Subprograma INNPACTO

Ministerio de Economía y Competitividad

E1.1 Casos de uso y requerimientos del sistema

Fecha de la entrega del entregable: 30/09/2011

Fecha real del envío del entregable: 31/12/2011

Comienzo del proyecto: 01/07/2011 Duración: 24 meses

Institución responsable de este entregable: Agoranet

Índice i

Contents

1 Descripción del entregable.................................................................................................... 3

2 Catálogo de usuarios ............................................................................................................. 4

2.1 Definición de usuarios ................................................................................................... 4

2.1.1 Administrador global del sistema .......................................................................... 4

2.1.2 Administrador de la empresa ................................................................................ 4

2.1.3 Usuario/cliente final .............................................................................................. 4

3 Catálogo de casos de uso ...................................................................................................... 5

3.1 Casos de uso de la capa de adquisición ......................................................................... 5

3.1.1 CS-AD-01: Gestión de políticas y reglas de acceso a contenidos Web .................. 5

3.1.2 CS-AD-02: Establecimiento de las preferencias de gestión de cluster .................. 6

3.1.3 CS-AD-03: Gestión de almacenamiento de los datos ............................................ 7

3.1.4 CS-AD-04: Gestión y control de usuarios ............................................................... 7

3.2 Casos de uso de la capa de análisis ............................................................................... 8

3.2.1 CS-AN-01: Modificación de parámetros de análisis de texto ................................ 8

3.2.2 CS-AN-02: Modificación de parámetros de análisis de imagen ............................. 9

3.2.3 CS-AN-03: Modificación de parámetros de análisis de video.............................. 10

3.2.4 CS-AN-04: Modificación de parámetros de análisis de audio ............................. 10

3.2.5 CS-AN-05: Modificación de criterios de valoración ............................................. 11

3.3 Casos de uso de la capa de visualización e interacción ............................................... 11

3.3.1 CS-VI-01: Consulta de sentimiento sobre marca o producto .............................. 11

3.3.2 CS-VI-0: 2Interacción con la interfaz y petición de nueva consulta ..................... 12

3.3.3 CS-VI-03: Incorporación de resultados de otro producto .................................... 13

3.3.4 CS-VI-04: Obtención de indicadores para ayuda a la toma de decisiones .......... 14

3.3.5 CS-VI-05: Creación de un nuevo tipo de perfil de consulta ................................. 14

4 Catálogo de requisitos del sistema ..................................................................................... 16

4.1 Requisitos funcionales (RF) y no funcionales (RNF) ................................................... 16

4.2 Requisitos funcionales específicos .............................................................................. 20

4.2.1 Adquisición de contenido .................................................................................... 21

4.2.2 Análisis lingüístico ............................................................................................... 23

4.2.3 Análisis de imágenes ........................................................................................... 25

Índice ii

4.2.4 Análisis de video .................................................................................................. 26

4.2.5 Análisis de audio .................................................................................................. 27

4.2.6 Visualización analítica ......................................................................................... 28

Índice iii

Índice de figuras

Figura 3.1 Caso de uso CS-AD-01. ................................................................................................. 5

Figura 3.2 Caso de uso CS-AD-02. ................................................................................................. 6

Figura 3.3 Diagrama caso de uso CS-AD-03. ................................................................................. 7

Figura 3.4 Diagrama de casos de uso CS-AD-04. ........................................................................... 8

Figura 3.5 Diagrama de casos de uso CS-AN-01. .......................................................................... 9

Figura 3.6 Diagrama de casos de uso CS-AN-02. .......................................................................... 9

Figura 3.7 Diagrama de caso de uso CS-AN-03. .......................................................................... 10

Figura 3.8 Diagrama de caso de uso CS-AN-04. .......................................................................... 11

Figura 3.9 Caso de uso de consulta de sentimiento. .................................................................. 12

Figura 3.10 Diagrama de secuencias del caso de usoCS-VI-02. .................................................. 13

Figura 3.11 Diagrama de secuencias asociado al caso de uso CS-VI-03. .................................... 14

Figura 3.12 Diagrama de caso de uso CS-VI-04. .......................................................................... 14

Figura 3.13 Diagrama de caso de uso CS-VI-05. .......................................................................... 15

E1.1 Casos de uso y requerimientos del sistema 1

Resumen del entregable

Este entregable describe los casos de uso y requerimientos funcionales del proyecto. En primer

lugar, se describen los distintos actores que participan en el proyecto: el administrador global

del sistema, que se encarga del mantenimiento y gestión de la plataforma ePOCA

(configuración, puesta a punto, mantenimiento); el administrador de la empresa, que define

los parámetros de búsqueda asociados para obtener una opinión; y el usuario o cliente final,

que interpreta los resultados de la plataforma.

En segundo lugar, se detallan los casos de uso del proyecto, que se han dividido siguiendo la

estructura de tres grandes capas de la arquitectura del proyecto ePOCA (capa de adquisición,

capa de análisis y capa de visualización e interacción).

Capa de adquisición

Esta capa es la encargada de rastrear la Web para la adquisición de contenidos y de

almacenarlos temporalmente hasta que sean analizados. Entre los casos de uso asociados a

esta capa, pueden mencionarse las acciones y funcionalidades necesarias para establecer las

políticas y reglas para la adquisición de contenidos Web, las acciones y funcionalidades

necesarias para el correcto funcionamiento del clúster y su mantenimiento, las funcionalidades

relacionadas con el almacenamiento y gestión de todos los datos manejados dentro de la

plataforma ePOCA, y el control del sistema de seguridad y acceso a todas las funcionalidades

de la plataforma ePOCA.

Capa de análisis

Esta capa es la encargada de realizar los diferentes análisis sobre los datos previamente

adquiridos por la capa de adquisición. Los casos de uso asociados incluirán la configuración de

algunos parámetros específicos del módulo de procesamiento de texto, la modificación de

algunos parámetros y variables del módulo de imágenes en función de las necesidades

específicas de las consultas o debido a incidencias observadas durante el funcionamiento del

sistema, la modificación de los parámetros de la técnica de secuenciación utilizada

directamente relacionada con el número de frames en función del tiempo de respuesta y la

carga de los ordenadores del sistema, la modificación de los parámetros referentes al

algoritmo de extracción de audio a partir de los contenidos originales para su conversión a

texto y la modificación de los criterios de valoración utilizados para la ponderación de los

resultados intermedios.

Capa de visualización e interacción

Esta capa es la encargada de visualizar los resultados obtenidos en el análisis e interactuar con

el usuario final. Entre los casos de uso definidos, se pueden mencionar la búsqueda de

sentimiento sobre una marca o producto determinado a partir de una petición de consulta

bajo demanda sobre los dominios examinados, nombre de la marca o producto y tipo de

funcionalidad, la solicitud de una nueva visualización sobre la base de los resultados

mostrados, la forma de complementar una consulta con otra consulta similar de otros

productos o marcas para fines comparativos en términos de estudio de la competencia y en el

establecimiento de “rankings” de valoración, la obtención de indicadores básicos que

E1.1 Casos de uso y requerimientos del sistema 2

presenten un resumen de los resultados de la consulta para la toma de decisiones y la

modificación de perfiles para obtener nuevos resultados.

Finalmente, se detallan los diferentes requisitos de usuario asociados a los casos de uso. Estos

requisitos se presentan en formato tabla indicando su identificador, una breve descripción, su

prioridad alta/media/baja, y la relación con otros requisitos. Los requisitos se agrupan en tres

categorías:

Requisitos funcionales (RF) que representan la funcionalidad deseada por parte de la

plataforma.

Requisitos no funcionales (RNF) los cuales representan requisitos deseables de la

plataforma, pero que no se corresponden con ninguna funcionalidad específica sino

con el comportamiento general de la plataforma (p.e. escalabilidad del sistema).

Requisitos restrictivos (RRE) que describen restricciones generales que debe cumplir la

plataforma.

E1.1 Casos de uso y requerimientos del sistema 3

1 Descripción del entregable

En primer lugar, este entregable describe los distintos actores que participan en el proyecto,

así como los casos de uso y requerimientos funcionales del proyecto.

Listado de acrónimos

CS: Caso de uso

RF: Requisito Funcional

RNF: Requisito No Funcional

RRE: Requisito Restrictivo

URL: Uniform Resource Locator

Bots: Sinónimo de robots o en el caso de adquisición de contenidos de rastreador Web.

E1.1 Casos de uso y requerimientos del sistema 4

2 Catálogo de usuarios

2.1 DEFINICIÓN DE USUARIOS

Se han definido tres tipos de usuarios para el proyecto ePOCA, donde cada uno de ellos tiene

responsabilidades bien diferenciadas.

2.1.1 Administrador global del sistema

El administrador global del sistema es el encargado del mantenimiento y gestión de la

plataforma ePOCA. Se encarga de todos los aspectos relacionados con la definición de los

parámetros de configuración de la plataforma y su puesta a punto. Se considera que es una

persona especializada y con conocimientos avanzados de la plataforma.

2.1.2 Administrador de la empresa

De forma similar, el administrador de la empresa tiene un rol similar en la empresa con

funcionalidades más limitadas. Se encarga de definir los parámetros de búsqueda asociados a

marca, producto, URLs de sitios Web a incluir y otros parámetros relacionados con la

obtención de opinión. No debe tratarse de una persona experta en la plataforma, aunque debe

tener algún conocimiento sobre ella y conocer bien los requisitos deseados en cuanto a las

consultas de opiniones a realizar.

2.1.3 Usuario/cliente final

Se trata del usuario consumidor de los resultados proporcionados por ePOCA. En general, se

tratará de un usuario no especializado y sin conocimientos de la plataforma. Este usuario

conoce el entorno empresarial del producto/marca y por lo tanto, es capaz de interpretar los

resultados presentados e interactuar con ellos para mejorar el conocimiento de la opinión del

entorno bajo estudio.

Tabla 2.1 Funcionalidades por cada tipo de usuario.

Configuración

ePOCA

Gestión

adquisición

Gestión

consultas

Acceso

resultados

Gestión

perfiles

Administrador

global ● ● ● ●

Administrador

empresa ● ●

Usuario final ●

E1.1 Casos de uso y requerimientos del sistema 5

3 Catálogo de casos de uso

Los casos de uso se han dividido siguiendo la estructura de tres grandes capas de la

arquitectura del proyecto ePOCA (capa de adquisición, capa de análisis y capa de visualización

e interacción). Este documento únicamente refleja la interacción de los diferentes usuarios con

las funcionalidades accesibles para cada uno de ellos, ya que la arquitectura y las

funcionalidades internas se detallan en los entregables E2.1 Arquitectura de sistema y E2.2

Componentes e interfaces del sistema.

3.1 CASOS DE USO DE LA CAPA DE ADQUISICIÓN

Esta capa es la encargada de rastrear la Web para la adquisición de contenidos y de

almacenarlos temporalmente hasta que sean analizados. Los casos de uso asociados a esta

capa son los siguientes:

3.1.1 CS-AD-01: Gestión de políticas y reglas de acceso a contenidos Web

Este caso de uso describe las acciones y funcionalidades necesarias para establecer las políticas

y reglas para la adquisición de contenidos Web, incluyendo la definición de la frecuencia de

actualización de los sitios Web a ser adquiridos, velocidad de acceso por dominios, número

máximo de rastreadores por dominio, etc. La modificación de estas políticas y reglas de acceso

permitirá la interacción y rastreo de los sitios Web sin causarles molestias o inconvenientes en

sus servicios. En caso contrario, se podría provocar una denegación de servicios y bloqueo a los

rastreadores.

Figura 3.1 Caso de uso CS-AD-01.

El único actor involucrado en esta tarea es el administrador global del sistema, quien

dispondrá de permisos suficientes para el establecimiento de políticas y reglas. Este actor

definirá y mantendrá la configuración óptima de la plataforma de acuerdo a las normas y

disposiciones legales en este tipo de servicios de rastreo.

Las funcionalidades asociadas a este caso de uso son las siguientes:

Establecimiento de frecuencia de actualización de páginas.

Establecimiento de número de “bots” (i.e. procesos de rastreo) por sitio/dominio.

E1.1 Casos de uso y requerimientos del sistema 6

Establecimiento de URLs a monitorizar.

Alta/baja/modificación de direcciones URL o dominios para la adquisición de

contenidos.

Este caso de uso se ejecutará únicamente en la configuración inicial de la plataforma, cuando

se efectúen modificaciones en el hardware/software, o cuando se requiera por algún tipo de

incidencia.

3.1.2 CS-AD-02: Establecimiento de las preferencias de gestión de cluster

Este caso de uso describe las acciones y funcionalidades necesarias para el correcto

funcionamiento del clúster y su mantenimiento. Clúster es un término que se refiere a un

conjunto de unidades de proceso (i.e. máquinas) que trabajan conjuntamente para ofrecer

mayores prestaciones, aunque puede tratarse también de una máquina sencilla, dado que la

plataforma será escalable. Dentro de las funcionalidades de este caso de uso, se incluyen la

definición de todos los parámetros de configuración del cluster relacionados con el número de

“bots” a ejecutar por cada máquina, su número total, máximo número de procesos,

localización de las diferentes máquinas y sus funcionalidades (análisis o adquisición), etc.

Administrador_Sistema

Gestión_Bots

Gestión_Procesos

Gestión_Computadore

s

Añadir_Computador

Gestión_Cluster

«uses»

«uses»

«uses»

«uses»

«uses»

«uses»

«uses»

«uses»

Figura 3.2 Caso de uso CS-AD-02.

El único actor involucrado en esta tarea es el administrador global que será el único con

permisos suficientes para la modificación de la configuración del cluster. El administrador de la

empresa sólo accederá a la funcionalidad necesaria para el mantenimiento, aunque no podrá

generar nuevas funcionalidades. La gestión del cluster a nivel interno se basará en la

arquitectura HADOOP.

Las funcionalidades que se realizan en este caso de uso son:

Establecimiento/modificación del número de “bots” totales a ejecutar.

Establecimiento de reglas de coordinación de “bots” distribuidos.

E1.1 Casos de uso y requerimientos del sistema 7

Establecimiento de máximo número de análisis por ordenador.

Establecimiento de perfiles de las distintas máquinas del sistema.

Añadir nuevas máquinas al sistema.

Este caso de uso se ejecutará únicamente durante la configuración de la plataforma, cuando se

efectúen modificaciones en el hardware/software, o por algún tipo de incidencia que así lo

requiera.

3.1.3 CS-AD-03: Gestión de almacenamiento de los datos

Este caso de uso representa las funcionalidades relacionadas con el almacenamiento y gestión

de todos los datos manejados dentro de la plataforma ePOCA. Estos datos se corresponden

tanto con la adquisición de contenidos como con los resultados obtenidos tras realizar los

diferentes análisis. Dichos datos deberán estar accesibles en todo momento para su uso y se

proporcionarán una serie de funcionalidades que permitan su correcta gestión para tenerlos

accesibles y seguros.

Administrador_Sistema

Gestión_Backup

«uses»

Gestión_Repositorio

s

«uses»

Gestión_BBDD

«uses»

«uses»

Gestión_Cluster

«uses»

Figura 3.3 Diagrama caso de uso CS-AD-03.

El administrador global del sistema será el único actor que disponga de permisos sobre todas

estas funcionalidades asociadas a este caso de uso, que serán las siguientes:

Gestión de backup y almacenamiento temporal.

Gestión de repositorios.

3.1.4 CS-AD-04: Gestión y control de usuarios

Este módulo se encarga de controlar el sistema de seguridad y acceso a todas las

funcionalidades de la plataforma ePOCA. Permitirá la inclusión de nuevos roles de

clientes/usuarios para definir consultas específicas a la plataforma así como su baja y

modificación. Los tipos de usuarios que se utilizarán son tres:

Administrador del sistema ePOCA. Se encarga del control global del sistema ePOCA.

Tiene acceso a todas las funcionalidades tanto desde el punto de vista de usuario

como de la gestión del sistema. Este usuario pertenece a la empresa que mantiene el

sistema y ofrece los servicios de ePOCA.

E1.1 Casos de uso y requerimientos del sistema 8

Administrador de la empresa. Es el encargado de representar a la empresa frente a

cambios sustanciales en el perfil de las consultas asociadas a dicha institución. Tiene

acceso a funcionalidades referentes a la modificación de los parámetros de la consulta

solicitada y al acceso a resultados. Las modificaciones se notificarán al administrador

de ePOCA o de manera automática a través de funcionalidad específica del sistema.

Usuario final. Este perfil será meramente el consumidor de los resultados.

Administrador_Sistema

Alta_Usuario

Baja_Usuario

Modificación_Usuari

o

«uses»

«uses»

«uses»

Gestión_Sistema

«uses»

«uses»

«uses»

Gestión_BBDD

«uses»

Figura 3.4 Diagrama de casos de uso CS-AD-04.

Todas estas funcionalidades serán únicamente accesibles por el administrador global del

sistema. En cuanto a las funcionalidades a realizar en este caso de uso, se engloban en los

siguientes:

Alta/baja/modificación de usuarios/roles para el acceso al sistema ePOCA.

Modificación de permisos de usuarios/roles.

Establecimiento de control de acceso a los datos por perfiles/roles de usuario.

3.2 CASOS DE USO DE LA CAPA DE ANÁLISIS

Esta capa es la encargada de realizar los diferentes análisis sobre los datos previamente

adquiridos por la capa de adquisición. Los casos de uso asociados a esta capa son los

siguientes.

3.2.1 CS-AN-01: Modificación de parámetros de análisis de texto

El módulo de análisis de texto de la plataforma ePOCA lleva asociado algunos parámetros

configurables que pueden depender del tipo de consulta a realizar. Este caso de uso permitirá

configurar dichos parámetros específicos.

E1.1 Casos de uso y requerimientos del sistema 9

Administrador_Sistema

Gestión_Diccionario

s

Selección_Parseador

Modificación_Param.

Análisis

«uses»

«uses»

«uses»

«uses»

Análisis_Texto

«uses»

«uses»

Figura 3.5 Diagrama de casos de uso CS-AN-01.

Excepto en casos excepcionales, todas estas funcionalidades estarán únicamente accesibles

para el administrador global del sistema. Entre otras funcionalidades, se pueden destacar las

siguientes:

Gestión de léxicos.

Selección de tipo de parseador.

Modificación de los parámetros de análisis (términos, palabras adyacentes, etc.).

3.2.2 CS-AN-02: Modificación de parámetros de análisis de imagen

De forma similar al módulo de texto, el módulo de imagen de la plataforma ePOCA depende

de varios parámetros y variables necesarios para su correcto funcionamiento dependiendo de

los resultados deseados. Este caso de uso contempla la modificación de estos parámetros en

función de las necesidades específicas de las consultas o debido a incidencias observadas

durante el funcionamiento del sistema (p.e. tiempos de respuesta muy lentos).

Administrador_Sistema

Seleccion_Mod.

BBD_Referencia

Modificación_Param.

Análisis

Análisis _Imagen

«uses»

«uses»

«uses»

«uses»

Figura 3.6 Diagrama de casos de uso CS-AN-02.

E1.1 Casos de uso y requerimientos del sistema 10

Salvo en casos especiales, todas estas funcionalidades serán únicamente accesibles por el

administrador global del sistema. Las principales funcionalidades de este caso de uso son los

siguientes:

Selección/Modificación de bases de datos de imágenes de referencia.

Modificación de parámetros de algoritmos.

3.2.3 CS-AN-03: Modificación de parámetros de análisis de video

El análisis de video de la plataforma ePOCA contempla principalmente el caso de su

secuenciación para la posterior transferencia de las imágenes más representativas al módulo

de análisis de imagen. Este caso de uso contempla la modificación de los parámetros de la

técnica de secuenciación utilizada directamente relacionada con el número de frames

obtenidos para su posterior análisis. Este parámetro se ajustará en función del tiempo de

respuesta y la carga de los ordenadores del sistema.

Administrador_Sistema

Establecimiento _NºF

rames

Modificación _Param.

Algo.

Análisis_Video

«uses»

«uses» «uses»

«uses»

Figura 3.7 Diagrama de caso de uso CS-AN-03.

En general, todas las funcionalidades asociadas a este caso de uso serán únicamente accesibles

por el administrador global del sistema. Las funcionalidades asociadas a este caso de uso son

las siguientes:

Establecimiento de número de frames a analizar por unidad de tiempo.

Modificación de los parámetros del algoritmo.

3.2.4 CS-AN-04: Modificación de parámetros de análisis de audio

Los datos de audio pueden provenir de videos o de ficheros audio para ser posteriormente

analizados por el módulo de análisis de texto. Este caso de uso representa la modificación de

los parámetros referentes al algoritmo de extracción de audio a partir de los contenidos

originales.

E1.1 Casos de uso y requerimientos del sistema 11

Administrador_Sistema

Modificación_Param.

Audio

Modificación_Param.

Anal.Texto

Análisis_Audio

Análisis_Texto

«uses»

«uses»

«uses»

«uses»

«uses»

Figura 3.8 Diagrama de caso de uso CS-AN-04.

En general, todas estas funcionalidades serán únicamente accesibles por el administrador

global del sistema. Las funcionalidades incluidas en este caso de uso son:

Modificación de los parámetros del algoritmo de audio.

Modificación de algoritmo de análisis de texto asociado.

Modificación del formato del texto transcrito.

3.2.5 CS-AN-05: Modificación de criterios de valoración

Este caso de uso refleja la modificación de los criterios de valoración utilizados para la

ponderación de los resultados intermedios. Este caso de uso sólo se ejecutará cuando así lo

requiera algún tipo de consulta específica o por mal funcionamiento de los criterios actuales.

Esta funcionalidad estará sólo accesible para el administrador global del sistema ePOCA.

Entre las funcionalidades de este caso de uso, se pueden mencionar las siguientes:

Aplicación de distintas técnicas de valoración según el diseño del parseador (e.g.

títulos, comentarios, etc.) de los parámetros del algoritmo de audio.

Conciliación entre las valoraciones de texto, audio, video e imágenes.

Priorización de términos y otros elementos de mayor importancia.

3.3 CASOS DE USO DE LA CAPA DE VISUALIZACIÓN E INTERACCIÓN

Esta capa es la encargada de visualizar los resultados obtenidos en el análisis e interactuar con

el usuario final. Los casos de uso asociados a esta capa son los siguientes.

3.3.1 CS-VI-01: Consulta de sentimiento sobre marca o producto

El usuario final podrá realizar una petición de consulta bajo demanda sobre los dominios

examinados, nombre de la marca o producto y tipo de funcionalidad. En este caso, la

funcionalidad asociada es la de la búsqueda de sentimiento sobre una marca o producto

determinado. Cabe resaltar que este mismo caso de uso puede incluir también otras

funcionalidades como la búsqueda de menciones de la marca o producto durante un periodo

de tiempo determinado. Estos otros casos de uso no están especificados en este documento

pero su diagrama será similar al mostrado en la Figura 3.9.

E1.1 Casos de uso y requerimientos del sistema 12

Usuario_Final

Petición de

consutla tendencia

«uses»

Valoración

Sentimiento

«uses»

Análisis Texto

Calibrado Imagen

«uses»

«uses»

Parseador Texto

Analizador de

lingüístico

«uses»

«uses»

Calibrado Imagen

AlgoritmoExtracción

«uses»

«uses»

Representación

Visual

«uses»

Interacción H-M«uses»

PETICIÓN Y VISUALIZACIÓN DE CONSULTA

EVOLUCIÓN SENTIMIENTO

Obtener DatosTexto(Concepto)

Obtener Datos de

Imagen(Concepto)

«uses»

«uses»

Figura 3.9 Caso de uso de consulta de sentimiento.

Este caso de uso y su funcionalidad asociada podrá ejecutarse por el usuario final y el

administrador de la empresa. Las funcionalidades asociadas a este caso de uso son:

Consulta de sentimiento asociada a un perfil en el sistema ePOCA.

Consulta de histórico de sentimientos.

Consulta de opinión sobre marca o producto.

Consulta de tendencias sobre marca o producto.

Consulta de variaciones de tendencia, etc.

3.3.2 CS-VI-02: Interacción con la interfaz y petición de nueva consulta

Este caso de uso muestra esta interacción donde el usuario final solicita una nueva

visualización en base a los resultados mostrados. La interacción persona-dispositivo en la

plataforma ePOCA va a permitir la interacción constante con los resultados, de modo que se

garantice una retroalimentación continua que ayude a un proceso de razonamiento lógico

guiado para mejorar el conocimiento sobre el contexto de la consulta realizada.

E1.1 Casos de uso y requerimientos del sistema 13

Usuario_Final Interfaz H/M Valoración_Sentimiento

Petición_Consulta(1)

Petición_Valoración(1)

Resultados_Valoración(1)

Visualización _Resultados(1)

Petición_Consulta(2)

Petición_Valoración(2)

Retroalimentación

Resultados_Valoración(2)

Visualización _Resultados(2)

Figura 3.10 Diagrama de secuencias del caso de usoCS-VI-02.

Este caso de uso podrá ser ejecutado por el usuario final y el administrador de la empresa.

3.3.3 CS-VI-03: Incorporación de resultados de otro producto

El proceso de visualización permitirá no sólo la realización de consultas, sino también el

tratamiento “inteligente” de las mismas. Este caso de uso muestra la forma de complementar

una consulta con otra consulta similar de otros productos o marcas para fines comparativos en

términos de estudio de la competencia y en el establecimiento de “rankings” de valoración. La

Figura 3.11 muestra el diagrama de secuencias de este caso de uso, incluyendo las consultas

sobre diferentes tipos de producto/marca con el índice A o B.

E1.1 Casos de uso y requerimientos del sistema 14

Usuario_Final Inter faz H/M Valoración_Sentimiento

Petición_Consulta_A

Petición_Valoración_A

Resultados_Valor ación_A

Visualización _Resultados _A

Petición_Consulta_B

Petición_Valoración_B

Retroalimentación

Resultados_Valoración_B

Visualización _Resultados _B

Figura 3.11 Diagrama de secuencias asociado al caso de uso CS-VI-03.

Este caso de uso y su funcionalidad asociada podrá ser ejecutado por el usuario final y el

administrador de la empresa.

3.3.4 CS-VI-04: Obtención de indicadores para ayuda a la toma de decisiones

Este caso de uso permitirá que el usuario final obtenga indicadores básicos que presenten un

resumen de los resultados de la consulta para la toma de decisiones.

Valoración_Sentimie

nto

Conocimiento_Expert

o

«uses»

«uses»

«uses»

Análisis_Texto_Imag

en_Video

«uses»

Gestión_BBDD_Conoci

miento

Modelado_Decision

«uses»

Top Package::Usuario_Final

Figura 3.12 Diagrama de caso de uso CS-VI-04.

Este caso de uso estará ejecutado por el usuario final y el administrador de la empresa.

3.3.5 CS-VI-05: Creación de un nuevo tipo de perfil de consulta

Cada consulta realizada por un usuario final está asociada a un perfil determinado. Estos

perfiles pueden modificarse para establecer nuevas configuraciones en la consulta y por tanto

E1.1 Casos de uso y requerimientos del sistema 15

obtener nuevos resultados (p.e. modificar las URLs monitorizadas). Este caso de uso permitirá

la modificación de perfiles para obtener nuevos resultados.

Top Package::Usuario_Final

Modificar_Perfil

«uses» Gestión_Sistema«uses»

Gestión_BBDD

«uses»

Crear_Consulta

«uses»

Gestion_Adquisición

«uses»

Figura 3.13 Diagrama de caso de uso CS-VI-05.

Este caso de uso y su funcionalidad asociada puede ser ejecutado por el administrador de la

empresa.

E1.1 Casos de uso y requerimientos del sistema 16

4 Catálogo de requisitos del sistema

Esta sección describe los diferentes requisitos de usuario asociados a los casos de uso. Estos

requisitos se presentan en formato tabla indicando su identificador, una breve descripción, su

prioridad alta/media/baja, y la relación con otros requisitos. Los requisitos se agrupan en tres

categorías:

Requisitos funcionales (RF) que representan la funcionalidad deseada por parte de la

plataforma.

Requisitos no funcionales (RNF) los cuales representan requisitos deseables de la

plataforma, pero que no se corresponden con ninguna funcionalidad específica sino

con el comportamiento general (p.e. escalabilidad del sistema).

Requisitos restrictivos (RRE), que describen restricciones generales que debe cumplir la

plataforma.

4.1 REQUISITOS FUNCIONALES (RF) Y NO FUNCIONALES (RNF)

ID RF-01

Descripción El administrador global podrá modificar las reglas de acceso a las

diferentes páginas web que se están monitorizando.

Prioridad Alta

Relación con otros

requisitos

ID RF-02

Descripción El administrador global podrá modificar las preferencias de gestión del

cluster.

Prioridad Media

Relación con otros

requisitos

ID RF-03

Descripción El administrador global podrá gestionar el almacenamiento de datos.

Prioridad Alta

Relación con otros

requisitos

ID RF-04

Descripción El sistema permitirá la gestión de diferentes roles para realizar

monitorizaciones personalizadas.

Prioridad Media

E1.1 Casos de uso y requerimientos del sistema 17

Relación con otros

requisitos

ID RF-05

Descripción La plataforma permitirá la creación y gestión de los usuarios.

Prioridad Alta

Relación con otros

requisitos

RF-04

ID RF-06

Descripción El administrador global podrá gestionar los parámetros del módulo de

análisis de texto.

Prioridad Media

Relación con otros

requisitos

ID RF-07

Descripción El administrador global podrá gestionar los parámetros del módulo de

análisis de imagen.

Prioridad Media

Relación con otros

requisitos

ID RF-08

Descripción El administrador global podrá gestionar los parámetros de análisis del

módulo de vídeo.

Prioridad Media

Relación con otros

requisitos

ID RF-09

Descripción El administrador global podrá gestionar los parámetros de análisis del

módulo de audio.

Prioridad Media

Relación con otros

requisitos

E1.1 Casos de uso y requerimientos del sistema 18

ID RF-10

Descripción El administrador global podrá realizar modificaciones sobre los criterios

de valoración.

Prioridad Media

Relación con otros

requisitos

ID RF-11

Descripción El usuario final y/o el administrador del sistema puede visualizar el

resultado de sentimiento sobre la marca o producto

Prioridad Alta

Relación con otros

requisitos

RF-06, RF-07, RF-08 y RF-09

ID RF-12

Descripción El usuario final y el administrador de la empresa pueden realizar

consultas para visualizar el resultado.

Prioridad Alta

Relación con otros

requisitos

RF-11

ID RF-13

Descripción El usuario final y el administrador de la empresa pueden incorporar

resultados de otro producto a la consulta que está visualizando.

Prioridad Media

Relación con otros

requisitos

RF gestión de productos o marcas

ID RF-14

Descripción El usuario final y el administrador de la empresa pueden obtener una

serie de indicadores en base a los datos recogidos.

Prioridad Media

Relación con otros

requisitos

RF-12

E1.1 Casos de uso y requerimientos del sistema 19

ID RF-15

Descripción El administrador de la empresa puede crear un nuevo tipo de consulta.

Prioridad Media

Relación con otros

requisitos

ID RNF-06

Descripción Sólo el administrador de la empresa podrá crear nuevas consultas.

Prioridad Media

Relación con otros

requisitos

ID RF-16

Descripción El administrador de la empresa puede gestionar diferentes productos o

marcas para realizar comparaciones.

Prioridad Media

Relación con otros

requisitos

ID RF-17

Descripción El administrador global podrá configurar el cluster de ordenadores

modificando sus parámetros de configuración.

Prioridad Media

Relación con otros

requisitos

ID RNF-01

Descripción La plataforma deberá ser escalable en cuanto a sus capacidades

hardware.

Prioridad Media

Relación con otros

requisitos

ID RRE-01

Descripción Sólo el administrador global podrá cambiar los parámetros referentes a

la configuración interna de la plataforma ePOCA.

E1.1 Casos de uso y requerimientos del sistema 20

Prioridad Alta

Relación con otros

requisitos

RF-01.

ID RNF-02

Descripción La plataforma se implementará utilizando estándares de Open Source

siempre que sea posible.

Prioridad Media

Relación con otros

requisitos

ID RNF-03

Descripción La plataforma se implementará siguiendo un paradigma de

programación orientada a objetos incluyendo documentación de las

clases.

Prioridad Media

Relación con otros

requisitos

ID RNF-04

Descripción La plataforma se limitará a realizar búsquedas de textos en 4 idiomas:

castellano, euskara, inglés y francés.

Prioridad Media

Relación con otros

requisitos

ID RNF-05

Descripción La plataforma debe ser compatible con diferentes bases de datos

usando estándares de acceso y consulta.

Prioridad Media

Relación con otros

requisitos

RF-03

4.2 REQUISITOS FUNCIONALES ESPECÍFICOS

Esta sección describe las distintas funcionalidades y características técnicas que se deben

implementar a alto nivel para alcanzar los objetivos tecnológicos del proyecto. Los requisitos

están ordenados sobre la base del área tecnológica al que pertenecen.

E1.1 Casos de uso y requerimientos del sistema 21

4.2.1 Adquisición de contenido

Titulo Componente de búsqueda en Web

ID AC-01

Descripción Implementación de un motor de búsqueda Web Open Source, que

manejará la búsqueda, rastreo y parseo de formatos comunes.

Prioridad Alta

Relación con otros

requisitos

Titulo Interfaces a Web API

ID AC-02

Descripción Componente extensible que proporcione acceso a portales Web 2.0

mediante Web APIs públicas.

Prioridad Media

Relación con otros

requisitos

Titulo Parseador de Twitter

ID AC-03

Descripción Agregador y parseador de Twitter capaz de captar mensajes con

HashTags específicos.

Prioridad Alta

Relación con otros

requisitos

Titulo Parseador de Microformatos

ID AC-04

Descripción Parseo de contenido albergado en Micro Formatos disponibles on-line

dentro de las páginas Web.

Prioridad Baja

Relación con otros

requisitos

Titulo Parseador de RSS/Atom

ID AC-05

Descripción Parseo y rastreo de contenido sindicado por RSS y Atom. Componente

E1.1 Casos de uso y requerimientos del sistema 22

integrado en el módulo de adquisición de contenido general.

Prioridad Media

Relación con otros

requisitos

Titulo Herramienta de generación de parseadores específicos

ID AC-06

Descripción Componente integrable en el navegador Web para el diseño

interactivo de parseadores de páginas Web y su asociación con reglas

de análisis y valoración de contenido.

Prioridad Alta

Relación con otros

requisitos

Titulo Parseador de Web genérico

ID AC-07

Descripción Parseador genérico capaz de realizar MIME Marshalling y la separación

de imágenes y textos de cualquier página Web.

Prioridad Alta

Relación con otros

requisitos

Titulo Control de política de rastreo y revisita

ID AC-08

Descripción Control de las políticas de revisita, latencia, profundidad de parseo, etc,

configurable mediante la plataforma general. Incluye la lista maestra

de fuentes a monitorizar

Prioridad Alta

Relación con otros

requisitos

Titulo Conjunto de interfaces basadas en Servicios Web

ID AC-08

Descripción Interfaces del módulos accesible mediante Servicios Web tipo WI-SOAP

para su integración en la plataforma general.

Prioridad Alta

Relación con otros

E1.1 Casos de uso y requerimientos del sistema 23

requisitos

Titulo Definición y control de consultas

ID AC-09

Descripción Componente de control de las consultas a realizar y fuentes a

monitorizar

Prioridad Alta

Relación con otros

requisitos

Titulo Base de Datos de control de configuración

ID AC-10

Descripción Base de datos donde se almacenan los datos de configuración y de las

monitorizaciones definidas por los usuarios que desempeñen un rol en

el que se establezcan parámetros de funcionamiento de la plataforma.

Prioridad Alta

Relación con otros

requisitos

Titulo Componente de conversión de caracteres y patrones sensible a

configuración específica de idioma, dialecto y región.

ID AC-11

Descripción Media

Prioridad Componente de detección de codificación de caracteres y su conversión

a Unicode para un tratamiento específico dentro de la plataforma.

También se deben tratar patrones de datos sensibles a locales.

Relación con otros

requisitos

4.2.2 Análisis lingüístico

Titulo Base de datos léxica multilingüe

ID LN-01

Descripción Base de datos léxica multilingüe (EN, FR, ES, EU) con anotaciones

léxicas. Recursos léxicos con un mínimo de 15.000 entradas para cada

idioma, de un dominio lingüístico general capaz de reflejar los

conceptos de los escenarios de aplicación del proyecto ePOCA.

Prioridad Alta

Relación con otros

E1.1 Casos de uso y requerimientos del sistema 24

requisitos

Titulo Lematizador

ID LN-02

Descripción Implementación de un lematizador de palabras para EU, ES, FR y EN.

Prioridad Alta

Relación con otros

requisitos

Titulo Asignación de categoría gramatical

ID LN-03

Descripción Implementación de un POS Tagger basado en métodos estadísticos

entrenados mediante corpus anotados en EN, FR, EU y ES.

Prioridad Alta

Relación con otros

requisitos

Titulo Procesamiento morfológico

ID LN-04

Descripción Reglas para el procesamiento de morfología, nominal y verbal, de

textos en EN, FR, ES y EU.

Prioridad Alta

Relación con otros

requisitos

Titulo Reconocimiento de sintagmas

ID LN-05

Descripción Chunking de texto y reconocimiento de sintagmas nominales y

verbales.

Prioridad Media

Relación con otros

requisitos

Titulo Relaciones semánticas

ID LN-06

Descripción Implementación de rasgos semánticos para vincular conceptos dentro

E1.1 Casos de uso y requerimientos del sistema 25

del léxico mediante sinonimia e hiperonimia.

Prioridad Media

Relación con otros

requisitos

Titulo Interfaces basadas en Servicios Web

ID LN-07

Descripción Conjunto de interfaces basadas en Servicios Web.

Prioridad Alta

Relación con otros

requisitos

Interfaces de los módulos accesibles mediante Servicios Web tipo WI-

SOAP para su integración en la plataforma general.

4.2.3 Análisis de imágenes

Titulo Pre-filtro y conversión

ID IM-01

Descripción Técnicas de filtrado y conversión a formato normalizado de las

imágenes adquiridas.

Prioridad Media

Relación con otros

requisitos

Titulo Base de datos de descriptores

ID IM-02

Descripción Base de datos que guarda los descriptores de las imágenes de

referencia subidas a la plataforma para su posterior comparación con

las imágenes adquiridas. Se debe incluir la asociación de palabras claves

(Visual Words) con las imágenes.

Prioridad Alta

Relación con otros

requisitos

Titulo Normalización de imágenes

ID IM-03

Descripción Reducción de ruido, escalado etc. de las imágenes antes de procesarlas

para asegurar que son del formato y calidad necesarios para efectuar

un análisis fiable.

Prioridad Media

E1.1 Casos de uso y requerimientos del sistema 26

Relación con otros

requisitos

Titulo Cálculo de descriptores

ID IM-04

Descripción Implantación del algoritmo SURF, acelerado por GPGPU y el algoritmo

de Fast Nearest Neighbor para detección de regiones de interés.

Prioridad Alta

Relación con otros

requisitos

Titulo Clusterización y matching

ID IM-05

Descripción Implementación de los algoritmos de comparación de características

entre imágenes mediante análisis de imágenes de referencia.

Prioridad Media

Relación con otros

requisitos

4.2.4 Análisis de video

Titulo Interfaces basadas en Servicios Web

ID VI-01

Descripción Conjunto de interfaces basadas en Servicios Web

Prioridad Alta

Relación con otros

requisitos

Interfaces de los módulos accesibles mediante Servicios Web tipo WI-

SOAP para su integración en la plataforma general.

Titulo Normalización de video

ID VI-02

Descripción Antes del análisis de video, será necesario tratar el contenido para

normalizarlo efectuando una reducción de ruido y estabilización de los

planos de color.

Prioridad Media

Relación con otros

requisitos

Titulo Detección de formatos, conversión y extracción de contenido

E1.1 Casos de uso y requerimientos del sistema 27

ID VI-03

Descripción Antes de procesar los videos, se convertirán de un formato original a un

formato único específico para su posterior tratamiento por parte del

sistema. Se aplicarán FFMpeg y MediInfo para tal fin.

Prioridad Alta

Relación con otros

requisitos

Titulo Detección de bordes de escenas

ID VI-04

Descripción Implementación de algoritmos de detección de cortes y transiciones

entre escenas para su marcado como segmentos lógicos de un video.

Prioridad Media

Relación con otros

requisitos

Titulo Detección del frame más representativo

ID VI-05

Descripción Algoritmo y técnicas de extracción de los frames de una escena de

video que sea contemplada como lo más representativa. Dichos frames

se procesarán posteriormente como imágenes.

Prioridad Media

Relación con otros

requisitos

4.2.5 Análisis de audio

Titulo Motor comercial de reconocimiento de Voz (ASR)

ID AU-01

Descripción Implementación de una interfaz para un motor comercial de

reconocimiento de voz, en este caso, Microsoft Speech Recognizer 8.1.

Prioridad Alta

Relación con otros

requisitos

Titulo Diarización de locutor

ID AU-02

Descripción Detección de prosodia y pausa en pista de voz que se puede interpretar

E1.1 Casos de uso y requerimientos del sistema 28

como puntación para la transcripción a texto (Pseudo puntuación).

Implementación de los modelos acústicos apropiados.

Prioridad Media

Relación con otros

requisitos

Titulo Seguimiento del locutor

ID AU-03

Descripción Detección de locutores y su seguimiento para distinguir entre los

distintos participantes de la conversación.

Prioridad Media

Relación con otros

requisitos

Titulo Transcripción y formateo de salida

ID AU-03

Descripción Componente de transcripción a texto de los elementos de audio

previamente analizados. Técnicas flexibles de formato y presentación

de los textos transcritos para su integración sencilla en la plataforma.

Prioridad Alta

Relación con otros

requisitos

Titulo Interfaces basadas en Servicios Web

ID AU-04

Descripción Conjunto de interfaces basadas en Servicios Web.

Prioridad Alta

Relación con otros

requisitos

Interfaces de los módulos accesibles mediante Servicios Web tipo WI-

SOAP para su integración en la plataforma general.

4.2.6 Visualización analítica

Titulo Homogenización de datos

ID VA-01

Descripción Es necesario implementar técnicas para poder homogenizar los

distintos tipos de datos analizados y evaluados por la plataforma para

crear conjuntos de datos adecuados para su posterior visualización.

Prioridad Alta

E1.1 Casos de uso y requerimientos del sistema 29

Relación con otros

requisitos

Titulo Inferencia de datos ausentes

ID VA-02

Descripción En el caso que un conjunto carezca de suficientes datos como para

permitir una correcta visualización o tratamiento de los datos, será

necesaria la inferencia de los datos que falten.

Prioridad Media

Relación con otros

requisitos

Titulo Implementación de modelos de visualización

ID VA-03

Descripción Diseñar e implementar modelos de visualización de datos pertinentes

para el dominio de aplicación de ePOCA.

Prioridad Alta

Relación con otros

requisitos

Titulo Integración de funcionalidad interactiva

ID VA-04

Descripción Integración de un modelo de interfaz que permita la interacción y el

análisis de los datos visualizados con la plataforma global.

Prioridad Media

Relación con otros

requisitos

Titulo Interfaces basadas en Servicios Web

ID VA-05

Descripción Conjunto de interfaces basadas en Servicios Web.

Prioridad Alta

Relación con otros

requisitos

Interfaces de los módulos accesibles mediante Servicios Web tipo WI-

SOAP para su integración en la plataforma general.