guía antconc 3.2.1

Post on 30-May-2015

9.014 Views

Category:

Education

4 Downloads

Preview:

Click to see full reader

DESCRIPTION

Guía presentación de la herramienta AntConc

TRANSCRIPT

Para ejecutar AntConc 3.2.1 sólo tienes que descargarte el archivo ejecutable de la página http://www.antlab.sci.waseda.ac.jp/antconc_index.html y, una vez guardado en tu ordenador, hacer doble clic sobre el icono.

“clic clic”

Esta es la ventana principal de AntConc.

Empezar a trabajar con AntConc:

• Lo primero que hemos de hacer es indicarle a AntConc dónde están los archivos de nuestro corpus. – File -> Open Dir…– File -> Open File(s)…

• AntConc puede leer archivos *.txt, *.html, *.htm y *xml. Para que pueda leer estos archivos ha de estar activa la opción correspondiente en los Global Settings.

Una vez abiertos los archivos o la carpeta donde está nuestro corpus, los archivos aparecen en el panel de navegación en la parte izquierda de la ventana.

Herramientas

AntConc dispone de siete herramientas:

• Concordance• Concordance Plot• File View• Clusters• Collocates• Word List• Keyword List

Puede accederse a ellas mediante las pestañas en laventana o con las teclas F1 a F7 del teclado.

Concordance

• Genera concordancias o KWIC (key word in context)

• Para generar concordancias: Introducir el término en la casilla de búsquedaSe puede indicar el número de caracteres que ha de

aparecer a cada lado del término (Search Window Size)

Especificar las opciones de búsqueda• Word: buscar palabras o fragmentos de palabras• Case: para especificar si se ha de tener en cuenta la

ortografía (case sensitive)• Regex: para utilizar expresiones regulares

Pinchar en el botón “Start”

La búsqueda puede detenerse en cualquier momento con el botón “Stop”

La búsqueda puede ordenarse:• 0 es el término que se ha buscado• 1R, 2R etc. y 1L 2L etc. son las palabras a derecha e

izquierda del término.• Pueden activarse diferentes niveles de búsqueda

Los términos son enlaces mediante los que se puede acceder al texto completo en la herramienta “File View”.

Hay una opción de búsqueda avanzada.

Número de caracteres a cada lado del término

Casilla de búsqueda

Número de concordancias

Archivo donde aparece el término

Barra de progreso

KWIC

Opciones de búsqueda

Opciones para ordenar

Para definir un grupo de términos de búsqueda.

Cada línea se trata como un término diferente.

Para definir palabras que han de aparecer en el contexto del término que se busca.

P.e. si se busca la palabra “estudiante” sólo si aparece junto a la palabra “universidad” al menos con 3 palabras a izquierda y derecha de separación, pondremos “estudiante” como Search Term, “universidad” como “Context Words” y en el Context Horizon From 3L To 3R.

Concordance Plot

• La herramienta Concordance Plot muestra las concordancias de una manera gráfica.

• Cada archivo está representado como un “código de barras”, en el que se indica en qué posición aparece al término que se ha buscado.

• Puede utilizarse para ver qué archivos incluyen el término y dónde suelen agruparse los términos.

Número de términos y tamaño del archivo (en caracteres)

Las líneas dentro de cada barra son enlaces al texto (File View)

Este archivo está muy relacionado con el término que hemos buscado.

File View

• El archivo original puede verse en cualquier momento en la herramienta File View.

• Con “Hit Location” se va saltando por las diferentes ocurrencias del término.

Para saltar entre las diferentes ocurrencias del término

Clusters• Sirve para generar una lista ordenada de “agrupaciones” alrededor

del término que se busca• Pueden ordenarse

– por frecuencia – por la primera o última palabra– por probabilidad (la probabilidad de que la primera palabra de la

agrupación preceda al resto).• Las listas pueden invertirse• Puede indicarse el número mínimo y máximo de palabras de la

agrupación.• Puede indicarse si el término ha de aparecer siempre a la derecha

o a la izquierda de la agrupación.• Pueden buscarse n-gramas (agrupaciones de un número

determinado de palabras)

Tamaño de la agrupación

Opciones para ordenar e invertir la lista

Posición del término en la agrupación

N-gramas

• Dentro de la herramieta “Clusters” podemos generar n-gramas, es decir, grupos de palabras de 1 a x.

• Por ejemplo: la frase “this is a pen” contiene 3 2-gramas:– This is– Is a – A pen

• Así pues, cuanto más grande sea nuestro corpus, más n-gramas.

Collocates

• Esta herramienta sirve para generar una lista ordenada de colocaciones que aparecen junto al término que se busca.

• Pueden ordenarse– por frecuencia– por frecuencia a izquierda o derecha del término

buscado– principio o final de palabra

• Puede seleccionarse el número de palabras a izquierda y derecha (Windows Span).

Número de palabras a derecha e izquierda

Opciones para ordenar e invertir la lista

Frecuencia mínima de la colocación

Word List

• La herramienta Word List sirve para generar una lista de palabras ordenadas que aparecen en los archivos de nuestro corpus.

• Las palabras pueden ordenarse– Por frecuencia– Principio o final de la palabra

• La lista puede invertirse• Puede generarse teniendo en cuenta la

ortografía o no

Búsqueda ortográfica

Lista con término buscado

KeyWord List• Esta herramienta sirve para comprar las palabras que aparecen en

nuestro corpus con otro corpus, generando así una lista de “KeyWords” que son inusualmente frecuentes (o infrecuentes) en nuestro corpus.

• Para generar una lista de palabras clase– Ir al menú “Tool preferences” y seleccionar la categoría “Keyword List”– Aquí puede seleccionarse el método estadístico para generar la lista (se

recomienda el Log-Likelihood).– Pueden verse las palabras “negativas” (palabras de nuestro corpus que

tienen una frecuencia muy baja con respecto a la frecuencia del corpus de referencia)

– Seleccionar la carpeta donde está el corpus de referencia.– Aceptar la configuración con Apply.– En la ventana principal, seleccionar las opciones de ordenación y

pinchar en Start.

Para añadir los archivos del corpus de referencia

Método estadístico para generar la lista de palabras clave

MenúsFile

• File: contiene las opciones relacionadas con archivos (abrir, cerrar etc.). Desde aquí también hay una opción para exportar la configuración actual a un archivo, que se puede volver a importar en otra sesión. También pueden exportarse los resultados a un archivo de texto.

Global Settings

• Global Settings. Consta de las sigüientes categorías:– File Settings: tipo de archivo y ruta– Tag Settings: para mostrar las etiquetas o no– Wildcard Settings: para utilizar expresiones regulares– Token (Word) Definition: para definir qué es una “palabra” (p.e.

en algunos casos nos puede interesar considerar cadenas de números como palabras). AntConc reconoce cualquier tipo de codificación (compatible con UNICODE).

– Color Settings: para editar los colores utilizados para mostrar los resultados.

– Font Settings: para editar el formato de los resultados.– Language Encodings: para especificar la codificación de nuestro

corpus.

Global Settings

Tool Preferences

• Cada herramienta (excepto Concordance Plot y File View) tiene preferencias que pueden configurarse para obtener los resultados deseados.

Tool preferences

top related