1 Buenas praacutecticas para la publicacioacuten de datos
BUENAS PRAacuteCTICAS
PARA LA PUBLICACIOacuteN
DE DATOS
La IDE de Bogotaacute
2 Buenas praacutecticas para la publicacioacuten de datos
Tiacutetulo del documento Buenas praacutecticas para la publicacioacuten de datos
Fecha de actualizacioacuten septiembre de 2018 Web httpwwwidecagovco E-mail idecacatastrobogotagovco Licencia Attribution 40 International (CC BY 40)
Autores Martha Elisabeth Melo Beltraacuten - IDECA
3 Buenas praacutecticas para la publicacioacuten de datos
CONTENIDO
INTRODUCCIOacuteN 4
OBJETIVO 5
AUDIENCIA 5
ALCANCE 5
BUENAS PRAacuteCTICAS PARA LA PUBLICACIOacuteN DE DATOS 6
1 Proporcionar metadatos asociados con los datos publicados Estos metadatos
permitiraacuten conocer las caracteriacutesticas de los datos y deberaacuten ser interpretables tanto por
usuarios como por aplicaciones informaacuteticas 6
2 Proporcionar una licencia en donde se especifiquen las limitaciones yo restricciones
de acceso y uso de los datos 9
3 Utilizar vocabularios estandarizados y reutilizables en la estructuracioacuten y publicacioacuten
tanto de datos 12
4 Anonimizar los datos de caraacutecter personal informacioacuten estadiacutestica informacioacuten
indirectamente identificable e informacioacuten sensible o confidencial 15
5 Publicar los datos en formatos estaacutendar reutilizables y legibles por aplicaciones
informaacuteticas 17
6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos
publicados 19
7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos 21
8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su
confianza 23
9 Incorporar el componente geograacutefico en los datos publicados para optimizar su
comprensioacuten uso re-uso y visualizacioacuten 26
10 Asignar un identificador uacutenico que permita aumentar la consulta uso e
interoperabilidad del dato publicado 28
OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS 30
REFERENCIAS 31
4 Buenas praacutecticas para la publicacioacuten de datos
INTRODUCCIOacuteN
La Infraestructura de Datos Espaciales del Distrito Capital - IDECA es el instrumento que
permite a las autoridades del Distrito identificar de manera constante la condicioacuten movilidad
dinaacutemica expansioacuten proceso proyectos y necesidades de la ciudad de Bogotaacute a traveacutes de la
obtencioacuten uso y disposicioacuten de informacioacuten georreferenciada para atender a la ciudadaniacutea y
conseguir la maacutes acertada toma de decisiones en beneficio de la ciudad y de sus habitantes
La obtencioacuten de datos la realiza cada entidad en el desarrollo de sus actividades misionales y el
uso de los datos producidos dependeraacute del propoacutesito del dato de la finalidad especiacutefica del
usuario y de coacutemo y cuando esteacuten disponibles los datos
IDECA gestiona la disposicioacuten de los datos por eso busca que los datos publicados por las
entidades pertenecientes a la Administracioacuten Distrital sin importar la plataforma de publicacioacuten
cuenten con altos estaacutendares de calidad interoperabilidad y documentacioacuten que promuevan y
faciliten el acceso comprensioacuten uso y re-uso de estos por cualquier usuario
Para encontrar y acceder los datos disponibles en el entorno Web los usuarios no
especializados tienen algunas dificultades ya que encuentran contenidos duplicados
desactualizados e inconsistentes lo que ha generado para los publicadores el reto de
garantizar el descubrimiento acceso calidad e interoperabilidad de sus datos
Es importante mencionar que si se publican datos uacutetiles novedosos actualizados y de calidad
no solo aumenta el nuacutemero de usuarios que los reutilicen y distribuyan sino que aumenta la
credibilidad y confianza en los datos Adicionalmente se disminuyen los costos y tiempos en la
generacioacuten de los datos y se reducen los usos indebidos de los mismos
Esta guiacutea pretende que las entidades o responsables de publicar y disponer los datos lo hagan
con altos estaacutendares de calidad debidamente documentados en formatos interoperables y
que satisfagan necesidades reales de los usuarios para que estos uacuteltimos puedan encontrarlos
accederlos comprenderlos y reutilizarlos
IDECA ha plasmado en este documento las mejores praacutecticas de publicacioacuten de datos en la
Web que cubren aspectos como el formato el acceso la calidad los metadatos el
licenciamiento y el origen de los datos
Se invita al lector a navegar faacutecilmente en el documento ya que este presenta sin un orden
determinado las mejores praacutecticas de publicacioacuten de datos explicadas en
iquestQueacute logro Los beneficios que se obtienen al aplicar la buena praacutectica
iexclRecomendaciones Las herramientas baacutesicas para conseguir el objetivo de la buena praacutectica
Ejemplos Utilizando conjuntos de datos reales de las entidades oficiales del Distrito Capital se visualiza la aplicacioacuten de la buena praacutectica
5 Buenas praacutecticas para la publicacioacuten de datos
OBJETIVO
Promover en las entidades de la Administracioacuten Distrital y sus responsables la apropiacioacuten y
adopcioacuten de las mejores praacutecticas de publicacioacuten de datos con el fin de aumentar el valor en la
informacioacuten producida dentro de su quehacer institucional
AUDIENCIA
Este documento estaacute dirigido a las entidades y personas responsables de la Administracioacuten
Distrital que publican o desean publicar datos oficiales de Bogotaacute a traveacutes de cualquier
plataforma de datos
ALCANCE
Las mejores praacutecticas expuestas en este documento estaacuten encaminadas a que los datos
publicados a traveacutes de plataformas oficiales cumplan con unos requisitos miacutenimos de calidad
documentacioacuten interoperabilidad y licenciamiento dentro del proceso de publicacioacuten
Buscamos con esta guiacutea de buenas praacutecticas garantizar la apropiacioacuten de cuatro principios
Que los datos sean descubiertos es decir que cualquier usuario en el entorno Web los
pueda encontrar faacutecilmente
Que los datos sean accesibles quiere decir que no presenten restricciones de acceso ni
que se encuentren cifrados
Que los datos sean interoperables en otras palabras que sean publicados en formatos
estandarizados que permitan ser procesados por cualquier software
Que los datos sean reutilizables es decir que estos sean utilizados en la mayor cantidad
de productos servicios y mercados
Debe tenerse en cuenta que IDECA expone en este documento las mejores praacutecticas de
publicacioacuten de datos identificadas con base a la experiencia adquirida en la disposicioacuten datos
de los uacuteltimos antildeos sin embargo existe una amplia gama de otras buenas praacutecticas de
publicacioacuten que no han sido incluidas en el presente texto y en consecuencia se invita al lector
a apropiarse de las praacutecticas expuestas y a dejar abierta la posibilidad de complementar la
informacioacuten presentada con otras fuentes
6 Buenas praacutecticas para la publicacioacuten de datos
BUENAS PRAacuteCTICAS PARA LA PUBLICACIOacuteN DE DATOS
1 Proporcionar metadatos asociados con los datos publicados Estos metadatos permitiraacuten conocer las caracteriacutesticas de los datos y deberaacuten ser interpretables tanto por usuarios como por aplicaciones informaacuteticas
Un metadato entendido como la informacioacuten acerca de un recurso1 es un dato con muchos
elementos que le permiten al usuario conocer desde la visioacuten del productor las caracteriacutesticas
propias de los datos publicados tales como las fechas de creacioacuten y actualizacioacuten el canal de
acceso la calidad del dato las condiciones de uso quieacuten lo produjo quieacuten lo distribuye etc
esto quiere decir que el metadato explica el dato en eacutel estaacute contenida toda la informacioacuten
relevante del dato
En la vida cotidiana la ceacutedula de ciudadaniacutea es el documento que contiene la informacioacuten
miacutenima de las personas (nombre sexo fecha de nacimiento GS RH estatura lugar de
nacimiento) esta informacioacuten permite que el ciudadano se identifique en cualquier lugar del
territorio nacional ante otras personas o autoridades que requieran conocerlo
Con los datos el tratamiento es similar el dato corresponde a la persona y el metadato
corresponde a la ceacutedula de ciudadaniacutea Asiacute como en Colombia todo ciudadano debe portar su
documento de identificacioacuten en el entorno Web todo dato debe portar su metadato en otras
palabras el metadato es parte integral del dato y existe entre ambos un viacutenculo inseparable
Los datos siempre deberaacuten publicarse con su respectivo metadato este uacuteltimo deberaacute contar
con informacioacuten completa y estandarizada que garantice que los usuarios encuentren
conozcan y utilicen los datos que producimos
Recuerde que la publicacioacuten del metadato es igual de importante que la publicacioacuten del
dato
iquestQueacute logro
Al publicar datos en conjunto con su metadato obtengo
Que mis datos sean encontrados y utilizados por maacutes usuarios Que los usuarios logren una correcta interpretacioacuten de la naturaleza calidad y
distribucioacuten de mis datos
Que mis datos sean entendidos evaluados y retroalimentados por maacutes usuarios
Que mis datos puedan ser compartidos e intercambiados entre sistemas
Que los motores de buacutesqueda encuentren mis datos publicados
Que las aplicaciones informaacuteticas procesen mejor y en mayor cantidad mis datos
1 ISO 19115-12014 410
7 Buenas praacutecticas para la publicacioacuten de datos
iexclRecomendaciones
Disponga metadatos suficientes que permitan a los usuarios tener la informacioacuten
correcta para decidir si el dato publicado satisface o no sus necesidades
Incluya en sus metadatos la ubicacioacuten del dato a traveacutes de la descripcioacuten del lugar
(localidad parque riacuteo etc) o a traveacutes de localizacioacuten por coordenadas geograacuteficas x e
y
Publique sus metadatos como una paacutegina Web HTML (HyperText Markup Language) o
simplemente como un archivo de texto separado
Disponga sus metadatos en el formato baacutesico de intercambio XML (Extensible Markup
Language) o en formatos estaacutendar maacutes sofisticados como JSON (JavaScript Object
Notation)
Al igual que los datos puede publicar los metadatos en muacuteltiples formatos desde la
misma URL
Tenga en cuenta que IDECA a partir de estaacutendares internacionales ha definido los
elementos miacutenimos que debe contener el metadato y que estos pueden ser utilizados
en la publicacioacuten de sus metadatos para facilitar el intercambio de estos
Figura 1 Secciones del Perfil de Metadatos IDECA
Para maacutes informacioacuten consulte la Cartilla para la creacioacuten de metadatos geograacuteficos en
Bogotaacute Distrito Capital
8 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
En la siguiente URL se observa un metadato dispuesto para que los usuarios puedan consultar
faacutecilmente la informacioacuten asociada al dato publicado (Desarrollo Econoacutemico Rural Bogotaacute
DC)
httpmetadatosidecagovcogeoportalcatalogsearchresourcedetailspageuuid=A8AB6E
7A-55FB-40DA-85E1-0AA6B4FE6CE3
Ejemplo 2
En la siguiente URL estaacute disponible el metadato de un nivel de informacioacuten dispuesto por la
Unidad Administrativa Especial de Catastro Distrital ndash UAECD ndash en formato XML (legible por
aplicaciones informaacuteticas
httpmetadatosidecagovcogeoportalrestdocumentid=7BBE5F9AEE-1FBC-4C13-822F-
F2CE44AFDD7E7D
9 Buenas praacutecticas para la publicacioacuten de datos
2 Proporcionar una licencia en donde se especifiquen las limitaciones yo restricciones de acceso y uso de los datos
Una licencia entendida como las condiciones legales bajo las cuales estaacute disponible la obra2 es
un instrumento mediante el cual el propietario del dato autoriza o no a los usuarios para que
accedan a su contenido y tambieacuten lo faculta para su utilizacioacuten Existen diferentes tipos de
licencia para la distribucioacuten y explotacioacuten de obras y cuyo propoacutesito es regular las condiciones
de acceso y uso de los datos
Dependiendo el acceso autorizado a los datos las licencias pueden clasificarse en
Privativas o restrictivas Aquellas licencias conocidas como cerradas o no libres donde la mayoriacutea de las veces solo el autor puede usar la obra o en caso contrario se definen condiciones especiacuteficas que se deben cumplir para hacer uso de la informacioacuten
Semilibres Aquellas licencias que requieren autorizaciones para que los usuarios utilicen copien distribuyan o modifiquen su contenido
Libres o abiertas Aquellas licencias que en teacuterminos generales permiten usar distribuir y compartir los datos con muy pocas restricciones
Cuando un dato se publica acompantildeado de su licencia el usuario conoce las condiciones de
acceso uso y distribucioacuten de los datos que estaacute consumiendo de esta forma se garantiza que
los datos se distribuyan seguacuten los intereses de la entidad que los produce y se minimizan los
usos indebidos de los datos por parte de los usuarios
Ahora bien definir la licencia adecuada para cada dato dependeraacute de las condiciones que
establezca la entidad productora de este Revise los ejemplos y defina la licencia maacutes adecuada
para sus datos
Para maacutes informacioacuten consulte el Instructivo para la definicioacuten de licencias de datos
iquestQueacute logro
Que el usuario evaluacutee si puede o no usar mis datos
Que el usuario conozca las condiciones de acceso uso y manejo sobre los datos
disponibles
Dar claridad y potenciar el uso de los datos disponibles
Que el usuario de los reconocimientos respectivos a la entidad productora de los datos
Que se genere valor agregado sobre los datos disponibles en caso de asignar una
licencia abierta
2 Recuperado de httpsopendefinitionorgod21es
10 Buenas praacutecticas para la publicacioacuten de datos
iexclRecomendaciones
Identifique la licencia que mejor se acomode a su modelo de negocio Recuerde que
mediante la Ley 1712 de 2014 se reguloacute el derecho de acceso a la informacioacuten puacuteblica
y se incluyeron los principios de facilitacioacuten gratuidad y divulgacioacuten proactiva de la
informacioacuten
Disponga una licencia para su conjunto de datos a traveacutes de un enlace una copia
incorporada o dentro del metadato
Prefiera el uso de licencias abiertas de este modo sus datos seraacuten utilizados en una
mayor cantidad de productos servicios y mercados
Ejemplo 1
Mundialmente conocidas las licencias Creative Commons3 tienen como objetivo fortalecer a los
creadores para que sean quienes definan los teacuterminos en que sus obras pueden ser usadas queacute
derechos desean entregar y en queacute condiciones lo haraacuten A continuacioacuten encontraraacute los
enlaces de acceso para conocer las condiciones de cada una de las licencias disponibles
CC0 10 httpscreativecommonsorgpublicdomainzero10deedes
CC BY 40 httpscreativecommonsorglicensesby40
CC BY-SA 40 httpscreativecommonsorglicensesby-sa40
CC BY-ND 40 httpscreativecommonsorglicensesby-nd40
CC BY-NC 40 httpscreativecommonsorglicensesby-nc40
CC BY-NC-SA 40
httpscreativecommonsorglicensesby-nc-sa40
Ejemplo 2
Tambieacuten existen las licencias abiertas para datos Open Data Commons4 proporcionadas por la
mundialmente conocida red Open Knowledge Foundation Network ndash OKFN5 puede consultar
las condiciones ingresando a los siguientes enlaces
ODbL 10 httpsopendatacommonsorglicensesodblsummary
PDDL 10 httpsopendatacommonsorglicensespddlsummary
ODC-BY 10 httpsopendatacommonsorglicensesbysummary
3 httpcreativecommonsorg 4 httpopendatacommonsorg 5 httpsokfnorg
11 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 3
El Mapa de referencia para Bogotaacute estaacute publicado en
httpswwwidecagovcoesserviciosmapa-de-referencia bajo las condiciones descritas en la
ldquoLICENCIA ABIERTA O CONDICIONES DE USO PARA DATOS ABIERTOS DE LA INFRAESTRUCTURA
INTEGRADA DE DATOS ESPACIALES PARA EL DISTRITO CAPITAL (IDECA)rdquo
httpswwwidecagovcoeslicenciaabierta
12 Buenas praacutecticas para la publicacioacuten de datos
3 Utilizar vocabularios estandarizados y reutilizables en la estructuracioacuten y publicacioacuten de los datos
Un vocabulario define los conceptos y las relaciones que se utilizan para describir y representar
un aacuterea de intereacutes6 Cuando se publican datos en la Web los vocabularios permiten integrar
datos cuando existen ambiguumledades en los teacuterminos utilizados en los diferentes conjuntos de
datos En la praacutectica un vocabulario es un conjunto de palabras que permiten a dos usuarios
comunicarse entre siacute La efectividad de dicha comunicacioacuten radica en que el significado de una
palabra para el usuario emisor sea el mismo que para el usuario receptor independientemente
de si utilizaron el mismo teacutermino
Cuando se habla de interoperabilidad de datos lo que se espera es que tanto los usuarios
como las aplicaciones informaacuteticas entiendan y comprendan la mayor cantidad de informacioacuten
que estaacuten consumiendo Para conseguir esto las comunidades de datos han identificado
vocablos palabras o teacuterminos de uso comuacuten los cuales cuentan con significados apropiados y
que actualmente se encuentran integrados y estructurados en diferentes estaacutendares
internacionales
Se recomienda utilizar vocabularios de este tipo para estandarizar los datos contenidos en la
informacioacuten publicada
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios Que se reduzca la ambiguumledad en la interpretacioacuten de mis datos Que mis datos sean interoperables Que mis datos sean procesados en entornos nacionales e internacionales Que mis datos puedan ser compartidos e intercambiados entre sistemas Que mis datos sean maacutes confiables
iexclRecomendaciones
Consulte normas locales o vocabularios internacionales para la estructuracioacuten7 de sus
datos
Apropie los vocabularios consultados y adapte sus datos a estos en los casos en que sea
posible
Incluya vocabularios ya definidos y reconocidos internacionalmente cuando vaya a
producir nuevos datos
6 httpswwww3orgstandardssemanticwebontology 7 Estructurar significa ajustar los datos a un esquema fijo
13 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
A continuacioacuten se presentan algunos vocabularios internacionales que puede consultar y
apropiar para optimizar el intercambio de sus datos
Data Catalog Vocabulary (DCAT) httpswwww3orgTRvocab-dcatclass-catalog
FOAF Vocabulary Specification httpxmlnscomfoaf01
ISOTC 211 Geographic informationGeomatics Terminology
httpwwwisotc211orgTerminologyhtm
The RDF Data Cube Vocabulary httpswwww3orgTR2014REC-vocab-data-cube-20140116
ODRL Vocabulary amp Expression 22
httpswwww3orgTR2018REC-odrl-vocab-20180215
HTTP Vocabulary in RDF 10 httpswwww3orgTR2017NOTE-HTTP-in-RDF10-20170202
vCard Ontology - for describing People and Organizations
httpswwww3orgTRvcard-rdf
Ejemplo 2
En el contexto Nacional el Ministerio de Tecnologiacuteas de la Informacioacuten y las Comunicaciones ha
establecido el Lenguaje Comuacuten de Intercambio de como un instrumento de consulta que
contiene la definicioacuten de los elementos de datos conceptualizados por las entidades del
estado La consulta la puede realizar en httplenguajeminticgovco
14 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 3
La especificacioacuten vCard disponible en httpswwww3orgTRvcard-rdf promueve un
vocabulario especiacutefico para describir personas y organizaciones
Uno de los vocablos que describe esta especificacioacuten es la ldquodireccioacuten de entregardquo llamado
dentro del vocabulario como ADR y definido como ldquola direccioacuten del objeto representado en
partes estructuradasrdquo
Ahora bien este vocabulario especifica los componentes de la direccioacuten de entrega para el
objeto asiacute el nombre del paiacutes la localidad el coacutedigo postal la regioacuten y la direccioacuten dada por
viacuteas (calles y carreras en el caso colombiano) Esto quiere decir que cualquiera de los
componentes descritos puede usarse como direccioacuten de entrega vaacutelida ya que son equivalentes
entre siacute
Aunque en el vocabulario la direccioacuten de entrega se llame ADR el usuario de la informacioacuten
entenderaacute que un nombre de paiacutes o un coacutedigo postal pueden interpretarse como ADR
15 Buenas praacutecticas para la publicacioacuten de datos
4 Anonimizar los datos de caraacutecter personal informacioacuten estadiacutestica informacioacuten indirectamente identificable e informacioacuten sensible o confidencial
Anonimizar es el proceso que impide la identificacioacuten de las unidades de estudio que son fuente
para los registros individuales de un conjunto8 de datos o maacutes claro es la aplicacioacuten de teacutecnicas
que permitan expresar un dato relativo a personas eliminando la referencia a su identidad9
Baacutesicamente lo que se busca es reducir los riesgos en el uso y procesamiento de datos
personales evitar la extraccioacuten de registros que identifican a una persona reducir la
combinacioacuten de dos o maacutes registros en una o varias bases de datos para identificar a una
persona y minimizar la deduccioacuten de datos personales partir de uno o varios datos publicados
iquestQueacute informacioacuten debo prioritariamente anonimizar
Datos personales Informacioacuten numeacuterica alfabeacutetica graacutefica fotograacutefica acuacutestica o
cualquier otro tipo susceptible de recogida registro tratamiento y transmisioacuten
concerniente a personas fiacutesicas identificadas o identificables (tales como nombre
apellidos estado civil sexo edad domicilio identificacioacuten personal nuacutemero de
teleacutefono etc)10
Informacioacuten sensible Informacioacuten considerada como estrictamente confidencial
Informacioacuten y caracteriacutesticas referentes a la edad procedencia salud raza religioacuten
ideologiacutea afiliacioacuten finanzas etc se consideran de caraacutecter sensible y requieren de
una proteccioacuten especial11
iquestQueacute logro
Garantizar que mis datos publicados cuentan con medidas de proteccioacuten de datos
personales
Eliminar de manera efectiva el riesgo de re-identificacioacuten
Evitar que el procesamiento de mis datos tenga consecuencias negativas para alguna
persona
Disponer muchos maacutes datos sin invadir la informacioacuten personal
iexclRecomendaciones
Implemente actividades de proteccioacuten de la privacidad de los datos personales antes
de publicarlos
Elimine cualquier identificador directo de la persona (nombre documento de
identidad etc)
8 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 9 httpdleraeesid=2jjMiRi 10 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 11 Ibidem
16 Buenas praacutecticas para la publicacioacuten de datos
Reemplace los identificadores directos por coacutedigos de referencia pseudoacutenimos
(algoritmos AES12 o un hash cifrado HMAC13) coacutedigos arbitrarios o aleatorios
Si reemplazando el identificador directo auacuten es faacutecil identificar a la persona elimine el
dato
Clasifique yo categorice los datos
Redondee los datos numeacutericos hacia arriba o hacia abajo
Evaluacutee antes durante y despueacutes de publicados los datos si la anonimizacioacuten de sus
datos es suficiente y evaluacutee regularmente los riesgos existentes
Para maacutes informacioacuten consulte los Lineamientos para la Anonimizacioacuten de micro datos
Ejemplo 1
Antes de publicar sus datos retire el identificador directo de la persona En este caso
reemplace en nuacutemero de documento que identifica al usuario y reemplaacutecelo por un
consecutivo
Usuario Beneficio Usuario Beneficio
80123456 Subsidio de vivienda Usuario 1 Subsidio de vivienda
51123456 Subsidio de alimentacioacuten Usuario 2 Subsidio de alimentacioacuten
19123456 Subsidio al adulto mayor Usuario 3 Subsidio al adulto mayor
53123456 Subsidio de desempleo Usuario 4 Subsidio de desempleo
Ejemplo 2
Clasifique o categorice sus datos En este ejemplo asigne rangos a la edad de manera tal que el
titular del registro no sea identificable por este dato
Usuario Edad Usuario Rango de edad
Usuario 1 11 antildeos Usuario 1 Entre 10 y 15 antildeos
Usuario 2 22 antildeos Usuario 2 Entre 20 y 25 antildeos
Usuario 3 36 antildeos Usuario 3 Entre 35 y 40 antildeos
Usuario 4 63 antildeos Usuario 4 Entre 60 y 65 antildeos
12 Advanced Encryption Standard puede consultar como ha sido implementado este algoritmo en httpsrevistasudistritaleducoojsindexphpTecnuraarticleview72368892 13 Hash-based Message Authentication Code puede consultar como se crea este cifrado en httpsdocsoraclecomcdE19253-01819-7804wanboottasks2-51indexhtml
17 Buenas praacutecticas para la publicacioacuten de datos
5 Publicar los datos en formatos estaacutendar reutilizables y legibles por aplicaciones informaacuteticas
Un formato puede ser definido como la estructura de un disco dividido en campos y pistas
seguacuten un determinado sistema operativo lo que permite almacenar en eacutel informacioacuten14
baacutesicamente es la forma en que se codifican los datos en un archivo informaacutetico
Actualmente conocemos formatos comunes de almacenamiento como el doc una extensioacuten
de Word que almacena texto y cuyo propietario es la compantildeiacutea Microsoft Pero iquestqueacute pasa si un
usuario quiere abrir un documento doc en un procesador de texto diferente a Word
difiacutecilmente va a poder conocer el contenido de dicho documento sin tener esta licencia
Lo que queremos lograr con la implementacioacuten de esta praacutectica es que todos los usuarios que
encuentren mis datos puedan accederlos sin necesidad de contar con un software o aplicacioacuten
informaacutetica especiacutefica
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos puedan ser extraiacutedos transformados y procesados por aplicaciones
informaacuteticas
Que mis datos puedan ser compartidos e intercambiados entre sistemas
Disminuir los costos y los tiempos en el uso y la transformacioacuten de mis datos
iexclRecomendaciones
Prefiera publicar su conjunto de datos en formatos abiertos o no propietario ya que
estos facilitan el uso re-uso y distribucioacuten de estos Se busca que un mayor nuacutemero de
aplicaciones informaacuteticas pueda extraer leer y transformar los datos generando mayor
uso y re-uso por los usuarios
Disponga sus datos en muacuteltiples formatos con el fin de incrementar el acceso a los
mismos Se busca que el mayor nuacutemero de usuarios pueda utilizar los datos sin tener
que transformarlos primero en su formato preferido
Utilice Web Services para mejorar el intercambio e interoperabilidad de los datos
publicados
14 httpdleraeessrvsearchm=30ampw=formato
18 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
A continuacioacuten encontraraacute extensiones de formato propietario y no propietario prefiera para
la publicacioacuten de sus datos las extensiones de la derecha
FORMATO PROPIETARIO FORMATO NO PROPIETARIO
DOC GDB TXT ASCII Grid KML RDF
XLS DWG CSV GeoJSON DXF XML
PPT SHP JSON GML ODF
Ejemplo 2
Si no fue posible utilizar una extensioacuten de formato no propietario publique sus datos en una
variedad de formatos que le permita al usuario acceder a los datos desde diferentes
aplicaciones informaacuteticas
Ejemplo 3
Para publicar sus datos conozca diferentes tipos de Web Services que viajan en la red utilizando extensiones XML
SOAP httpswwww3orgTRsoap
REST httprestelksteinorg
WMS httpwwwopengeospatialorgstandardswms
WFS httpwwwopengeospatialorgstandardswfs
WCS httpwwwopengeospatialorgstandardswcs
19 Buenas praacutecticas para la publicacioacuten de datos
6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos publicados
Un diccionario estaacute definido como un repertorio en forma de libro o en soporte electroacutenico en el
que se recogen seguacuten un orden determinado las palabras o expresiones de una o maacutes lenguas
o de una materia concreta acompantildeadas de su definicioacuten equivalencia o explicacioacuten15
especiacuteficamente en un diccionario de datos se encuentran los conceptos de los datos y sus
propiedades (atributos dominios asociaciones y operaciones) acompantildeados de una definicioacuten
en donde se identifica el propoacutesito alcance y campo de aplicacioacuten del dato publicado
Lograr que los usuarios de mis datos entiendan la informacioacuten que estaacute publicada le permitiraacute
decidir si satisfacen o no su necesidad y le facilitaraacute la decisioacuten para explotar lo datos
Para maacutes informacioacuten consulte el Instructivo Diccionario de Datos
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que se eviten ambiguumledades en la interpretacioacuten de mis datos
Que mis datos publicados esteacuten unificados y consistentes
Que los usuarios comprendan mejor y dispongan de claridad sobre los conceptos de
mis datos
iexclRecomendaciones
Publique como miacutenimo un diccionario de datos que contenga la caracterizacioacuten del
conjunto de datos producidos por su entidad
Cree el diccionario de datos teniendo en cuenta como miacutenimo la siguiente informacioacuten
Nombre del atributo Nombre que identifica de manera clara un atributo
Definicioacuten Descripcioacuten del atributo
Tipo de dato Tipo de valor del atributo
Unidad de medida Expresa la unidad de medida del atributo
Dominio Determina si el atributo tiene asociado un dominio
15 httpdleraeesw=diccionario
20 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
Para el conjunto de datos ldquoEstablecimientos Educativos en Bogotaacuterdquo publicariacuteamos un
diccionario de datos similar al siguiente
Nombre del atributo Definicioacuten Tipo de dato
Unidad de Medida
Dominio
Coacutedigo del establecimiento
Coacutedigo DANE asignado al Institucioacuten Educativa Decimal
Nombre del establecimiento
Nombre de la Institucioacuten Educativa Cadena de Caracteres
Aacuterea construida del establecimiento
Aacuterea construida de la Institucioacuten Educativa Decimal Metros
cuadrados
Sector
Clasificacioacuten asignada seguacuten la naturaleza juriacutedica la cual define las principales caracteriacutesticas que desde lo juriacutedico - administrativo y tiene que ver con el origen de su creacioacuten
Entero
EESector
No podriacuteamos olvidar detallar el dominio asociado
Atributo Nombre del Dominio Coacutedigo Definicioacuten
EESector
Oficial 1
Es una institucioacuten donde su naturaleza de servicio puacuteblico cultural y su funcioacuten social le es inherente cumpliendo con las disposiciones legales y estatutarias que las rigen donde sus rentas se conservan y se aplican debidamente
Privado 2
Es una institucioacuten constituida como persona juriacutedica de utilidad comuacuten donde sus rentas se conservan y se aplican debidamente y que en todo lo esencial se cumple con la voluntad de sus fundadores
21 Buenas praacutecticas para la publicacioacuten de datos
7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos
Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para
acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que
conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como
cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o
software
En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos
publicados se proporcionen recursos o documentos adicionales que puedan ser consultados
yo descargados traveacutes de enlaces o links de otro sitio Web
Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los
procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los
documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad
entre otros
iquestQueacute logro
Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos
Que los usuarios comprendan mejor mis datos
Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios
iexclRecomendaciones
Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el
horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del
dato
No olvide vincular o registrar esta informacioacuten en el metadato
16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp
22 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos
Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318
Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57
Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30
Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217
Ejemplo 2
La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en
httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos
o Gestioacuten de los humedales
o Poliacutetica de Humedales del Distrito Capital
o Normatividad
o Planes de Manejo Ambiental
o Comiteacute distrital de humedales documentos de consulta normatividad
23 Buenas praacutecticas para la publicacioacuten de datos
8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza
La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten
juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado
Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para
satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas
y especificaciones establecidas
Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades
de estos sin embargo en este aparte citaremos los elementos principales que usted o su
entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad
Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de
los datos espaciales
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que los usuarios hablen bien de mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean maacutes compartidos
Que mis datos sean maacutes confiables
Recomendacioacuten 1
Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten
descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten
corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Suba 200 Tunjuelito 500
Ameacutericas 100
850
Tunjuelito 500
18 httpdleraeesid=6nVpk8P|6nXVL1Z
Campo duplicado
Campo inconsistente
Campo vaciacuteo
24 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 2
Identifique y transforme si es necesario los datos que hayan sido registrados en un formato
diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida
del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de
formatordquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Tunjuelito 5008 Tunjuelito 500
Fontiboacuten 40 Fontiboacuten 430
Tunjuelito 500 Tunjuelito 500
Recomendacioacuten 3
Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos
se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de
clasificacioacutenrdquo
Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad
Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10
Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20
Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40
Recomendacioacuten 4
Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos
correspondan a valores conocidos como verdaderos El elemento de calidad asociado se
denomina ldquoexactitud de atributos cuantitativosrdquo
Localidad Mes Temperatura Localidad Mes Temperatura
Chapinero Enero 7degC Chapinero Enero 7degC
Suba Agosto -15degC Suba Agosto 15degC
Tunjuelito Abril 60degC Tunjuelito Abril 16degC
Clasificacioacuten inconsistente
Formato inconsistente
Valor inconsistente
25 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 5
Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por
ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que
las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad
asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo
Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro
00 20580101 00 20180101
01 20180102 01 20180102
126 20510403 126 20180103
20 20180104 20 20180104
Recomendacioacuten 6
Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes
de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se
denomina ldquoconsistencia temporalrdquo
Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio
Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231
Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231
Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112
Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112
Recomendacioacuten 7
Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta
corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud
posicionalrdquo
Eventos Deportivos Lugar Eventos Deportivos Lugar
Evento 1 AK 30 25 90 Evento 1 AK 30 25 90
Evento 2 AC 63 215 20 Evento 2 Parque La Florida
Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar
Fecha
inconsistente
Fechas no secuenciales
Lugar inexistente
26 Buenas praacutecticas para la publicacioacuten de datos
9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten
El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de
alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una
institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las
variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a
cabo los traacutemites de una entidad etc
Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un
espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados
Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten
asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un
establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario
identificar la localizacioacuten del dato publicado
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean puedan compartir en maacutes plataformas
Que los usuarios puedan visualizar mis datos en un mapa
iexclRecomendaciones
Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o
lugares geograacuteficos
Ejemplo 1
Incluya direcciones que permitan localizar espacialmente sus datos
Programa Direccioacuten
Registro de atencioacuten a la ciudadaniacutea CL 138 108 16
Centro de autocuidado KR 18 D 77 A 11 SUR
Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46
Centro de autocuidado KR 18 D 73 A 33 SUR
19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico
27 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 2
Utilice coordenadas para indicar la ubicacioacuten de sus datos
EPS Coordenada X Coordenada Y
EPS Convida 9087496334 1051342164
Capital Salud EPS 986321006 954875808
EPS Famisanar 9742508812 8837031501
Aliansalud EPS 9716943356 9659706891
Salud Total EPS 9215624975 9625189518
Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro
de su metadato el Sistema de referencia empleado
MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686
MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116
MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458
Ejemplo 3
Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute
Usuario Vacunado Lugar de Vacunacioacuten
Usuario 1 BOSQUE IZQUIERDO
Usuario 2 LAGUNITAS URBANO
Usuario 3 LA CAPUCHINA
Usuario 4 SAN JOSE SUR
Usuario 5 VENECIA
28 Buenas praacutecticas para la publicacioacuten de datos
10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado
Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el
dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los
usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la
citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el
formato de este
En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero
de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de
su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la
informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado
y reconocido faacutecilmente entre los demaacutes datos
Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de
identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por
cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta
gestioacuten y reutilizacioacuten de sus datos
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean compartidos en maacutes plataformas
Que mis datos puedan vincularse a otros datos en el entorno Web
Que mis datos sean encontrados usados y citados inequiacutevocamente
Garantizar y monitorear la reutilizacioacuten de mis datos
Reducir del uso erroacuteneo de mis datos
iexclRecomendaciones
Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar
Utilice siempre el identificador asignado para publicar sus datos
29 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos
httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la
creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la
asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten
de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito
garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar
descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando
asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten
geograacutefica
Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems
publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace
referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades
territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el
planeamiento del suelo urbano de expansioacuten y ruralrdquo
30 Buenas praacutecticas para la publicacioacuten de datos
OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS
Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten
Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado
Nivel Baacutesico
En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)
Nivel Intermedio
Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)
Nivel Avanzado
Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)
31 Buenas praacutecticas para la publicacioacuten de datos
REFERENCIAS
Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best
Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp
Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices
for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp
Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington
Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec
Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI
Recommendation URL httpdublincoreorgdocumentsdcmi-terms
Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C
Recommendation URL httpswwww3orgTRvocab-dcat
ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de
2014 International Standard
ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers
noviembre de 2009 International Standard
ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013
International Standard
Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best
Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp
T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax
Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986
World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg
W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second
Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-
overview
W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado
el 12 de septiembre de 2018
2 Buenas praacutecticas para la publicacioacuten de datos
Tiacutetulo del documento Buenas praacutecticas para la publicacioacuten de datos
Fecha de actualizacioacuten septiembre de 2018 Web httpwwwidecagovco E-mail idecacatastrobogotagovco Licencia Attribution 40 International (CC BY 40)
Autores Martha Elisabeth Melo Beltraacuten - IDECA
3 Buenas praacutecticas para la publicacioacuten de datos
CONTENIDO
INTRODUCCIOacuteN 4
OBJETIVO 5
AUDIENCIA 5
ALCANCE 5
BUENAS PRAacuteCTICAS PARA LA PUBLICACIOacuteN DE DATOS 6
1 Proporcionar metadatos asociados con los datos publicados Estos metadatos
permitiraacuten conocer las caracteriacutesticas de los datos y deberaacuten ser interpretables tanto por
usuarios como por aplicaciones informaacuteticas 6
2 Proporcionar una licencia en donde se especifiquen las limitaciones yo restricciones
de acceso y uso de los datos 9
3 Utilizar vocabularios estandarizados y reutilizables en la estructuracioacuten y publicacioacuten
tanto de datos 12
4 Anonimizar los datos de caraacutecter personal informacioacuten estadiacutestica informacioacuten
indirectamente identificable e informacioacuten sensible o confidencial 15
5 Publicar los datos en formatos estaacutendar reutilizables y legibles por aplicaciones
informaacuteticas 17
6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos
publicados 19
7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos 21
8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su
confianza 23
9 Incorporar el componente geograacutefico en los datos publicados para optimizar su
comprensioacuten uso re-uso y visualizacioacuten 26
10 Asignar un identificador uacutenico que permita aumentar la consulta uso e
interoperabilidad del dato publicado 28
OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS 30
REFERENCIAS 31
4 Buenas praacutecticas para la publicacioacuten de datos
INTRODUCCIOacuteN
La Infraestructura de Datos Espaciales del Distrito Capital - IDECA es el instrumento que
permite a las autoridades del Distrito identificar de manera constante la condicioacuten movilidad
dinaacutemica expansioacuten proceso proyectos y necesidades de la ciudad de Bogotaacute a traveacutes de la
obtencioacuten uso y disposicioacuten de informacioacuten georreferenciada para atender a la ciudadaniacutea y
conseguir la maacutes acertada toma de decisiones en beneficio de la ciudad y de sus habitantes
La obtencioacuten de datos la realiza cada entidad en el desarrollo de sus actividades misionales y el
uso de los datos producidos dependeraacute del propoacutesito del dato de la finalidad especiacutefica del
usuario y de coacutemo y cuando esteacuten disponibles los datos
IDECA gestiona la disposicioacuten de los datos por eso busca que los datos publicados por las
entidades pertenecientes a la Administracioacuten Distrital sin importar la plataforma de publicacioacuten
cuenten con altos estaacutendares de calidad interoperabilidad y documentacioacuten que promuevan y
faciliten el acceso comprensioacuten uso y re-uso de estos por cualquier usuario
Para encontrar y acceder los datos disponibles en el entorno Web los usuarios no
especializados tienen algunas dificultades ya que encuentran contenidos duplicados
desactualizados e inconsistentes lo que ha generado para los publicadores el reto de
garantizar el descubrimiento acceso calidad e interoperabilidad de sus datos
Es importante mencionar que si se publican datos uacutetiles novedosos actualizados y de calidad
no solo aumenta el nuacutemero de usuarios que los reutilicen y distribuyan sino que aumenta la
credibilidad y confianza en los datos Adicionalmente se disminuyen los costos y tiempos en la
generacioacuten de los datos y se reducen los usos indebidos de los mismos
Esta guiacutea pretende que las entidades o responsables de publicar y disponer los datos lo hagan
con altos estaacutendares de calidad debidamente documentados en formatos interoperables y
que satisfagan necesidades reales de los usuarios para que estos uacuteltimos puedan encontrarlos
accederlos comprenderlos y reutilizarlos
IDECA ha plasmado en este documento las mejores praacutecticas de publicacioacuten de datos en la
Web que cubren aspectos como el formato el acceso la calidad los metadatos el
licenciamiento y el origen de los datos
Se invita al lector a navegar faacutecilmente en el documento ya que este presenta sin un orden
determinado las mejores praacutecticas de publicacioacuten de datos explicadas en
iquestQueacute logro Los beneficios que se obtienen al aplicar la buena praacutectica
iexclRecomendaciones Las herramientas baacutesicas para conseguir el objetivo de la buena praacutectica
Ejemplos Utilizando conjuntos de datos reales de las entidades oficiales del Distrito Capital se visualiza la aplicacioacuten de la buena praacutectica
5 Buenas praacutecticas para la publicacioacuten de datos
OBJETIVO
Promover en las entidades de la Administracioacuten Distrital y sus responsables la apropiacioacuten y
adopcioacuten de las mejores praacutecticas de publicacioacuten de datos con el fin de aumentar el valor en la
informacioacuten producida dentro de su quehacer institucional
AUDIENCIA
Este documento estaacute dirigido a las entidades y personas responsables de la Administracioacuten
Distrital que publican o desean publicar datos oficiales de Bogotaacute a traveacutes de cualquier
plataforma de datos
ALCANCE
Las mejores praacutecticas expuestas en este documento estaacuten encaminadas a que los datos
publicados a traveacutes de plataformas oficiales cumplan con unos requisitos miacutenimos de calidad
documentacioacuten interoperabilidad y licenciamiento dentro del proceso de publicacioacuten
Buscamos con esta guiacutea de buenas praacutecticas garantizar la apropiacioacuten de cuatro principios
Que los datos sean descubiertos es decir que cualquier usuario en el entorno Web los
pueda encontrar faacutecilmente
Que los datos sean accesibles quiere decir que no presenten restricciones de acceso ni
que se encuentren cifrados
Que los datos sean interoperables en otras palabras que sean publicados en formatos
estandarizados que permitan ser procesados por cualquier software
Que los datos sean reutilizables es decir que estos sean utilizados en la mayor cantidad
de productos servicios y mercados
Debe tenerse en cuenta que IDECA expone en este documento las mejores praacutecticas de
publicacioacuten de datos identificadas con base a la experiencia adquirida en la disposicioacuten datos
de los uacuteltimos antildeos sin embargo existe una amplia gama de otras buenas praacutecticas de
publicacioacuten que no han sido incluidas en el presente texto y en consecuencia se invita al lector
a apropiarse de las praacutecticas expuestas y a dejar abierta la posibilidad de complementar la
informacioacuten presentada con otras fuentes
6 Buenas praacutecticas para la publicacioacuten de datos
BUENAS PRAacuteCTICAS PARA LA PUBLICACIOacuteN DE DATOS
1 Proporcionar metadatos asociados con los datos publicados Estos metadatos permitiraacuten conocer las caracteriacutesticas de los datos y deberaacuten ser interpretables tanto por usuarios como por aplicaciones informaacuteticas
Un metadato entendido como la informacioacuten acerca de un recurso1 es un dato con muchos
elementos que le permiten al usuario conocer desde la visioacuten del productor las caracteriacutesticas
propias de los datos publicados tales como las fechas de creacioacuten y actualizacioacuten el canal de
acceso la calidad del dato las condiciones de uso quieacuten lo produjo quieacuten lo distribuye etc
esto quiere decir que el metadato explica el dato en eacutel estaacute contenida toda la informacioacuten
relevante del dato
En la vida cotidiana la ceacutedula de ciudadaniacutea es el documento que contiene la informacioacuten
miacutenima de las personas (nombre sexo fecha de nacimiento GS RH estatura lugar de
nacimiento) esta informacioacuten permite que el ciudadano se identifique en cualquier lugar del
territorio nacional ante otras personas o autoridades que requieran conocerlo
Con los datos el tratamiento es similar el dato corresponde a la persona y el metadato
corresponde a la ceacutedula de ciudadaniacutea Asiacute como en Colombia todo ciudadano debe portar su
documento de identificacioacuten en el entorno Web todo dato debe portar su metadato en otras
palabras el metadato es parte integral del dato y existe entre ambos un viacutenculo inseparable
Los datos siempre deberaacuten publicarse con su respectivo metadato este uacuteltimo deberaacute contar
con informacioacuten completa y estandarizada que garantice que los usuarios encuentren
conozcan y utilicen los datos que producimos
Recuerde que la publicacioacuten del metadato es igual de importante que la publicacioacuten del
dato
iquestQueacute logro
Al publicar datos en conjunto con su metadato obtengo
Que mis datos sean encontrados y utilizados por maacutes usuarios Que los usuarios logren una correcta interpretacioacuten de la naturaleza calidad y
distribucioacuten de mis datos
Que mis datos sean entendidos evaluados y retroalimentados por maacutes usuarios
Que mis datos puedan ser compartidos e intercambiados entre sistemas
Que los motores de buacutesqueda encuentren mis datos publicados
Que las aplicaciones informaacuteticas procesen mejor y en mayor cantidad mis datos
1 ISO 19115-12014 410
7 Buenas praacutecticas para la publicacioacuten de datos
iexclRecomendaciones
Disponga metadatos suficientes que permitan a los usuarios tener la informacioacuten
correcta para decidir si el dato publicado satisface o no sus necesidades
Incluya en sus metadatos la ubicacioacuten del dato a traveacutes de la descripcioacuten del lugar
(localidad parque riacuteo etc) o a traveacutes de localizacioacuten por coordenadas geograacuteficas x e
y
Publique sus metadatos como una paacutegina Web HTML (HyperText Markup Language) o
simplemente como un archivo de texto separado
Disponga sus metadatos en el formato baacutesico de intercambio XML (Extensible Markup
Language) o en formatos estaacutendar maacutes sofisticados como JSON (JavaScript Object
Notation)
Al igual que los datos puede publicar los metadatos en muacuteltiples formatos desde la
misma URL
Tenga en cuenta que IDECA a partir de estaacutendares internacionales ha definido los
elementos miacutenimos que debe contener el metadato y que estos pueden ser utilizados
en la publicacioacuten de sus metadatos para facilitar el intercambio de estos
Figura 1 Secciones del Perfil de Metadatos IDECA
Para maacutes informacioacuten consulte la Cartilla para la creacioacuten de metadatos geograacuteficos en
Bogotaacute Distrito Capital
8 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
En la siguiente URL se observa un metadato dispuesto para que los usuarios puedan consultar
faacutecilmente la informacioacuten asociada al dato publicado (Desarrollo Econoacutemico Rural Bogotaacute
DC)
httpmetadatosidecagovcogeoportalcatalogsearchresourcedetailspageuuid=A8AB6E
7A-55FB-40DA-85E1-0AA6B4FE6CE3
Ejemplo 2
En la siguiente URL estaacute disponible el metadato de un nivel de informacioacuten dispuesto por la
Unidad Administrativa Especial de Catastro Distrital ndash UAECD ndash en formato XML (legible por
aplicaciones informaacuteticas
httpmetadatosidecagovcogeoportalrestdocumentid=7BBE5F9AEE-1FBC-4C13-822F-
F2CE44AFDD7E7D
9 Buenas praacutecticas para la publicacioacuten de datos
2 Proporcionar una licencia en donde se especifiquen las limitaciones yo restricciones de acceso y uso de los datos
Una licencia entendida como las condiciones legales bajo las cuales estaacute disponible la obra2 es
un instrumento mediante el cual el propietario del dato autoriza o no a los usuarios para que
accedan a su contenido y tambieacuten lo faculta para su utilizacioacuten Existen diferentes tipos de
licencia para la distribucioacuten y explotacioacuten de obras y cuyo propoacutesito es regular las condiciones
de acceso y uso de los datos
Dependiendo el acceso autorizado a los datos las licencias pueden clasificarse en
Privativas o restrictivas Aquellas licencias conocidas como cerradas o no libres donde la mayoriacutea de las veces solo el autor puede usar la obra o en caso contrario se definen condiciones especiacuteficas que se deben cumplir para hacer uso de la informacioacuten
Semilibres Aquellas licencias que requieren autorizaciones para que los usuarios utilicen copien distribuyan o modifiquen su contenido
Libres o abiertas Aquellas licencias que en teacuterminos generales permiten usar distribuir y compartir los datos con muy pocas restricciones
Cuando un dato se publica acompantildeado de su licencia el usuario conoce las condiciones de
acceso uso y distribucioacuten de los datos que estaacute consumiendo de esta forma se garantiza que
los datos se distribuyan seguacuten los intereses de la entidad que los produce y se minimizan los
usos indebidos de los datos por parte de los usuarios
Ahora bien definir la licencia adecuada para cada dato dependeraacute de las condiciones que
establezca la entidad productora de este Revise los ejemplos y defina la licencia maacutes adecuada
para sus datos
Para maacutes informacioacuten consulte el Instructivo para la definicioacuten de licencias de datos
iquestQueacute logro
Que el usuario evaluacutee si puede o no usar mis datos
Que el usuario conozca las condiciones de acceso uso y manejo sobre los datos
disponibles
Dar claridad y potenciar el uso de los datos disponibles
Que el usuario de los reconocimientos respectivos a la entidad productora de los datos
Que se genere valor agregado sobre los datos disponibles en caso de asignar una
licencia abierta
2 Recuperado de httpsopendefinitionorgod21es
10 Buenas praacutecticas para la publicacioacuten de datos
iexclRecomendaciones
Identifique la licencia que mejor se acomode a su modelo de negocio Recuerde que
mediante la Ley 1712 de 2014 se reguloacute el derecho de acceso a la informacioacuten puacuteblica
y se incluyeron los principios de facilitacioacuten gratuidad y divulgacioacuten proactiva de la
informacioacuten
Disponga una licencia para su conjunto de datos a traveacutes de un enlace una copia
incorporada o dentro del metadato
Prefiera el uso de licencias abiertas de este modo sus datos seraacuten utilizados en una
mayor cantidad de productos servicios y mercados
Ejemplo 1
Mundialmente conocidas las licencias Creative Commons3 tienen como objetivo fortalecer a los
creadores para que sean quienes definan los teacuterminos en que sus obras pueden ser usadas queacute
derechos desean entregar y en queacute condiciones lo haraacuten A continuacioacuten encontraraacute los
enlaces de acceso para conocer las condiciones de cada una de las licencias disponibles
CC0 10 httpscreativecommonsorgpublicdomainzero10deedes
CC BY 40 httpscreativecommonsorglicensesby40
CC BY-SA 40 httpscreativecommonsorglicensesby-sa40
CC BY-ND 40 httpscreativecommonsorglicensesby-nd40
CC BY-NC 40 httpscreativecommonsorglicensesby-nc40
CC BY-NC-SA 40
httpscreativecommonsorglicensesby-nc-sa40
Ejemplo 2
Tambieacuten existen las licencias abiertas para datos Open Data Commons4 proporcionadas por la
mundialmente conocida red Open Knowledge Foundation Network ndash OKFN5 puede consultar
las condiciones ingresando a los siguientes enlaces
ODbL 10 httpsopendatacommonsorglicensesodblsummary
PDDL 10 httpsopendatacommonsorglicensespddlsummary
ODC-BY 10 httpsopendatacommonsorglicensesbysummary
3 httpcreativecommonsorg 4 httpopendatacommonsorg 5 httpsokfnorg
11 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 3
El Mapa de referencia para Bogotaacute estaacute publicado en
httpswwwidecagovcoesserviciosmapa-de-referencia bajo las condiciones descritas en la
ldquoLICENCIA ABIERTA O CONDICIONES DE USO PARA DATOS ABIERTOS DE LA INFRAESTRUCTURA
INTEGRADA DE DATOS ESPACIALES PARA EL DISTRITO CAPITAL (IDECA)rdquo
httpswwwidecagovcoeslicenciaabierta
12 Buenas praacutecticas para la publicacioacuten de datos
3 Utilizar vocabularios estandarizados y reutilizables en la estructuracioacuten y publicacioacuten de los datos
Un vocabulario define los conceptos y las relaciones que se utilizan para describir y representar
un aacuterea de intereacutes6 Cuando se publican datos en la Web los vocabularios permiten integrar
datos cuando existen ambiguumledades en los teacuterminos utilizados en los diferentes conjuntos de
datos En la praacutectica un vocabulario es un conjunto de palabras que permiten a dos usuarios
comunicarse entre siacute La efectividad de dicha comunicacioacuten radica en que el significado de una
palabra para el usuario emisor sea el mismo que para el usuario receptor independientemente
de si utilizaron el mismo teacutermino
Cuando se habla de interoperabilidad de datos lo que se espera es que tanto los usuarios
como las aplicaciones informaacuteticas entiendan y comprendan la mayor cantidad de informacioacuten
que estaacuten consumiendo Para conseguir esto las comunidades de datos han identificado
vocablos palabras o teacuterminos de uso comuacuten los cuales cuentan con significados apropiados y
que actualmente se encuentran integrados y estructurados en diferentes estaacutendares
internacionales
Se recomienda utilizar vocabularios de este tipo para estandarizar los datos contenidos en la
informacioacuten publicada
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios Que se reduzca la ambiguumledad en la interpretacioacuten de mis datos Que mis datos sean interoperables Que mis datos sean procesados en entornos nacionales e internacionales Que mis datos puedan ser compartidos e intercambiados entre sistemas Que mis datos sean maacutes confiables
iexclRecomendaciones
Consulte normas locales o vocabularios internacionales para la estructuracioacuten7 de sus
datos
Apropie los vocabularios consultados y adapte sus datos a estos en los casos en que sea
posible
Incluya vocabularios ya definidos y reconocidos internacionalmente cuando vaya a
producir nuevos datos
6 httpswwww3orgstandardssemanticwebontology 7 Estructurar significa ajustar los datos a un esquema fijo
13 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
A continuacioacuten se presentan algunos vocabularios internacionales que puede consultar y
apropiar para optimizar el intercambio de sus datos
Data Catalog Vocabulary (DCAT) httpswwww3orgTRvocab-dcatclass-catalog
FOAF Vocabulary Specification httpxmlnscomfoaf01
ISOTC 211 Geographic informationGeomatics Terminology
httpwwwisotc211orgTerminologyhtm
The RDF Data Cube Vocabulary httpswwww3orgTR2014REC-vocab-data-cube-20140116
ODRL Vocabulary amp Expression 22
httpswwww3orgTR2018REC-odrl-vocab-20180215
HTTP Vocabulary in RDF 10 httpswwww3orgTR2017NOTE-HTTP-in-RDF10-20170202
vCard Ontology - for describing People and Organizations
httpswwww3orgTRvcard-rdf
Ejemplo 2
En el contexto Nacional el Ministerio de Tecnologiacuteas de la Informacioacuten y las Comunicaciones ha
establecido el Lenguaje Comuacuten de Intercambio de como un instrumento de consulta que
contiene la definicioacuten de los elementos de datos conceptualizados por las entidades del
estado La consulta la puede realizar en httplenguajeminticgovco
14 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 3
La especificacioacuten vCard disponible en httpswwww3orgTRvcard-rdf promueve un
vocabulario especiacutefico para describir personas y organizaciones
Uno de los vocablos que describe esta especificacioacuten es la ldquodireccioacuten de entregardquo llamado
dentro del vocabulario como ADR y definido como ldquola direccioacuten del objeto representado en
partes estructuradasrdquo
Ahora bien este vocabulario especifica los componentes de la direccioacuten de entrega para el
objeto asiacute el nombre del paiacutes la localidad el coacutedigo postal la regioacuten y la direccioacuten dada por
viacuteas (calles y carreras en el caso colombiano) Esto quiere decir que cualquiera de los
componentes descritos puede usarse como direccioacuten de entrega vaacutelida ya que son equivalentes
entre siacute
Aunque en el vocabulario la direccioacuten de entrega se llame ADR el usuario de la informacioacuten
entenderaacute que un nombre de paiacutes o un coacutedigo postal pueden interpretarse como ADR
15 Buenas praacutecticas para la publicacioacuten de datos
4 Anonimizar los datos de caraacutecter personal informacioacuten estadiacutestica informacioacuten indirectamente identificable e informacioacuten sensible o confidencial
Anonimizar es el proceso que impide la identificacioacuten de las unidades de estudio que son fuente
para los registros individuales de un conjunto8 de datos o maacutes claro es la aplicacioacuten de teacutecnicas
que permitan expresar un dato relativo a personas eliminando la referencia a su identidad9
Baacutesicamente lo que se busca es reducir los riesgos en el uso y procesamiento de datos
personales evitar la extraccioacuten de registros que identifican a una persona reducir la
combinacioacuten de dos o maacutes registros en una o varias bases de datos para identificar a una
persona y minimizar la deduccioacuten de datos personales partir de uno o varios datos publicados
iquestQueacute informacioacuten debo prioritariamente anonimizar
Datos personales Informacioacuten numeacuterica alfabeacutetica graacutefica fotograacutefica acuacutestica o
cualquier otro tipo susceptible de recogida registro tratamiento y transmisioacuten
concerniente a personas fiacutesicas identificadas o identificables (tales como nombre
apellidos estado civil sexo edad domicilio identificacioacuten personal nuacutemero de
teleacutefono etc)10
Informacioacuten sensible Informacioacuten considerada como estrictamente confidencial
Informacioacuten y caracteriacutesticas referentes a la edad procedencia salud raza religioacuten
ideologiacutea afiliacioacuten finanzas etc se consideran de caraacutecter sensible y requieren de
una proteccioacuten especial11
iquestQueacute logro
Garantizar que mis datos publicados cuentan con medidas de proteccioacuten de datos
personales
Eliminar de manera efectiva el riesgo de re-identificacioacuten
Evitar que el procesamiento de mis datos tenga consecuencias negativas para alguna
persona
Disponer muchos maacutes datos sin invadir la informacioacuten personal
iexclRecomendaciones
Implemente actividades de proteccioacuten de la privacidad de los datos personales antes
de publicarlos
Elimine cualquier identificador directo de la persona (nombre documento de
identidad etc)
8 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 9 httpdleraeesid=2jjMiRi 10 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 11 Ibidem
16 Buenas praacutecticas para la publicacioacuten de datos
Reemplace los identificadores directos por coacutedigos de referencia pseudoacutenimos
(algoritmos AES12 o un hash cifrado HMAC13) coacutedigos arbitrarios o aleatorios
Si reemplazando el identificador directo auacuten es faacutecil identificar a la persona elimine el
dato
Clasifique yo categorice los datos
Redondee los datos numeacutericos hacia arriba o hacia abajo
Evaluacutee antes durante y despueacutes de publicados los datos si la anonimizacioacuten de sus
datos es suficiente y evaluacutee regularmente los riesgos existentes
Para maacutes informacioacuten consulte los Lineamientos para la Anonimizacioacuten de micro datos
Ejemplo 1
Antes de publicar sus datos retire el identificador directo de la persona En este caso
reemplace en nuacutemero de documento que identifica al usuario y reemplaacutecelo por un
consecutivo
Usuario Beneficio Usuario Beneficio
80123456 Subsidio de vivienda Usuario 1 Subsidio de vivienda
51123456 Subsidio de alimentacioacuten Usuario 2 Subsidio de alimentacioacuten
19123456 Subsidio al adulto mayor Usuario 3 Subsidio al adulto mayor
53123456 Subsidio de desempleo Usuario 4 Subsidio de desempleo
Ejemplo 2
Clasifique o categorice sus datos En este ejemplo asigne rangos a la edad de manera tal que el
titular del registro no sea identificable por este dato
Usuario Edad Usuario Rango de edad
Usuario 1 11 antildeos Usuario 1 Entre 10 y 15 antildeos
Usuario 2 22 antildeos Usuario 2 Entre 20 y 25 antildeos
Usuario 3 36 antildeos Usuario 3 Entre 35 y 40 antildeos
Usuario 4 63 antildeos Usuario 4 Entre 60 y 65 antildeos
12 Advanced Encryption Standard puede consultar como ha sido implementado este algoritmo en httpsrevistasudistritaleducoojsindexphpTecnuraarticleview72368892 13 Hash-based Message Authentication Code puede consultar como se crea este cifrado en httpsdocsoraclecomcdE19253-01819-7804wanboottasks2-51indexhtml
17 Buenas praacutecticas para la publicacioacuten de datos
5 Publicar los datos en formatos estaacutendar reutilizables y legibles por aplicaciones informaacuteticas
Un formato puede ser definido como la estructura de un disco dividido en campos y pistas
seguacuten un determinado sistema operativo lo que permite almacenar en eacutel informacioacuten14
baacutesicamente es la forma en que se codifican los datos en un archivo informaacutetico
Actualmente conocemos formatos comunes de almacenamiento como el doc una extensioacuten
de Word que almacena texto y cuyo propietario es la compantildeiacutea Microsoft Pero iquestqueacute pasa si un
usuario quiere abrir un documento doc en un procesador de texto diferente a Word
difiacutecilmente va a poder conocer el contenido de dicho documento sin tener esta licencia
Lo que queremos lograr con la implementacioacuten de esta praacutectica es que todos los usuarios que
encuentren mis datos puedan accederlos sin necesidad de contar con un software o aplicacioacuten
informaacutetica especiacutefica
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos puedan ser extraiacutedos transformados y procesados por aplicaciones
informaacuteticas
Que mis datos puedan ser compartidos e intercambiados entre sistemas
Disminuir los costos y los tiempos en el uso y la transformacioacuten de mis datos
iexclRecomendaciones
Prefiera publicar su conjunto de datos en formatos abiertos o no propietario ya que
estos facilitan el uso re-uso y distribucioacuten de estos Se busca que un mayor nuacutemero de
aplicaciones informaacuteticas pueda extraer leer y transformar los datos generando mayor
uso y re-uso por los usuarios
Disponga sus datos en muacuteltiples formatos con el fin de incrementar el acceso a los
mismos Se busca que el mayor nuacutemero de usuarios pueda utilizar los datos sin tener
que transformarlos primero en su formato preferido
Utilice Web Services para mejorar el intercambio e interoperabilidad de los datos
publicados
14 httpdleraeessrvsearchm=30ampw=formato
18 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
A continuacioacuten encontraraacute extensiones de formato propietario y no propietario prefiera para
la publicacioacuten de sus datos las extensiones de la derecha
FORMATO PROPIETARIO FORMATO NO PROPIETARIO
DOC GDB TXT ASCII Grid KML RDF
XLS DWG CSV GeoJSON DXF XML
PPT SHP JSON GML ODF
Ejemplo 2
Si no fue posible utilizar una extensioacuten de formato no propietario publique sus datos en una
variedad de formatos que le permita al usuario acceder a los datos desde diferentes
aplicaciones informaacuteticas
Ejemplo 3
Para publicar sus datos conozca diferentes tipos de Web Services que viajan en la red utilizando extensiones XML
SOAP httpswwww3orgTRsoap
REST httprestelksteinorg
WMS httpwwwopengeospatialorgstandardswms
WFS httpwwwopengeospatialorgstandardswfs
WCS httpwwwopengeospatialorgstandardswcs
19 Buenas praacutecticas para la publicacioacuten de datos
6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos publicados
Un diccionario estaacute definido como un repertorio en forma de libro o en soporte electroacutenico en el
que se recogen seguacuten un orden determinado las palabras o expresiones de una o maacutes lenguas
o de una materia concreta acompantildeadas de su definicioacuten equivalencia o explicacioacuten15
especiacuteficamente en un diccionario de datos se encuentran los conceptos de los datos y sus
propiedades (atributos dominios asociaciones y operaciones) acompantildeados de una definicioacuten
en donde se identifica el propoacutesito alcance y campo de aplicacioacuten del dato publicado
Lograr que los usuarios de mis datos entiendan la informacioacuten que estaacute publicada le permitiraacute
decidir si satisfacen o no su necesidad y le facilitaraacute la decisioacuten para explotar lo datos
Para maacutes informacioacuten consulte el Instructivo Diccionario de Datos
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que se eviten ambiguumledades en la interpretacioacuten de mis datos
Que mis datos publicados esteacuten unificados y consistentes
Que los usuarios comprendan mejor y dispongan de claridad sobre los conceptos de
mis datos
iexclRecomendaciones
Publique como miacutenimo un diccionario de datos que contenga la caracterizacioacuten del
conjunto de datos producidos por su entidad
Cree el diccionario de datos teniendo en cuenta como miacutenimo la siguiente informacioacuten
Nombre del atributo Nombre que identifica de manera clara un atributo
Definicioacuten Descripcioacuten del atributo
Tipo de dato Tipo de valor del atributo
Unidad de medida Expresa la unidad de medida del atributo
Dominio Determina si el atributo tiene asociado un dominio
15 httpdleraeesw=diccionario
20 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
Para el conjunto de datos ldquoEstablecimientos Educativos en Bogotaacuterdquo publicariacuteamos un
diccionario de datos similar al siguiente
Nombre del atributo Definicioacuten Tipo de dato
Unidad de Medida
Dominio
Coacutedigo del establecimiento
Coacutedigo DANE asignado al Institucioacuten Educativa Decimal
Nombre del establecimiento
Nombre de la Institucioacuten Educativa Cadena de Caracteres
Aacuterea construida del establecimiento
Aacuterea construida de la Institucioacuten Educativa Decimal Metros
cuadrados
Sector
Clasificacioacuten asignada seguacuten la naturaleza juriacutedica la cual define las principales caracteriacutesticas que desde lo juriacutedico - administrativo y tiene que ver con el origen de su creacioacuten
Entero
EESector
No podriacuteamos olvidar detallar el dominio asociado
Atributo Nombre del Dominio Coacutedigo Definicioacuten
EESector
Oficial 1
Es una institucioacuten donde su naturaleza de servicio puacuteblico cultural y su funcioacuten social le es inherente cumpliendo con las disposiciones legales y estatutarias que las rigen donde sus rentas se conservan y se aplican debidamente
Privado 2
Es una institucioacuten constituida como persona juriacutedica de utilidad comuacuten donde sus rentas se conservan y se aplican debidamente y que en todo lo esencial se cumple con la voluntad de sus fundadores
21 Buenas praacutecticas para la publicacioacuten de datos
7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos
Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para
acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que
conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como
cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o
software
En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos
publicados se proporcionen recursos o documentos adicionales que puedan ser consultados
yo descargados traveacutes de enlaces o links de otro sitio Web
Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los
procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los
documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad
entre otros
iquestQueacute logro
Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos
Que los usuarios comprendan mejor mis datos
Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios
iexclRecomendaciones
Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el
horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del
dato
No olvide vincular o registrar esta informacioacuten en el metadato
16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp
22 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos
Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318
Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57
Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30
Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217
Ejemplo 2
La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en
httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos
o Gestioacuten de los humedales
o Poliacutetica de Humedales del Distrito Capital
o Normatividad
o Planes de Manejo Ambiental
o Comiteacute distrital de humedales documentos de consulta normatividad
23 Buenas praacutecticas para la publicacioacuten de datos
8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza
La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten
juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado
Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para
satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas
y especificaciones establecidas
Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades
de estos sin embargo en este aparte citaremos los elementos principales que usted o su
entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad
Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de
los datos espaciales
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que los usuarios hablen bien de mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean maacutes compartidos
Que mis datos sean maacutes confiables
Recomendacioacuten 1
Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten
descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten
corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Suba 200 Tunjuelito 500
Ameacutericas 100
850
Tunjuelito 500
18 httpdleraeesid=6nVpk8P|6nXVL1Z
Campo duplicado
Campo inconsistente
Campo vaciacuteo
24 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 2
Identifique y transforme si es necesario los datos que hayan sido registrados en un formato
diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida
del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de
formatordquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Tunjuelito 5008 Tunjuelito 500
Fontiboacuten 40 Fontiboacuten 430
Tunjuelito 500 Tunjuelito 500
Recomendacioacuten 3
Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos
se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de
clasificacioacutenrdquo
Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad
Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10
Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20
Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40
Recomendacioacuten 4
Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos
correspondan a valores conocidos como verdaderos El elemento de calidad asociado se
denomina ldquoexactitud de atributos cuantitativosrdquo
Localidad Mes Temperatura Localidad Mes Temperatura
Chapinero Enero 7degC Chapinero Enero 7degC
Suba Agosto -15degC Suba Agosto 15degC
Tunjuelito Abril 60degC Tunjuelito Abril 16degC
Clasificacioacuten inconsistente
Formato inconsistente
Valor inconsistente
25 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 5
Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por
ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que
las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad
asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo
Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro
00 20580101 00 20180101
01 20180102 01 20180102
126 20510403 126 20180103
20 20180104 20 20180104
Recomendacioacuten 6
Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes
de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se
denomina ldquoconsistencia temporalrdquo
Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio
Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231
Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231
Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112
Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112
Recomendacioacuten 7
Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta
corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud
posicionalrdquo
Eventos Deportivos Lugar Eventos Deportivos Lugar
Evento 1 AK 30 25 90 Evento 1 AK 30 25 90
Evento 2 AC 63 215 20 Evento 2 Parque La Florida
Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar
Fecha
inconsistente
Fechas no secuenciales
Lugar inexistente
26 Buenas praacutecticas para la publicacioacuten de datos
9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten
El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de
alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una
institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las
variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a
cabo los traacutemites de una entidad etc
Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un
espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados
Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten
asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un
establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario
identificar la localizacioacuten del dato publicado
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean puedan compartir en maacutes plataformas
Que los usuarios puedan visualizar mis datos en un mapa
iexclRecomendaciones
Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o
lugares geograacuteficos
Ejemplo 1
Incluya direcciones que permitan localizar espacialmente sus datos
Programa Direccioacuten
Registro de atencioacuten a la ciudadaniacutea CL 138 108 16
Centro de autocuidado KR 18 D 77 A 11 SUR
Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46
Centro de autocuidado KR 18 D 73 A 33 SUR
19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico
27 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 2
Utilice coordenadas para indicar la ubicacioacuten de sus datos
EPS Coordenada X Coordenada Y
EPS Convida 9087496334 1051342164
Capital Salud EPS 986321006 954875808
EPS Famisanar 9742508812 8837031501
Aliansalud EPS 9716943356 9659706891
Salud Total EPS 9215624975 9625189518
Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro
de su metadato el Sistema de referencia empleado
MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686
MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116
MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458
Ejemplo 3
Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute
Usuario Vacunado Lugar de Vacunacioacuten
Usuario 1 BOSQUE IZQUIERDO
Usuario 2 LAGUNITAS URBANO
Usuario 3 LA CAPUCHINA
Usuario 4 SAN JOSE SUR
Usuario 5 VENECIA
28 Buenas praacutecticas para la publicacioacuten de datos
10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado
Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el
dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los
usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la
citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el
formato de este
En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero
de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de
su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la
informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado
y reconocido faacutecilmente entre los demaacutes datos
Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de
identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por
cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta
gestioacuten y reutilizacioacuten de sus datos
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean compartidos en maacutes plataformas
Que mis datos puedan vincularse a otros datos en el entorno Web
Que mis datos sean encontrados usados y citados inequiacutevocamente
Garantizar y monitorear la reutilizacioacuten de mis datos
Reducir del uso erroacuteneo de mis datos
iexclRecomendaciones
Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar
Utilice siempre el identificador asignado para publicar sus datos
29 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos
httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la
creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la
asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten
de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito
garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar
descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando
asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten
geograacutefica
Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems
publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace
referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades
territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el
planeamiento del suelo urbano de expansioacuten y ruralrdquo
30 Buenas praacutecticas para la publicacioacuten de datos
OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS
Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten
Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado
Nivel Baacutesico
En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)
Nivel Intermedio
Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)
Nivel Avanzado
Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)
31 Buenas praacutecticas para la publicacioacuten de datos
REFERENCIAS
Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best
Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp
Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices
for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp
Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington
Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec
Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI
Recommendation URL httpdublincoreorgdocumentsdcmi-terms
Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C
Recommendation URL httpswwww3orgTRvocab-dcat
ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de
2014 International Standard
ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers
noviembre de 2009 International Standard
ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013
International Standard
Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best
Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp
T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax
Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986
World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg
W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second
Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-
overview
W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado
el 12 de septiembre de 2018
3 Buenas praacutecticas para la publicacioacuten de datos
CONTENIDO
INTRODUCCIOacuteN 4
OBJETIVO 5
AUDIENCIA 5
ALCANCE 5
BUENAS PRAacuteCTICAS PARA LA PUBLICACIOacuteN DE DATOS 6
1 Proporcionar metadatos asociados con los datos publicados Estos metadatos
permitiraacuten conocer las caracteriacutesticas de los datos y deberaacuten ser interpretables tanto por
usuarios como por aplicaciones informaacuteticas 6
2 Proporcionar una licencia en donde se especifiquen las limitaciones yo restricciones
de acceso y uso de los datos 9
3 Utilizar vocabularios estandarizados y reutilizables en la estructuracioacuten y publicacioacuten
tanto de datos 12
4 Anonimizar los datos de caraacutecter personal informacioacuten estadiacutestica informacioacuten
indirectamente identificable e informacioacuten sensible o confidencial 15
5 Publicar los datos en formatos estaacutendar reutilizables y legibles por aplicaciones
informaacuteticas 17
6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos
publicados 19
7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos 21
8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su
confianza 23
9 Incorporar el componente geograacutefico en los datos publicados para optimizar su
comprensioacuten uso re-uso y visualizacioacuten 26
10 Asignar un identificador uacutenico que permita aumentar la consulta uso e
interoperabilidad del dato publicado 28
OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS 30
REFERENCIAS 31
4 Buenas praacutecticas para la publicacioacuten de datos
INTRODUCCIOacuteN
La Infraestructura de Datos Espaciales del Distrito Capital - IDECA es el instrumento que
permite a las autoridades del Distrito identificar de manera constante la condicioacuten movilidad
dinaacutemica expansioacuten proceso proyectos y necesidades de la ciudad de Bogotaacute a traveacutes de la
obtencioacuten uso y disposicioacuten de informacioacuten georreferenciada para atender a la ciudadaniacutea y
conseguir la maacutes acertada toma de decisiones en beneficio de la ciudad y de sus habitantes
La obtencioacuten de datos la realiza cada entidad en el desarrollo de sus actividades misionales y el
uso de los datos producidos dependeraacute del propoacutesito del dato de la finalidad especiacutefica del
usuario y de coacutemo y cuando esteacuten disponibles los datos
IDECA gestiona la disposicioacuten de los datos por eso busca que los datos publicados por las
entidades pertenecientes a la Administracioacuten Distrital sin importar la plataforma de publicacioacuten
cuenten con altos estaacutendares de calidad interoperabilidad y documentacioacuten que promuevan y
faciliten el acceso comprensioacuten uso y re-uso de estos por cualquier usuario
Para encontrar y acceder los datos disponibles en el entorno Web los usuarios no
especializados tienen algunas dificultades ya que encuentran contenidos duplicados
desactualizados e inconsistentes lo que ha generado para los publicadores el reto de
garantizar el descubrimiento acceso calidad e interoperabilidad de sus datos
Es importante mencionar que si se publican datos uacutetiles novedosos actualizados y de calidad
no solo aumenta el nuacutemero de usuarios que los reutilicen y distribuyan sino que aumenta la
credibilidad y confianza en los datos Adicionalmente se disminuyen los costos y tiempos en la
generacioacuten de los datos y se reducen los usos indebidos de los mismos
Esta guiacutea pretende que las entidades o responsables de publicar y disponer los datos lo hagan
con altos estaacutendares de calidad debidamente documentados en formatos interoperables y
que satisfagan necesidades reales de los usuarios para que estos uacuteltimos puedan encontrarlos
accederlos comprenderlos y reutilizarlos
IDECA ha plasmado en este documento las mejores praacutecticas de publicacioacuten de datos en la
Web que cubren aspectos como el formato el acceso la calidad los metadatos el
licenciamiento y el origen de los datos
Se invita al lector a navegar faacutecilmente en el documento ya que este presenta sin un orden
determinado las mejores praacutecticas de publicacioacuten de datos explicadas en
iquestQueacute logro Los beneficios que se obtienen al aplicar la buena praacutectica
iexclRecomendaciones Las herramientas baacutesicas para conseguir el objetivo de la buena praacutectica
Ejemplos Utilizando conjuntos de datos reales de las entidades oficiales del Distrito Capital se visualiza la aplicacioacuten de la buena praacutectica
5 Buenas praacutecticas para la publicacioacuten de datos
OBJETIVO
Promover en las entidades de la Administracioacuten Distrital y sus responsables la apropiacioacuten y
adopcioacuten de las mejores praacutecticas de publicacioacuten de datos con el fin de aumentar el valor en la
informacioacuten producida dentro de su quehacer institucional
AUDIENCIA
Este documento estaacute dirigido a las entidades y personas responsables de la Administracioacuten
Distrital que publican o desean publicar datos oficiales de Bogotaacute a traveacutes de cualquier
plataforma de datos
ALCANCE
Las mejores praacutecticas expuestas en este documento estaacuten encaminadas a que los datos
publicados a traveacutes de plataformas oficiales cumplan con unos requisitos miacutenimos de calidad
documentacioacuten interoperabilidad y licenciamiento dentro del proceso de publicacioacuten
Buscamos con esta guiacutea de buenas praacutecticas garantizar la apropiacioacuten de cuatro principios
Que los datos sean descubiertos es decir que cualquier usuario en el entorno Web los
pueda encontrar faacutecilmente
Que los datos sean accesibles quiere decir que no presenten restricciones de acceso ni
que se encuentren cifrados
Que los datos sean interoperables en otras palabras que sean publicados en formatos
estandarizados que permitan ser procesados por cualquier software
Que los datos sean reutilizables es decir que estos sean utilizados en la mayor cantidad
de productos servicios y mercados
Debe tenerse en cuenta que IDECA expone en este documento las mejores praacutecticas de
publicacioacuten de datos identificadas con base a la experiencia adquirida en la disposicioacuten datos
de los uacuteltimos antildeos sin embargo existe una amplia gama de otras buenas praacutecticas de
publicacioacuten que no han sido incluidas en el presente texto y en consecuencia se invita al lector
a apropiarse de las praacutecticas expuestas y a dejar abierta la posibilidad de complementar la
informacioacuten presentada con otras fuentes
6 Buenas praacutecticas para la publicacioacuten de datos
BUENAS PRAacuteCTICAS PARA LA PUBLICACIOacuteN DE DATOS
1 Proporcionar metadatos asociados con los datos publicados Estos metadatos permitiraacuten conocer las caracteriacutesticas de los datos y deberaacuten ser interpretables tanto por usuarios como por aplicaciones informaacuteticas
Un metadato entendido como la informacioacuten acerca de un recurso1 es un dato con muchos
elementos que le permiten al usuario conocer desde la visioacuten del productor las caracteriacutesticas
propias de los datos publicados tales como las fechas de creacioacuten y actualizacioacuten el canal de
acceso la calidad del dato las condiciones de uso quieacuten lo produjo quieacuten lo distribuye etc
esto quiere decir que el metadato explica el dato en eacutel estaacute contenida toda la informacioacuten
relevante del dato
En la vida cotidiana la ceacutedula de ciudadaniacutea es el documento que contiene la informacioacuten
miacutenima de las personas (nombre sexo fecha de nacimiento GS RH estatura lugar de
nacimiento) esta informacioacuten permite que el ciudadano se identifique en cualquier lugar del
territorio nacional ante otras personas o autoridades que requieran conocerlo
Con los datos el tratamiento es similar el dato corresponde a la persona y el metadato
corresponde a la ceacutedula de ciudadaniacutea Asiacute como en Colombia todo ciudadano debe portar su
documento de identificacioacuten en el entorno Web todo dato debe portar su metadato en otras
palabras el metadato es parte integral del dato y existe entre ambos un viacutenculo inseparable
Los datos siempre deberaacuten publicarse con su respectivo metadato este uacuteltimo deberaacute contar
con informacioacuten completa y estandarizada que garantice que los usuarios encuentren
conozcan y utilicen los datos que producimos
Recuerde que la publicacioacuten del metadato es igual de importante que la publicacioacuten del
dato
iquestQueacute logro
Al publicar datos en conjunto con su metadato obtengo
Que mis datos sean encontrados y utilizados por maacutes usuarios Que los usuarios logren una correcta interpretacioacuten de la naturaleza calidad y
distribucioacuten de mis datos
Que mis datos sean entendidos evaluados y retroalimentados por maacutes usuarios
Que mis datos puedan ser compartidos e intercambiados entre sistemas
Que los motores de buacutesqueda encuentren mis datos publicados
Que las aplicaciones informaacuteticas procesen mejor y en mayor cantidad mis datos
1 ISO 19115-12014 410
7 Buenas praacutecticas para la publicacioacuten de datos
iexclRecomendaciones
Disponga metadatos suficientes que permitan a los usuarios tener la informacioacuten
correcta para decidir si el dato publicado satisface o no sus necesidades
Incluya en sus metadatos la ubicacioacuten del dato a traveacutes de la descripcioacuten del lugar
(localidad parque riacuteo etc) o a traveacutes de localizacioacuten por coordenadas geograacuteficas x e
y
Publique sus metadatos como una paacutegina Web HTML (HyperText Markup Language) o
simplemente como un archivo de texto separado
Disponga sus metadatos en el formato baacutesico de intercambio XML (Extensible Markup
Language) o en formatos estaacutendar maacutes sofisticados como JSON (JavaScript Object
Notation)
Al igual que los datos puede publicar los metadatos en muacuteltiples formatos desde la
misma URL
Tenga en cuenta que IDECA a partir de estaacutendares internacionales ha definido los
elementos miacutenimos que debe contener el metadato y que estos pueden ser utilizados
en la publicacioacuten de sus metadatos para facilitar el intercambio de estos
Figura 1 Secciones del Perfil de Metadatos IDECA
Para maacutes informacioacuten consulte la Cartilla para la creacioacuten de metadatos geograacuteficos en
Bogotaacute Distrito Capital
8 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
En la siguiente URL se observa un metadato dispuesto para que los usuarios puedan consultar
faacutecilmente la informacioacuten asociada al dato publicado (Desarrollo Econoacutemico Rural Bogotaacute
DC)
httpmetadatosidecagovcogeoportalcatalogsearchresourcedetailspageuuid=A8AB6E
7A-55FB-40DA-85E1-0AA6B4FE6CE3
Ejemplo 2
En la siguiente URL estaacute disponible el metadato de un nivel de informacioacuten dispuesto por la
Unidad Administrativa Especial de Catastro Distrital ndash UAECD ndash en formato XML (legible por
aplicaciones informaacuteticas
httpmetadatosidecagovcogeoportalrestdocumentid=7BBE5F9AEE-1FBC-4C13-822F-
F2CE44AFDD7E7D
9 Buenas praacutecticas para la publicacioacuten de datos
2 Proporcionar una licencia en donde se especifiquen las limitaciones yo restricciones de acceso y uso de los datos
Una licencia entendida como las condiciones legales bajo las cuales estaacute disponible la obra2 es
un instrumento mediante el cual el propietario del dato autoriza o no a los usuarios para que
accedan a su contenido y tambieacuten lo faculta para su utilizacioacuten Existen diferentes tipos de
licencia para la distribucioacuten y explotacioacuten de obras y cuyo propoacutesito es regular las condiciones
de acceso y uso de los datos
Dependiendo el acceso autorizado a los datos las licencias pueden clasificarse en
Privativas o restrictivas Aquellas licencias conocidas como cerradas o no libres donde la mayoriacutea de las veces solo el autor puede usar la obra o en caso contrario se definen condiciones especiacuteficas que se deben cumplir para hacer uso de la informacioacuten
Semilibres Aquellas licencias que requieren autorizaciones para que los usuarios utilicen copien distribuyan o modifiquen su contenido
Libres o abiertas Aquellas licencias que en teacuterminos generales permiten usar distribuir y compartir los datos con muy pocas restricciones
Cuando un dato se publica acompantildeado de su licencia el usuario conoce las condiciones de
acceso uso y distribucioacuten de los datos que estaacute consumiendo de esta forma se garantiza que
los datos se distribuyan seguacuten los intereses de la entidad que los produce y se minimizan los
usos indebidos de los datos por parte de los usuarios
Ahora bien definir la licencia adecuada para cada dato dependeraacute de las condiciones que
establezca la entidad productora de este Revise los ejemplos y defina la licencia maacutes adecuada
para sus datos
Para maacutes informacioacuten consulte el Instructivo para la definicioacuten de licencias de datos
iquestQueacute logro
Que el usuario evaluacutee si puede o no usar mis datos
Que el usuario conozca las condiciones de acceso uso y manejo sobre los datos
disponibles
Dar claridad y potenciar el uso de los datos disponibles
Que el usuario de los reconocimientos respectivos a la entidad productora de los datos
Que se genere valor agregado sobre los datos disponibles en caso de asignar una
licencia abierta
2 Recuperado de httpsopendefinitionorgod21es
10 Buenas praacutecticas para la publicacioacuten de datos
iexclRecomendaciones
Identifique la licencia que mejor se acomode a su modelo de negocio Recuerde que
mediante la Ley 1712 de 2014 se reguloacute el derecho de acceso a la informacioacuten puacuteblica
y se incluyeron los principios de facilitacioacuten gratuidad y divulgacioacuten proactiva de la
informacioacuten
Disponga una licencia para su conjunto de datos a traveacutes de un enlace una copia
incorporada o dentro del metadato
Prefiera el uso de licencias abiertas de este modo sus datos seraacuten utilizados en una
mayor cantidad de productos servicios y mercados
Ejemplo 1
Mundialmente conocidas las licencias Creative Commons3 tienen como objetivo fortalecer a los
creadores para que sean quienes definan los teacuterminos en que sus obras pueden ser usadas queacute
derechos desean entregar y en queacute condiciones lo haraacuten A continuacioacuten encontraraacute los
enlaces de acceso para conocer las condiciones de cada una de las licencias disponibles
CC0 10 httpscreativecommonsorgpublicdomainzero10deedes
CC BY 40 httpscreativecommonsorglicensesby40
CC BY-SA 40 httpscreativecommonsorglicensesby-sa40
CC BY-ND 40 httpscreativecommonsorglicensesby-nd40
CC BY-NC 40 httpscreativecommonsorglicensesby-nc40
CC BY-NC-SA 40
httpscreativecommonsorglicensesby-nc-sa40
Ejemplo 2
Tambieacuten existen las licencias abiertas para datos Open Data Commons4 proporcionadas por la
mundialmente conocida red Open Knowledge Foundation Network ndash OKFN5 puede consultar
las condiciones ingresando a los siguientes enlaces
ODbL 10 httpsopendatacommonsorglicensesodblsummary
PDDL 10 httpsopendatacommonsorglicensespddlsummary
ODC-BY 10 httpsopendatacommonsorglicensesbysummary
3 httpcreativecommonsorg 4 httpopendatacommonsorg 5 httpsokfnorg
11 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 3
El Mapa de referencia para Bogotaacute estaacute publicado en
httpswwwidecagovcoesserviciosmapa-de-referencia bajo las condiciones descritas en la
ldquoLICENCIA ABIERTA O CONDICIONES DE USO PARA DATOS ABIERTOS DE LA INFRAESTRUCTURA
INTEGRADA DE DATOS ESPACIALES PARA EL DISTRITO CAPITAL (IDECA)rdquo
httpswwwidecagovcoeslicenciaabierta
12 Buenas praacutecticas para la publicacioacuten de datos
3 Utilizar vocabularios estandarizados y reutilizables en la estructuracioacuten y publicacioacuten de los datos
Un vocabulario define los conceptos y las relaciones que se utilizan para describir y representar
un aacuterea de intereacutes6 Cuando se publican datos en la Web los vocabularios permiten integrar
datos cuando existen ambiguumledades en los teacuterminos utilizados en los diferentes conjuntos de
datos En la praacutectica un vocabulario es un conjunto de palabras que permiten a dos usuarios
comunicarse entre siacute La efectividad de dicha comunicacioacuten radica en que el significado de una
palabra para el usuario emisor sea el mismo que para el usuario receptor independientemente
de si utilizaron el mismo teacutermino
Cuando se habla de interoperabilidad de datos lo que se espera es que tanto los usuarios
como las aplicaciones informaacuteticas entiendan y comprendan la mayor cantidad de informacioacuten
que estaacuten consumiendo Para conseguir esto las comunidades de datos han identificado
vocablos palabras o teacuterminos de uso comuacuten los cuales cuentan con significados apropiados y
que actualmente se encuentran integrados y estructurados en diferentes estaacutendares
internacionales
Se recomienda utilizar vocabularios de este tipo para estandarizar los datos contenidos en la
informacioacuten publicada
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios Que se reduzca la ambiguumledad en la interpretacioacuten de mis datos Que mis datos sean interoperables Que mis datos sean procesados en entornos nacionales e internacionales Que mis datos puedan ser compartidos e intercambiados entre sistemas Que mis datos sean maacutes confiables
iexclRecomendaciones
Consulte normas locales o vocabularios internacionales para la estructuracioacuten7 de sus
datos
Apropie los vocabularios consultados y adapte sus datos a estos en los casos en que sea
posible
Incluya vocabularios ya definidos y reconocidos internacionalmente cuando vaya a
producir nuevos datos
6 httpswwww3orgstandardssemanticwebontology 7 Estructurar significa ajustar los datos a un esquema fijo
13 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
A continuacioacuten se presentan algunos vocabularios internacionales que puede consultar y
apropiar para optimizar el intercambio de sus datos
Data Catalog Vocabulary (DCAT) httpswwww3orgTRvocab-dcatclass-catalog
FOAF Vocabulary Specification httpxmlnscomfoaf01
ISOTC 211 Geographic informationGeomatics Terminology
httpwwwisotc211orgTerminologyhtm
The RDF Data Cube Vocabulary httpswwww3orgTR2014REC-vocab-data-cube-20140116
ODRL Vocabulary amp Expression 22
httpswwww3orgTR2018REC-odrl-vocab-20180215
HTTP Vocabulary in RDF 10 httpswwww3orgTR2017NOTE-HTTP-in-RDF10-20170202
vCard Ontology - for describing People and Organizations
httpswwww3orgTRvcard-rdf
Ejemplo 2
En el contexto Nacional el Ministerio de Tecnologiacuteas de la Informacioacuten y las Comunicaciones ha
establecido el Lenguaje Comuacuten de Intercambio de como un instrumento de consulta que
contiene la definicioacuten de los elementos de datos conceptualizados por las entidades del
estado La consulta la puede realizar en httplenguajeminticgovco
14 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 3
La especificacioacuten vCard disponible en httpswwww3orgTRvcard-rdf promueve un
vocabulario especiacutefico para describir personas y organizaciones
Uno de los vocablos que describe esta especificacioacuten es la ldquodireccioacuten de entregardquo llamado
dentro del vocabulario como ADR y definido como ldquola direccioacuten del objeto representado en
partes estructuradasrdquo
Ahora bien este vocabulario especifica los componentes de la direccioacuten de entrega para el
objeto asiacute el nombre del paiacutes la localidad el coacutedigo postal la regioacuten y la direccioacuten dada por
viacuteas (calles y carreras en el caso colombiano) Esto quiere decir que cualquiera de los
componentes descritos puede usarse como direccioacuten de entrega vaacutelida ya que son equivalentes
entre siacute
Aunque en el vocabulario la direccioacuten de entrega se llame ADR el usuario de la informacioacuten
entenderaacute que un nombre de paiacutes o un coacutedigo postal pueden interpretarse como ADR
15 Buenas praacutecticas para la publicacioacuten de datos
4 Anonimizar los datos de caraacutecter personal informacioacuten estadiacutestica informacioacuten indirectamente identificable e informacioacuten sensible o confidencial
Anonimizar es el proceso que impide la identificacioacuten de las unidades de estudio que son fuente
para los registros individuales de un conjunto8 de datos o maacutes claro es la aplicacioacuten de teacutecnicas
que permitan expresar un dato relativo a personas eliminando la referencia a su identidad9
Baacutesicamente lo que se busca es reducir los riesgos en el uso y procesamiento de datos
personales evitar la extraccioacuten de registros que identifican a una persona reducir la
combinacioacuten de dos o maacutes registros en una o varias bases de datos para identificar a una
persona y minimizar la deduccioacuten de datos personales partir de uno o varios datos publicados
iquestQueacute informacioacuten debo prioritariamente anonimizar
Datos personales Informacioacuten numeacuterica alfabeacutetica graacutefica fotograacutefica acuacutestica o
cualquier otro tipo susceptible de recogida registro tratamiento y transmisioacuten
concerniente a personas fiacutesicas identificadas o identificables (tales como nombre
apellidos estado civil sexo edad domicilio identificacioacuten personal nuacutemero de
teleacutefono etc)10
Informacioacuten sensible Informacioacuten considerada como estrictamente confidencial
Informacioacuten y caracteriacutesticas referentes a la edad procedencia salud raza religioacuten
ideologiacutea afiliacioacuten finanzas etc se consideran de caraacutecter sensible y requieren de
una proteccioacuten especial11
iquestQueacute logro
Garantizar que mis datos publicados cuentan con medidas de proteccioacuten de datos
personales
Eliminar de manera efectiva el riesgo de re-identificacioacuten
Evitar que el procesamiento de mis datos tenga consecuencias negativas para alguna
persona
Disponer muchos maacutes datos sin invadir la informacioacuten personal
iexclRecomendaciones
Implemente actividades de proteccioacuten de la privacidad de los datos personales antes
de publicarlos
Elimine cualquier identificador directo de la persona (nombre documento de
identidad etc)
8 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 9 httpdleraeesid=2jjMiRi 10 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 11 Ibidem
16 Buenas praacutecticas para la publicacioacuten de datos
Reemplace los identificadores directos por coacutedigos de referencia pseudoacutenimos
(algoritmos AES12 o un hash cifrado HMAC13) coacutedigos arbitrarios o aleatorios
Si reemplazando el identificador directo auacuten es faacutecil identificar a la persona elimine el
dato
Clasifique yo categorice los datos
Redondee los datos numeacutericos hacia arriba o hacia abajo
Evaluacutee antes durante y despueacutes de publicados los datos si la anonimizacioacuten de sus
datos es suficiente y evaluacutee regularmente los riesgos existentes
Para maacutes informacioacuten consulte los Lineamientos para la Anonimizacioacuten de micro datos
Ejemplo 1
Antes de publicar sus datos retire el identificador directo de la persona En este caso
reemplace en nuacutemero de documento que identifica al usuario y reemplaacutecelo por un
consecutivo
Usuario Beneficio Usuario Beneficio
80123456 Subsidio de vivienda Usuario 1 Subsidio de vivienda
51123456 Subsidio de alimentacioacuten Usuario 2 Subsidio de alimentacioacuten
19123456 Subsidio al adulto mayor Usuario 3 Subsidio al adulto mayor
53123456 Subsidio de desempleo Usuario 4 Subsidio de desempleo
Ejemplo 2
Clasifique o categorice sus datos En este ejemplo asigne rangos a la edad de manera tal que el
titular del registro no sea identificable por este dato
Usuario Edad Usuario Rango de edad
Usuario 1 11 antildeos Usuario 1 Entre 10 y 15 antildeos
Usuario 2 22 antildeos Usuario 2 Entre 20 y 25 antildeos
Usuario 3 36 antildeos Usuario 3 Entre 35 y 40 antildeos
Usuario 4 63 antildeos Usuario 4 Entre 60 y 65 antildeos
12 Advanced Encryption Standard puede consultar como ha sido implementado este algoritmo en httpsrevistasudistritaleducoojsindexphpTecnuraarticleview72368892 13 Hash-based Message Authentication Code puede consultar como se crea este cifrado en httpsdocsoraclecomcdE19253-01819-7804wanboottasks2-51indexhtml
17 Buenas praacutecticas para la publicacioacuten de datos
5 Publicar los datos en formatos estaacutendar reutilizables y legibles por aplicaciones informaacuteticas
Un formato puede ser definido como la estructura de un disco dividido en campos y pistas
seguacuten un determinado sistema operativo lo que permite almacenar en eacutel informacioacuten14
baacutesicamente es la forma en que se codifican los datos en un archivo informaacutetico
Actualmente conocemos formatos comunes de almacenamiento como el doc una extensioacuten
de Word que almacena texto y cuyo propietario es la compantildeiacutea Microsoft Pero iquestqueacute pasa si un
usuario quiere abrir un documento doc en un procesador de texto diferente a Word
difiacutecilmente va a poder conocer el contenido de dicho documento sin tener esta licencia
Lo que queremos lograr con la implementacioacuten de esta praacutectica es que todos los usuarios que
encuentren mis datos puedan accederlos sin necesidad de contar con un software o aplicacioacuten
informaacutetica especiacutefica
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos puedan ser extraiacutedos transformados y procesados por aplicaciones
informaacuteticas
Que mis datos puedan ser compartidos e intercambiados entre sistemas
Disminuir los costos y los tiempos en el uso y la transformacioacuten de mis datos
iexclRecomendaciones
Prefiera publicar su conjunto de datos en formatos abiertos o no propietario ya que
estos facilitan el uso re-uso y distribucioacuten de estos Se busca que un mayor nuacutemero de
aplicaciones informaacuteticas pueda extraer leer y transformar los datos generando mayor
uso y re-uso por los usuarios
Disponga sus datos en muacuteltiples formatos con el fin de incrementar el acceso a los
mismos Se busca que el mayor nuacutemero de usuarios pueda utilizar los datos sin tener
que transformarlos primero en su formato preferido
Utilice Web Services para mejorar el intercambio e interoperabilidad de los datos
publicados
14 httpdleraeessrvsearchm=30ampw=formato
18 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
A continuacioacuten encontraraacute extensiones de formato propietario y no propietario prefiera para
la publicacioacuten de sus datos las extensiones de la derecha
FORMATO PROPIETARIO FORMATO NO PROPIETARIO
DOC GDB TXT ASCII Grid KML RDF
XLS DWG CSV GeoJSON DXF XML
PPT SHP JSON GML ODF
Ejemplo 2
Si no fue posible utilizar una extensioacuten de formato no propietario publique sus datos en una
variedad de formatos que le permita al usuario acceder a los datos desde diferentes
aplicaciones informaacuteticas
Ejemplo 3
Para publicar sus datos conozca diferentes tipos de Web Services que viajan en la red utilizando extensiones XML
SOAP httpswwww3orgTRsoap
REST httprestelksteinorg
WMS httpwwwopengeospatialorgstandardswms
WFS httpwwwopengeospatialorgstandardswfs
WCS httpwwwopengeospatialorgstandardswcs
19 Buenas praacutecticas para la publicacioacuten de datos
6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos publicados
Un diccionario estaacute definido como un repertorio en forma de libro o en soporte electroacutenico en el
que se recogen seguacuten un orden determinado las palabras o expresiones de una o maacutes lenguas
o de una materia concreta acompantildeadas de su definicioacuten equivalencia o explicacioacuten15
especiacuteficamente en un diccionario de datos se encuentran los conceptos de los datos y sus
propiedades (atributos dominios asociaciones y operaciones) acompantildeados de una definicioacuten
en donde se identifica el propoacutesito alcance y campo de aplicacioacuten del dato publicado
Lograr que los usuarios de mis datos entiendan la informacioacuten que estaacute publicada le permitiraacute
decidir si satisfacen o no su necesidad y le facilitaraacute la decisioacuten para explotar lo datos
Para maacutes informacioacuten consulte el Instructivo Diccionario de Datos
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que se eviten ambiguumledades en la interpretacioacuten de mis datos
Que mis datos publicados esteacuten unificados y consistentes
Que los usuarios comprendan mejor y dispongan de claridad sobre los conceptos de
mis datos
iexclRecomendaciones
Publique como miacutenimo un diccionario de datos que contenga la caracterizacioacuten del
conjunto de datos producidos por su entidad
Cree el diccionario de datos teniendo en cuenta como miacutenimo la siguiente informacioacuten
Nombre del atributo Nombre que identifica de manera clara un atributo
Definicioacuten Descripcioacuten del atributo
Tipo de dato Tipo de valor del atributo
Unidad de medida Expresa la unidad de medida del atributo
Dominio Determina si el atributo tiene asociado un dominio
15 httpdleraeesw=diccionario
20 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
Para el conjunto de datos ldquoEstablecimientos Educativos en Bogotaacuterdquo publicariacuteamos un
diccionario de datos similar al siguiente
Nombre del atributo Definicioacuten Tipo de dato
Unidad de Medida
Dominio
Coacutedigo del establecimiento
Coacutedigo DANE asignado al Institucioacuten Educativa Decimal
Nombre del establecimiento
Nombre de la Institucioacuten Educativa Cadena de Caracteres
Aacuterea construida del establecimiento
Aacuterea construida de la Institucioacuten Educativa Decimal Metros
cuadrados
Sector
Clasificacioacuten asignada seguacuten la naturaleza juriacutedica la cual define las principales caracteriacutesticas que desde lo juriacutedico - administrativo y tiene que ver con el origen de su creacioacuten
Entero
EESector
No podriacuteamos olvidar detallar el dominio asociado
Atributo Nombre del Dominio Coacutedigo Definicioacuten
EESector
Oficial 1
Es una institucioacuten donde su naturaleza de servicio puacuteblico cultural y su funcioacuten social le es inherente cumpliendo con las disposiciones legales y estatutarias que las rigen donde sus rentas se conservan y se aplican debidamente
Privado 2
Es una institucioacuten constituida como persona juriacutedica de utilidad comuacuten donde sus rentas se conservan y se aplican debidamente y que en todo lo esencial se cumple con la voluntad de sus fundadores
21 Buenas praacutecticas para la publicacioacuten de datos
7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos
Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para
acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que
conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como
cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o
software
En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos
publicados se proporcionen recursos o documentos adicionales que puedan ser consultados
yo descargados traveacutes de enlaces o links de otro sitio Web
Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los
procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los
documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad
entre otros
iquestQueacute logro
Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos
Que los usuarios comprendan mejor mis datos
Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios
iexclRecomendaciones
Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el
horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del
dato
No olvide vincular o registrar esta informacioacuten en el metadato
16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp
22 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos
Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318
Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57
Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30
Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217
Ejemplo 2
La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en
httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos
o Gestioacuten de los humedales
o Poliacutetica de Humedales del Distrito Capital
o Normatividad
o Planes de Manejo Ambiental
o Comiteacute distrital de humedales documentos de consulta normatividad
23 Buenas praacutecticas para la publicacioacuten de datos
8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza
La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten
juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado
Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para
satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas
y especificaciones establecidas
Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades
de estos sin embargo en este aparte citaremos los elementos principales que usted o su
entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad
Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de
los datos espaciales
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que los usuarios hablen bien de mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean maacutes compartidos
Que mis datos sean maacutes confiables
Recomendacioacuten 1
Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten
descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten
corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Suba 200 Tunjuelito 500
Ameacutericas 100
850
Tunjuelito 500
18 httpdleraeesid=6nVpk8P|6nXVL1Z
Campo duplicado
Campo inconsistente
Campo vaciacuteo
24 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 2
Identifique y transforme si es necesario los datos que hayan sido registrados en un formato
diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida
del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de
formatordquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Tunjuelito 5008 Tunjuelito 500
Fontiboacuten 40 Fontiboacuten 430
Tunjuelito 500 Tunjuelito 500
Recomendacioacuten 3
Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos
se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de
clasificacioacutenrdquo
Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad
Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10
Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20
Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40
Recomendacioacuten 4
Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos
correspondan a valores conocidos como verdaderos El elemento de calidad asociado se
denomina ldquoexactitud de atributos cuantitativosrdquo
Localidad Mes Temperatura Localidad Mes Temperatura
Chapinero Enero 7degC Chapinero Enero 7degC
Suba Agosto -15degC Suba Agosto 15degC
Tunjuelito Abril 60degC Tunjuelito Abril 16degC
Clasificacioacuten inconsistente
Formato inconsistente
Valor inconsistente
25 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 5
Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por
ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que
las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad
asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo
Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro
00 20580101 00 20180101
01 20180102 01 20180102
126 20510403 126 20180103
20 20180104 20 20180104
Recomendacioacuten 6
Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes
de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se
denomina ldquoconsistencia temporalrdquo
Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio
Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231
Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231
Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112
Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112
Recomendacioacuten 7
Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta
corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud
posicionalrdquo
Eventos Deportivos Lugar Eventos Deportivos Lugar
Evento 1 AK 30 25 90 Evento 1 AK 30 25 90
Evento 2 AC 63 215 20 Evento 2 Parque La Florida
Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar
Fecha
inconsistente
Fechas no secuenciales
Lugar inexistente
26 Buenas praacutecticas para la publicacioacuten de datos
9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten
El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de
alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una
institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las
variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a
cabo los traacutemites de una entidad etc
Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un
espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados
Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten
asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un
establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario
identificar la localizacioacuten del dato publicado
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean puedan compartir en maacutes plataformas
Que los usuarios puedan visualizar mis datos en un mapa
iexclRecomendaciones
Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o
lugares geograacuteficos
Ejemplo 1
Incluya direcciones que permitan localizar espacialmente sus datos
Programa Direccioacuten
Registro de atencioacuten a la ciudadaniacutea CL 138 108 16
Centro de autocuidado KR 18 D 77 A 11 SUR
Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46
Centro de autocuidado KR 18 D 73 A 33 SUR
19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico
27 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 2
Utilice coordenadas para indicar la ubicacioacuten de sus datos
EPS Coordenada X Coordenada Y
EPS Convida 9087496334 1051342164
Capital Salud EPS 986321006 954875808
EPS Famisanar 9742508812 8837031501
Aliansalud EPS 9716943356 9659706891
Salud Total EPS 9215624975 9625189518
Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro
de su metadato el Sistema de referencia empleado
MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686
MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116
MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458
Ejemplo 3
Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute
Usuario Vacunado Lugar de Vacunacioacuten
Usuario 1 BOSQUE IZQUIERDO
Usuario 2 LAGUNITAS URBANO
Usuario 3 LA CAPUCHINA
Usuario 4 SAN JOSE SUR
Usuario 5 VENECIA
28 Buenas praacutecticas para la publicacioacuten de datos
10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado
Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el
dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los
usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la
citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el
formato de este
En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero
de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de
su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la
informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado
y reconocido faacutecilmente entre los demaacutes datos
Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de
identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por
cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta
gestioacuten y reutilizacioacuten de sus datos
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean compartidos en maacutes plataformas
Que mis datos puedan vincularse a otros datos en el entorno Web
Que mis datos sean encontrados usados y citados inequiacutevocamente
Garantizar y monitorear la reutilizacioacuten de mis datos
Reducir del uso erroacuteneo de mis datos
iexclRecomendaciones
Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar
Utilice siempre el identificador asignado para publicar sus datos
29 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos
httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la
creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la
asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten
de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito
garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar
descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando
asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten
geograacutefica
Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems
publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace
referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades
territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el
planeamiento del suelo urbano de expansioacuten y ruralrdquo
30 Buenas praacutecticas para la publicacioacuten de datos
OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS
Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten
Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado
Nivel Baacutesico
En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)
Nivel Intermedio
Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)
Nivel Avanzado
Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)
31 Buenas praacutecticas para la publicacioacuten de datos
REFERENCIAS
Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best
Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp
Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices
for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp
Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington
Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec
Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI
Recommendation URL httpdublincoreorgdocumentsdcmi-terms
Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C
Recommendation URL httpswwww3orgTRvocab-dcat
ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de
2014 International Standard
ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers
noviembre de 2009 International Standard
ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013
International Standard
Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best
Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp
T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax
Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986
World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg
W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second
Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-
overview
W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado
el 12 de septiembre de 2018
4 Buenas praacutecticas para la publicacioacuten de datos
INTRODUCCIOacuteN
La Infraestructura de Datos Espaciales del Distrito Capital - IDECA es el instrumento que
permite a las autoridades del Distrito identificar de manera constante la condicioacuten movilidad
dinaacutemica expansioacuten proceso proyectos y necesidades de la ciudad de Bogotaacute a traveacutes de la
obtencioacuten uso y disposicioacuten de informacioacuten georreferenciada para atender a la ciudadaniacutea y
conseguir la maacutes acertada toma de decisiones en beneficio de la ciudad y de sus habitantes
La obtencioacuten de datos la realiza cada entidad en el desarrollo de sus actividades misionales y el
uso de los datos producidos dependeraacute del propoacutesito del dato de la finalidad especiacutefica del
usuario y de coacutemo y cuando esteacuten disponibles los datos
IDECA gestiona la disposicioacuten de los datos por eso busca que los datos publicados por las
entidades pertenecientes a la Administracioacuten Distrital sin importar la plataforma de publicacioacuten
cuenten con altos estaacutendares de calidad interoperabilidad y documentacioacuten que promuevan y
faciliten el acceso comprensioacuten uso y re-uso de estos por cualquier usuario
Para encontrar y acceder los datos disponibles en el entorno Web los usuarios no
especializados tienen algunas dificultades ya que encuentran contenidos duplicados
desactualizados e inconsistentes lo que ha generado para los publicadores el reto de
garantizar el descubrimiento acceso calidad e interoperabilidad de sus datos
Es importante mencionar que si se publican datos uacutetiles novedosos actualizados y de calidad
no solo aumenta el nuacutemero de usuarios que los reutilicen y distribuyan sino que aumenta la
credibilidad y confianza en los datos Adicionalmente se disminuyen los costos y tiempos en la
generacioacuten de los datos y se reducen los usos indebidos de los mismos
Esta guiacutea pretende que las entidades o responsables de publicar y disponer los datos lo hagan
con altos estaacutendares de calidad debidamente documentados en formatos interoperables y
que satisfagan necesidades reales de los usuarios para que estos uacuteltimos puedan encontrarlos
accederlos comprenderlos y reutilizarlos
IDECA ha plasmado en este documento las mejores praacutecticas de publicacioacuten de datos en la
Web que cubren aspectos como el formato el acceso la calidad los metadatos el
licenciamiento y el origen de los datos
Se invita al lector a navegar faacutecilmente en el documento ya que este presenta sin un orden
determinado las mejores praacutecticas de publicacioacuten de datos explicadas en
iquestQueacute logro Los beneficios que se obtienen al aplicar la buena praacutectica
iexclRecomendaciones Las herramientas baacutesicas para conseguir el objetivo de la buena praacutectica
Ejemplos Utilizando conjuntos de datos reales de las entidades oficiales del Distrito Capital se visualiza la aplicacioacuten de la buena praacutectica
5 Buenas praacutecticas para la publicacioacuten de datos
OBJETIVO
Promover en las entidades de la Administracioacuten Distrital y sus responsables la apropiacioacuten y
adopcioacuten de las mejores praacutecticas de publicacioacuten de datos con el fin de aumentar el valor en la
informacioacuten producida dentro de su quehacer institucional
AUDIENCIA
Este documento estaacute dirigido a las entidades y personas responsables de la Administracioacuten
Distrital que publican o desean publicar datos oficiales de Bogotaacute a traveacutes de cualquier
plataforma de datos
ALCANCE
Las mejores praacutecticas expuestas en este documento estaacuten encaminadas a que los datos
publicados a traveacutes de plataformas oficiales cumplan con unos requisitos miacutenimos de calidad
documentacioacuten interoperabilidad y licenciamiento dentro del proceso de publicacioacuten
Buscamos con esta guiacutea de buenas praacutecticas garantizar la apropiacioacuten de cuatro principios
Que los datos sean descubiertos es decir que cualquier usuario en el entorno Web los
pueda encontrar faacutecilmente
Que los datos sean accesibles quiere decir que no presenten restricciones de acceso ni
que se encuentren cifrados
Que los datos sean interoperables en otras palabras que sean publicados en formatos
estandarizados que permitan ser procesados por cualquier software
Que los datos sean reutilizables es decir que estos sean utilizados en la mayor cantidad
de productos servicios y mercados
Debe tenerse en cuenta que IDECA expone en este documento las mejores praacutecticas de
publicacioacuten de datos identificadas con base a la experiencia adquirida en la disposicioacuten datos
de los uacuteltimos antildeos sin embargo existe una amplia gama de otras buenas praacutecticas de
publicacioacuten que no han sido incluidas en el presente texto y en consecuencia se invita al lector
a apropiarse de las praacutecticas expuestas y a dejar abierta la posibilidad de complementar la
informacioacuten presentada con otras fuentes
6 Buenas praacutecticas para la publicacioacuten de datos
BUENAS PRAacuteCTICAS PARA LA PUBLICACIOacuteN DE DATOS
1 Proporcionar metadatos asociados con los datos publicados Estos metadatos permitiraacuten conocer las caracteriacutesticas de los datos y deberaacuten ser interpretables tanto por usuarios como por aplicaciones informaacuteticas
Un metadato entendido como la informacioacuten acerca de un recurso1 es un dato con muchos
elementos que le permiten al usuario conocer desde la visioacuten del productor las caracteriacutesticas
propias de los datos publicados tales como las fechas de creacioacuten y actualizacioacuten el canal de
acceso la calidad del dato las condiciones de uso quieacuten lo produjo quieacuten lo distribuye etc
esto quiere decir que el metadato explica el dato en eacutel estaacute contenida toda la informacioacuten
relevante del dato
En la vida cotidiana la ceacutedula de ciudadaniacutea es el documento que contiene la informacioacuten
miacutenima de las personas (nombre sexo fecha de nacimiento GS RH estatura lugar de
nacimiento) esta informacioacuten permite que el ciudadano se identifique en cualquier lugar del
territorio nacional ante otras personas o autoridades que requieran conocerlo
Con los datos el tratamiento es similar el dato corresponde a la persona y el metadato
corresponde a la ceacutedula de ciudadaniacutea Asiacute como en Colombia todo ciudadano debe portar su
documento de identificacioacuten en el entorno Web todo dato debe portar su metadato en otras
palabras el metadato es parte integral del dato y existe entre ambos un viacutenculo inseparable
Los datos siempre deberaacuten publicarse con su respectivo metadato este uacuteltimo deberaacute contar
con informacioacuten completa y estandarizada que garantice que los usuarios encuentren
conozcan y utilicen los datos que producimos
Recuerde que la publicacioacuten del metadato es igual de importante que la publicacioacuten del
dato
iquestQueacute logro
Al publicar datos en conjunto con su metadato obtengo
Que mis datos sean encontrados y utilizados por maacutes usuarios Que los usuarios logren una correcta interpretacioacuten de la naturaleza calidad y
distribucioacuten de mis datos
Que mis datos sean entendidos evaluados y retroalimentados por maacutes usuarios
Que mis datos puedan ser compartidos e intercambiados entre sistemas
Que los motores de buacutesqueda encuentren mis datos publicados
Que las aplicaciones informaacuteticas procesen mejor y en mayor cantidad mis datos
1 ISO 19115-12014 410
7 Buenas praacutecticas para la publicacioacuten de datos
iexclRecomendaciones
Disponga metadatos suficientes que permitan a los usuarios tener la informacioacuten
correcta para decidir si el dato publicado satisface o no sus necesidades
Incluya en sus metadatos la ubicacioacuten del dato a traveacutes de la descripcioacuten del lugar
(localidad parque riacuteo etc) o a traveacutes de localizacioacuten por coordenadas geograacuteficas x e
y
Publique sus metadatos como una paacutegina Web HTML (HyperText Markup Language) o
simplemente como un archivo de texto separado
Disponga sus metadatos en el formato baacutesico de intercambio XML (Extensible Markup
Language) o en formatos estaacutendar maacutes sofisticados como JSON (JavaScript Object
Notation)
Al igual que los datos puede publicar los metadatos en muacuteltiples formatos desde la
misma URL
Tenga en cuenta que IDECA a partir de estaacutendares internacionales ha definido los
elementos miacutenimos que debe contener el metadato y que estos pueden ser utilizados
en la publicacioacuten de sus metadatos para facilitar el intercambio de estos
Figura 1 Secciones del Perfil de Metadatos IDECA
Para maacutes informacioacuten consulte la Cartilla para la creacioacuten de metadatos geograacuteficos en
Bogotaacute Distrito Capital
8 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
En la siguiente URL se observa un metadato dispuesto para que los usuarios puedan consultar
faacutecilmente la informacioacuten asociada al dato publicado (Desarrollo Econoacutemico Rural Bogotaacute
DC)
httpmetadatosidecagovcogeoportalcatalogsearchresourcedetailspageuuid=A8AB6E
7A-55FB-40DA-85E1-0AA6B4FE6CE3
Ejemplo 2
En la siguiente URL estaacute disponible el metadato de un nivel de informacioacuten dispuesto por la
Unidad Administrativa Especial de Catastro Distrital ndash UAECD ndash en formato XML (legible por
aplicaciones informaacuteticas
httpmetadatosidecagovcogeoportalrestdocumentid=7BBE5F9AEE-1FBC-4C13-822F-
F2CE44AFDD7E7D
9 Buenas praacutecticas para la publicacioacuten de datos
2 Proporcionar una licencia en donde se especifiquen las limitaciones yo restricciones de acceso y uso de los datos
Una licencia entendida como las condiciones legales bajo las cuales estaacute disponible la obra2 es
un instrumento mediante el cual el propietario del dato autoriza o no a los usuarios para que
accedan a su contenido y tambieacuten lo faculta para su utilizacioacuten Existen diferentes tipos de
licencia para la distribucioacuten y explotacioacuten de obras y cuyo propoacutesito es regular las condiciones
de acceso y uso de los datos
Dependiendo el acceso autorizado a los datos las licencias pueden clasificarse en
Privativas o restrictivas Aquellas licencias conocidas como cerradas o no libres donde la mayoriacutea de las veces solo el autor puede usar la obra o en caso contrario se definen condiciones especiacuteficas que se deben cumplir para hacer uso de la informacioacuten
Semilibres Aquellas licencias que requieren autorizaciones para que los usuarios utilicen copien distribuyan o modifiquen su contenido
Libres o abiertas Aquellas licencias que en teacuterminos generales permiten usar distribuir y compartir los datos con muy pocas restricciones
Cuando un dato se publica acompantildeado de su licencia el usuario conoce las condiciones de
acceso uso y distribucioacuten de los datos que estaacute consumiendo de esta forma se garantiza que
los datos se distribuyan seguacuten los intereses de la entidad que los produce y se minimizan los
usos indebidos de los datos por parte de los usuarios
Ahora bien definir la licencia adecuada para cada dato dependeraacute de las condiciones que
establezca la entidad productora de este Revise los ejemplos y defina la licencia maacutes adecuada
para sus datos
Para maacutes informacioacuten consulte el Instructivo para la definicioacuten de licencias de datos
iquestQueacute logro
Que el usuario evaluacutee si puede o no usar mis datos
Que el usuario conozca las condiciones de acceso uso y manejo sobre los datos
disponibles
Dar claridad y potenciar el uso de los datos disponibles
Que el usuario de los reconocimientos respectivos a la entidad productora de los datos
Que se genere valor agregado sobre los datos disponibles en caso de asignar una
licencia abierta
2 Recuperado de httpsopendefinitionorgod21es
10 Buenas praacutecticas para la publicacioacuten de datos
iexclRecomendaciones
Identifique la licencia que mejor se acomode a su modelo de negocio Recuerde que
mediante la Ley 1712 de 2014 se reguloacute el derecho de acceso a la informacioacuten puacuteblica
y se incluyeron los principios de facilitacioacuten gratuidad y divulgacioacuten proactiva de la
informacioacuten
Disponga una licencia para su conjunto de datos a traveacutes de un enlace una copia
incorporada o dentro del metadato
Prefiera el uso de licencias abiertas de este modo sus datos seraacuten utilizados en una
mayor cantidad de productos servicios y mercados
Ejemplo 1
Mundialmente conocidas las licencias Creative Commons3 tienen como objetivo fortalecer a los
creadores para que sean quienes definan los teacuterminos en que sus obras pueden ser usadas queacute
derechos desean entregar y en queacute condiciones lo haraacuten A continuacioacuten encontraraacute los
enlaces de acceso para conocer las condiciones de cada una de las licencias disponibles
CC0 10 httpscreativecommonsorgpublicdomainzero10deedes
CC BY 40 httpscreativecommonsorglicensesby40
CC BY-SA 40 httpscreativecommonsorglicensesby-sa40
CC BY-ND 40 httpscreativecommonsorglicensesby-nd40
CC BY-NC 40 httpscreativecommonsorglicensesby-nc40
CC BY-NC-SA 40
httpscreativecommonsorglicensesby-nc-sa40
Ejemplo 2
Tambieacuten existen las licencias abiertas para datos Open Data Commons4 proporcionadas por la
mundialmente conocida red Open Knowledge Foundation Network ndash OKFN5 puede consultar
las condiciones ingresando a los siguientes enlaces
ODbL 10 httpsopendatacommonsorglicensesodblsummary
PDDL 10 httpsopendatacommonsorglicensespddlsummary
ODC-BY 10 httpsopendatacommonsorglicensesbysummary
3 httpcreativecommonsorg 4 httpopendatacommonsorg 5 httpsokfnorg
11 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 3
El Mapa de referencia para Bogotaacute estaacute publicado en
httpswwwidecagovcoesserviciosmapa-de-referencia bajo las condiciones descritas en la
ldquoLICENCIA ABIERTA O CONDICIONES DE USO PARA DATOS ABIERTOS DE LA INFRAESTRUCTURA
INTEGRADA DE DATOS ESPACIALES PARA EL DISTRITO CAPITAL (IDECA)rdquo
httpswwwidecagovcoeslicenciaabierta
12 Buenas praacutecticas para la publicacioacuten de datos
3 Utilizar vocabularios estandarizados y reutilizables en la estructuracioacuten y publicacioacuten de los datos
Un vocabulario define los conceptos y las relaciones que se utilizan para describir y representar
un aacuterea de intereacutes6 Cuando se publican datos en la Web los vocabularios permiten integrar
datos cuando existen ambiguumledades en los teacuterminos utilizados en los diferentes conjuntos de
datos En la praacutectica un vocabulario es un conjunto de palabras que permiten a dos usuarios
comunicarse entre siacute La efectividad de dicha comunicacioacuten radica en que el significado de una
palabra para el usuario emisor sea el mismo que para el usuario receptor independientemente
de si utilizaron el mismo teacutermino
Cuando se habla de interoperabilidad de datos lo que se espera es que tanto los usuarios
como las aplicaciones informaacuteticas entiendan y comprendan la mayor cantidad de informacioacuten
que estaacuten consumiendo Para conseguir esto las comunidades de datos han identificado
vocablos palabras o teacuterminos de uso comuacuten los cuales cuentan con significados apropiados y
que actualmente se encuentran integrados y estructurados en diferentes estaacutendares
internacionales
Se recomienda utilizar vocabularios de este tipo para estandarizar los datos contenidos en la
informacioacuten publicada
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios Que se reduzca la ambiguumledad en la interpretacioacuten de mis datos Que mis datos sean interoperables Que mis datos sean procesados en entornos nacionales e internacionales Que mis datos puedan ser compartidos e intercambiados entre sistemas Que mis datos sean maacutes confiables
iexclRecomendaciones
Consulte normas locales o vocabularios internacionales para la estructuracioacuten7 de sus
datos
Apropie los vocabularios consultados y adapte sus datos a estos en los casos en que sea
posible
Incluya vocabularios ya definidos y reconocidos internacionalmente cuando vaya a
producir nuevos datos
6 httpswwww3orgstandardssemanticwebontology 7 Estructurar significa ajustar los datos a un esquema fijo
13 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
A continuacioacuten se presentan algunos vocabularios internacionales que puede consultar y
apropiar para optimizar el intercambio de sus datos
Data Catalog Vocabulary (DCAT) httpswwww3orgTRvocab-dcatclass-catalog
FOAF Vocabulary Specification httpxmlnscomfoaf01
ISOTC 211 Geographic informationGeomatics Terminology
httpwwwisotc211orgTerminologyhtm
The RDF Data Cube Vocabulary httpswwww3orgTR2014REC-vocab-data-cube-20140116
ODRL Vocabulary amp Expression 22
httpswwww3orgTR2018REC-odrl-vocab-20180215
HTTP Vocabulary in RDF 10 httpswwww3orgTR2017NOTE-HTTP-in-RDF10-20170202
vCard Ontology - for describing People and Organizations
httpswwww3orgTRvcard-rdf
Ejemplo 2
En el contexto Nacional el Ministerio de Tecnologiacuteas de la Informacioacuten y las Comunicaciones ha
establecido el Lenguaje Comuacuten de Intercambio de como un instrumento de consulta que
contiene la definicioacuten de los elementos de datos conceptualizados por las entidades del
estado La consulta la puede realizar en httplenguajeminticgovco
14 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 3
La especificacioacuten vCard disponible en httpswwww3orgTRvcard-rdf promueve un
vocabulario especiacutefico para describir personas y organizaciones
Uno de los vocablos que describe esta especificacioacuten es la ldquodireccioacuten de entregardquo llamado
dentro del vocabulario como ADR y definido como ldquola direccioacuten del objeto representado en
partes estructuradasrdquo
Ahora bien este vocabulario especifica los componentes de la direccioacuten de entrega para el
objeto asiacute el nombre del paiacutes la localidad el coacutedigo postal la regioacuten y la direccioacuten dada por
viacuteas (calles y carreras en el caso colombiano) Esto quiere decir que cualquiera de los
componentes descritos puede usarse como direccioacuten de entrega vaacutelida ya que son equivalentes
entre siacute
Aunque en el vocabulario la direccioacuten de entrega se llame ADR el usuario de la informacioacuten
entenderaacute que un nombre de paiacutes o un coacutedigo postal pueden interpretarse como ADR
15 Buenas praacutecticas para la publicacioacuten de datos
4 Anonimizar los datos de caraacutecter personal informacioacuten estadiacutestica informacioacuten indirectamente identificable e informacioacuten sensible o confidencial
Anonimizar es el proceso que impide la identificacioacuten de las unidades de estudio que son fuente
para los registros individuales de un conjunto8 de datos o maacutes claro es la aplicacioacuten de teacutecnicas
que permitan expresar un dato relativo a personas eliminando la referencia a su identidad9
Baacutesicamente lo que se busca es reducir los riesgos en el uso y procesamiento de datos
personales evitar la extraccioacuten de registros que identifican a una persona reducir la
combinacioacuten de dos o maacutes registros en una o varias bases de datos para identificar a una
persona y minimizar la deduccioacuten de datos personales partir de uno o varios datos publicados
iquestQueacute informacioacuten debo prioritariamente anonimizar
Datos personales Informacioacuten numeacuterica alfabeacutetica graacutefica fotograacutefica acuacutestica o
cualquier otro tipo susceptible de recogida registro tratamiento y transmisioacuten
concerniente a personas fiacutesicas identificadas o identificables (tales como nombre
apellidos estado civil sexo edad domicilio identificacioacuten personal nuacutemero de
teleacutefono etc)10
Informacioacuten sensible Informacioacuten considerada como estrictamente confidencial
Informacioacuten y caracteriacutesticas referentes a la edad procedencia salud raza religioacuten
ideologiacutea afiliacioacuten finanzas etc se consideran de caraacutecter sensible y requieren de
una proteccioacuten especial11
iquestQueacute logro
Garantizar que mis datos publicados cuentan con medidas de proteccioacuten de datos
personales
Eliminar de manera efectiva el riesgo de re-identificacioacuten
Evitar que el procesamiento de mis datos tenga consecuencias negativas para alguna
persona
Disponer muchos maacutes datos sin invadir la informacioacuten personal
iexclRecomendaciones
Implemente actividades de proteccioacuten de la privacidad de los datos personales antes
de publicarlos
Elimine cualquier identificador directo de la persona (nombre documento de
identidad etc)
8 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 9 httpdleraeesid=2jjMiRi 10 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 11 Ibidem
16 Buenas praacutecticas para la publicacioacuten de datos
Reemplace los identificadores directos por coacutedigos de referencia pseudoacutenimos
(algoritmos AES12 o un hash cifrado HMAC13) coacutedigos arbitrarios o aleatorios
Si reemplazando el identificador directo auacuten es faacutecil identificar a la persona elimine el
dato
Clasifique yo categorice los datos
Redondee los datos numeacutericos hacia arriba o hacia abajo
Evaluacutee antes durante y despueacutes de publicados los datos si la anonimizacioacuten de sus
datos es suficiente y evaluacutee regularmente los riesgos existentes
Para maacutes informacioacuten consulte los Lineamientos para la Anonimizacioacuten de micro datos
Ejemplo 1
Antes de publicar sus datos retire el identificador directo de la persona En este caso
reemplace en nuacutemero de documento que identifica al usuario y reemplaacutecelo por un
consecutivo
Usuario Beneficio Usuario Beneficio
80123456 Subsidio de vivienda Usuario 1 Subsidio de vivienda
51123456 Subsidio de alimentacioacuten Usuario 2 Subsidio de alimentacioacuten
19123456 Subsidio al adulto mayor Usuario 3 Subsidio al adulto mayor
53123456 Subsidio de desempleo Usuario 4 Subsidio de desempleo
Ejemplo 2
Clasifique o categorice sus datos En este ejemplo asigne rangos a la edad de manera tal que el
titular del registro no sea identificable por este dato
Usuario Edad Usuario Rango de edad
Usuario 1 11 antildeos Usuario 1 Entre 10 y 15 antildeos
Usuario 2 22 antildeos Usuario 2 Entre 20 y 25 antildeos
Usuario 3 36 antildeos Usuario 3 Entre 35 y 40 antildeos
Usuario 4 63 antildeos Usuario 4 Entre 60 y 65 antildeos
12 Advanced Encryption Standard puede consultar como ha sido implementado este algoritmo en httpsrevistasudistritaleducoojsindexphpTecnuraarticleview72368892 13 Hash-based Message Authentication Code puede consultar como se crea este cifrado en httpsdocsoraclecomcdE19253-01819-7804wanboottasks2-51indexhtml
17 Buenas praacutecticas para la publicacioacuten de datos
5 Publicar los datos en formatos estaacutendar reutilizables y legibles por aplicaciones informaacuteticas
Un formato puede ser definido como la estructura de un disco dividido en campos y pistas
seguacuten un determinado sistema operativo lo que permite almacenar en eacutel informacioacuten14
baacutesicamente es la forma en que se codifican los datos en un archivo informaacutetico
Actualmente conocemos formatos comunes de almacenamiento como el doc una extensioacuten
de Word que almacena texto y cuyo propietario es la compantildeiacutea Microsoft Pero iquestqueacute pasa si un
usuario quiere abrir un documento doc en un procesador de texto diferente a Word
difiacutecilmente va a poder conocer el contenido de dicho documento sin tener esta licencia
Lo que queremos lograr con la implementacioacuten de esta praacutectica es que todos los usuarios que
encuentren mis datos puedan accederlos sin necesidad de contar con un software o aplicacioacuten
informaacutetica especiacutefica
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos puedan ser extraiacutedos transformados y procesados por aplicaciones
informaacuteticas
Que mis datos puedan ser compartidos e intercambiados entre sistemas
Disminuir los costos y los tiempos en el uso y la transformacioacuten de mis datos
iexclRecomendaciones
Prefiera publicar su conjunto de datos en formatos abiertos o no propietario ya que
estos facilitan el uso re-uso y distribucioacuten de estos Se busca que un mayor nuacutemero de
aplicaciones informaacuteticas pueda extraer leer y transformar los datos generando mayor
uso y re-uso por los usuarios
Disponga sus datos en muacuteltiples formatos con el fin de incrementar el acceso a los
mismos Se busca que el mayor nuacutemero de usuarios pueda utilizar los datos sin tener
que transformarlos primero en su formato preferido
Utilice Web Services para mejorar el intercambio e interoperabilidad de los datos
publicados
14 httpdleraeessrvsearchm=30ampw=formato
18 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
A continuacioacuten encontraraacute extensiones de formato propietario y no propietario prefiera para
la publicacioacuten de sus datos las extensiones de la derecha
FORMATO PROPIETARIO FORMATO NO PROPIETARIO
DOC GDB TXT ASCII Grid KML RDF
XLS DWG CSV GeoJSON DXF XML
PPT SHP JSON GML ODF
Ejemplo 2
Si no fue posible utilizar una extensioacuten de formato no propietario publique sus datos en una
variedad de formatos que le permita al usuario acceder a los datos desde diferentes
aplicaciones informaacuteticas
Ejemplo 3
Para publicar sus datos conozca diferentes tipos de Web Services que viajan en la red utilizando extensiones XML
SOAP httpswwww3orgTRsoap
REST httprestelksteinorg
WMS httpwwwopengeospatialorgstandardswms
WFS httpwwwopengeospatialorgstandardswfs
WCS httpwwwopengeospatialorgstandardswcs
19 Buenas praacutecticas para la publicacioacuten de datos
6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos publicados
Un diccionario estaacute definido como un repertorio en forma de libro o en soporte electroacutenico en el
que se recogen seguacuten un orden determinado las palabras o expresiones de una o maacutes lenguas
o de una materia concreta acompantildeadas de su definicioacuten equivalencia o explicacioacuten15
especiacuteficamente en un diccionario de datos se encuentran los conceptos de los datos y sus
propiedades (atributos dominios asociaciones y operaciones) acompantildeados de una definicioacuten
en donde se identifica el propoacutesito alcance y campo de aplicacioacuten del dato publicado
Lograr que los usuarios de mis datos entiendan la informacioacuten que estaacute publicada le permitiraacute
decidir si satisfacen o no su necesidad y le facilitaraacute la decisioacuten para explotar lo datos
Para maacutes informacioacuten consulte el Instructivo Diccionario de Datos
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que se eviten ambiguumledades en la interpretacioacuten de mis datos
Que mis datos publicados esteacuten unificados y consistentes
Que los usuarios comprendan mejor y dispongan de claridad sobre los conceptos de
mis datos
iexclRecomendaciones
Publique como miacutenimo un diccionario de datos que contenga la caracterizacioacuten del
conjunto de datos producidos por su entidad
Cree el diccionario de datos teniendo en cuenta como miacutenimo la siguiente informacioacuten
Nombre del atributo Nombre que identifica de manera clara un atributo
Definicioacuten Descripcioacuten del atributo
Tipo de dato Tipo de valor del atributo
Unidad de medida Expresa la unidad de medida del atributo
Dominio Determina si el atributo tiene asociado un dominio
15 httpdleraeesw=diccionario
20 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
Para el conjunto de datos ldquoEstablecimientos Educativos en Bogotaacuterdquo publicariacuteamos un
diccionario de datos similar al siguiente
Nombre del atributo Definicioacuten Tipo de dato
Unidad de Medida
Dominio
Coacutedigo del establecimiento
Coacutedigo DANE asignado al Institucioacuten Educativa Decimal
Nombre del establecimiento
Nombre de la Institucioacuten Educativa Cadena de Caracteres
Aacuterea construida del establecimiento
Aacuterea construida de la Institucioacuten Educativa Decimal Metros
cuadrados
Sector
Clasificacioacuten asignada seguacuten la naturaleza juriacutedica la cual define las principales caracteriacutesticas que desde lo juriacutedico - administrativo y tiene que ver con el origen de su creacioacuten
Entero
EESector
No podriacuteamos olvidar detallar el dominio asociado
Atributo Nombre del Dominio Coacutedigo Definicioacuten
EESector
Oficial 1
Es una institucioacuten donde su naturaleza de servicio puacuteblico cultural y su funcioacuten social le es inherente cumpliendo con las disposiciones legales y estatutarias que las rigen donde sus rentas se conservan y se aplican debidamente
Privado 2
Es una institucioacuten constituida como persona juriacutedica de utilidad comuacuten donde sus rentas se conservan y se aplican debidamente y que en todo lo esencial se cumple con la voluntad de sus fundadores
21 Buenas praacutecticas para la publicacioacuten de datos
7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos
Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para
acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que
conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como
cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o
software
En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos
publicados se proporcionen recursos o documentos adicionales que puedan ser consultados
yo descargados traveacutes de enlaces o links de otro sitio Web
Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los
procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los
documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad
entre otros
iquestQueacute logro
Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos
Que los usuarios comprendan mejor mis datos
Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios
iexclRecomendaciones
Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el
horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del
dato
No olvide vincular o registrar esta informacioacuten en el metadato
16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp
22 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos
Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318
Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57
Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30
Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217
Ejemplo 2
La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en
httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos
o Gestioacuten de los humedales
o Poliacutetica de Humedales del Distrito Capital
o Normatividad
o Planes de Manejo Ambiental
o Comiteacute distrital de humedales documentos de consulta normatividad
23 Buenas praacutecticas para la publicacioacuten de datos
8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza
La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten
juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado
Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para
satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas
y especificaciones establecidas
Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades
de estos sin embargo en este aparte citaremos los elementos principales que usted o su
entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad
Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de
los datos espaciales
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que los usuarios hablen bien de mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean maacutes compartidos
Que mis datos sean maacutes confiables
Recomendacioacuten 1
Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten
descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten
corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Suba 200 Tunjuelito 500
Ameacutericas 100
850
Tunjuelito 500
18 httpdleraeesid=6nVpk8P|6nXVL1Z
Campo duplicado
Campo inconsistente
Campo vaciacuteo
24 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 2
Identifique y transforme si es necesario los datos que hayan sido registrados en un formato
diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida
del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de
formatordquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Tunjuelito 5008 Tunjuelito 500
Fontiboacuten 40 Fontiboacuten 430
Tunjuelito 500 Tunjuelito 500
Recomendacioacuten 3
Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos
se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de
clasificacioacutenrdquo
Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad
Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10
Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20
Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40
Recomendacioacuten 4
Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos
correspondan a valores conocidos como verdaderos El elemento de calidad asociado se
denomina ldquoexactitud de atributos cuantitativosrdquo
Localidad Mes Temperatura Localidad Mes Temperatura
Chapinero Enero 7degC Chapinero Enero 7degC
Suba Agosto -15degC Suba Agosto 15degC
Tunjuelito Abril 60degC Tunjuelito Abril 16degC
Clasificacioacuten inconsistente
Formato inconsistente
Valor inconsistente
25 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 5
Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por
ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que
las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad
asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo
Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro
00 20580101 00 20180101
01 20180102 01 20180102
126 20510403 126 20180103
20 20180104 20 20180104
Recomendacioacuten 6
Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes
de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se
denomina ldquoconsistencia temporalrdquo
Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio
Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231
Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231
Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112
Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112
Recomendacioacuten 7
Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta
corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud
posicionalrdquo
Eventos Deportivos Lugar Eventos Deportivos Lugar
Evento 1 AK 30 25 90 Evento 1 AK 30 25 90
Evento 2 AC 63 215 20 Evento 2 Parque La Florida
Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar
Fecha
inconsistente
Fechas no secuenciales
Lugar inexistente
26 Buenas praacutecticas para la publicacioacuten de datos
9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten
El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de
alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una
institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las
variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a
cabo los traacutemites de una entidad etc
Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un
espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados
Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten
asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un
establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario
identificar la localizacioacuten del dato publicado
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean puedan compartir en maacutes plataformas
Que los usuarios puedan visualizar mis datos en un mapa
iexclRecomendaciones
Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o
lugares geograacuteficos
Ejemplo 1
Incluya direcciones que permitan localizar espacialmente sus datos
Programa Direccioacuten
Registro de atencioacuten a la ciudadaniacutea CL 138 108 16
Centro de autocuidado KR 18 D 77 A 11 SUR
Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46
Centro de autocuidado KR 18 D 73 A 33 SUR
19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico
27 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 2
Utilice coordenadas para indicar la ubicacioacuten de sus datos
EPS Coordenada X Coordenada Y
EPS Convida 9087496334 1051342164
Capital Salud EPS 986321006 954875808
EPS Famisanar 9742508812 8837031501
Aliansalud EPS 9716943356 9659706891
Salud Total EPS 9215624975 9625189518
Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro
de su metadato el Sistema de referencia empleado
MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686
MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116
MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458
Ejemplo 3
Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute
Usuario Vacunado Lugar de Vacunacioacuten
Usuario 1 BOSQUE IZQUIERDO
Usuario 2 LAGUNITAS URBANO
Usuario 3 LA CAPUCHINA
Usuario 4 SAN JOSE SUR
Usuario 5 VENECIA
28 Buenas praacutecticas para la publicacioacuten de datos
10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado
Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el
dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los
usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la
citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el
formato de este
En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero
de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de
su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la
informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado
y reconocido faacutecilmente entre los demaacutes datos
Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de
identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por
cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta
gestioacuten y reutilizacioacuten de sus datos
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean compartidos en maacutes plataformas
Que mis datos puedan vincularse a otros datos en el entorno Web
Que mis datos sean encontrados usados y citados inequiacutevocamente
Garantizar y monitorear la reutilizacioacuten de mis datos
Reducir del uso erroacuteneo de mis datos
iexclRecomendaciones
Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar
Utilice siempre el identificador asignado para publicar sus datos
29 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos
httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la
creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la
asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten
de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito
garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar
descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando
asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten
geograacutefica
Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems
publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace
referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades
territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el
planeamiento del suelo urbano de expansioacuten y ruralrdquo
30 Buenas praacutecticas para la publicacioacuten de datos
OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS
Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten
Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado
Nivel Baacutesico
En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)
Nivel Intermedio
Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)
Nivel Avanzado
Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)
31 Buenas praacutecticas para la publicacioacuten de datos
REFERENCIAS
Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best
Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp
Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices
for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp
Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington
Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec
Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI
Recommendation URL httpdublincoreorgdocumentsdcmi-terms
Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C
Recommendation URL httpswwww3orgTRvocab-dcat
ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de
2014 International Standard
ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers
noviembre de 2009 International Standard
ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013
International Standard
Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best
Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp
T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax
Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986
World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg
W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second
Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-
overview
W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado
el 12 de septiembre de 2018
5 Buenas praacutecticas para la publicacioacuten de datos
OBJETIVO
Promover en las entidades de la Administracioacuten Distrital y sus responsables la apropiacioacuten y
adopcioacuten de las mejores praacutecticas de publicacioacuten de datos con el fin de aumentar el valor en la
informacioacuten producida dentro de su quehacer institucional
AUDIENCIA
Este documento estaacute dirigido a las entidades y personas responsables de la Administracioacuten
Distrital que publican o desean publicar datos oficiales de Bogotaacute a traveacutes de cualquier
plataforma de datos
ALCANCE
Las mejores praacutecticas expuestas en este documento estaacuten encaminadas a que los datos
publicados a traveacutes de plataformas oficiales cumplan con unos requisitos miacutenimos de calidad
documentacioacuten interoperabilidad y licenciamiento dentro del proceso de publicacioacuten
Buscamos con esta guiacutea de buenas praacutecticas garantizar la apropiacioacuten de cuatro principios
Que los datos sean descubiertos es decir que cualquier usuario en el entorno Web los
pueda encontrar faacutecilmente
Que los datos sean accesibles quiere decir que no presenten restricciones de acceso ni
que se encuentren cifrados
Que los datos sean interoperables en otras palabras que sean publicados en formatos
estandarizados que permitan ser procesados por cualquier software
Que los datos sean reutilizables es decir que estos sean utilizados en la mayor cantidad
de productos servicios y mercados
Debe tenerse en cuenta que IDECA expone en este documento las mejores praacutecticas de
publicacioacuten de datos identificadas con base a la experiencia adquirida en la disposicioacuten datos
de los uacuteltimos antildeos sin embargo existe una amplia gama de otras buenas praacutecticas de
publicacioacuten que no han sido incluidas en el presente texto y en consecuencia se invita al lector
a apropiarse de las praacutecticas expuestas y a dejar abierta la posibilidad de complementar la
informacioacuten presentada con otras fuentes
6 Buenas praacutecticas para la publicacioacuten de datos
BUENAS PRAacuteCTICAS PARA LA PUBLICACIOacuteN DE DATOS
1 Proporcionar metadatos asociados con los datos publicados Estos metadatos permitiraacuten conocer las caracteriacutesticas de los datos y deberaacuten ser interpretables tanto por usuarios como por aplicaciones informaacuteticas
Un metadato entendido como la informacioacuten acerca de un recurso1 es un dato con muchos
elementos que le permiten al usuario conocer desde la visioacuten del productor las caracteriacutesticas
propias de los datos publicados tales como las fechas de creacioacuten y actualizacioacuten el canal de
acceso la calidad del dato las condiciones de uso quieacuten lo produjo quieacuten lo distribuye etc
esto quiere decir que el metadato explica el dato en eacutel estaacute contenida toda la informacioacuten
relevante del dato
En la vida cotidiana la ceacutedula de ciudadaniacutea es el documento que contiene la informacioacuten
miacutenima de las personas (nombre sexo fecha de nacimiento GS RH estatura lugar de
nacimiento) esta informacioacuten permite que el ciudadano se identifique en cualquier lugar del
territorio nacional ante otras personas o autoridades que requieran conocerlo
Con los datos el tratamiento es similar el dato corresponde a la persona y el metadato
corresponde a la ceacutedula de ciudadaniacutea Asiacute como en Colombia todo ciudadano debe portar su
documento de identificacioacuten en el entorno Web todo dato debe portar su metadato en otras
palabras el metadato es parte integral del dato y existe entre ambos un viacutenculo inseparable
Los datos siempre deberaacuten publicarse con su respectivo metadato este uacuteltimo deberaacute contar
con informacioacuten completa y estandarizada que garantice que los usuarios encuentren
conozcan y utilicen los datos que producimos
Recuerde que la publicacioacuten del metadato es igual de importante que la publicacioacuten del
dato
iquestQueacute logro
Al publicar datos en conjunto con su metadato obtengo
Que mis datos sean encontrados y utilizados por maacutes usuarios Que los usuarios logren una correcta interpretacioacuten de la naturaleza calidad y
distribucioacuten de mis datos
Que mis datos sean entendidos evaluados y retroalimentados por maacutes usuarios
Que mis datos puedan ser compartidos e intercambiados entre sistemas
Que los motores de buacutesqueda encuentren mis datos publicados
Que las aplicaciones informaacuteticas procesen mejor y en mayor cantidad mis datos
1 ISO 19115-12014 410
7 Buenas praacutecticas para la publicacioacuten de datos
iexclRecomendaciones
Disponga metadatos suficientes que permitan a los usuarios tener la informacioacuten
correcta para decidir si el dato publicado satisface o no sus necesidades
Incluya en sus metadatos la ubicacioacuten del dato a traveacutes de la descripcioacuten del lugar
(localidad parque riacuteo etc) o a traveacutes de localizacioacuten por coordenadas geograacuteficas x e
y
Publique sus metadatos como una paacutegina Web HTML (HyperText Markup Language) o
simplemente como un archivo de texto separado
Disponga sus metadatos en el formato baacutesico de intercambio XML (Extensible Markup
Language) o en formatos estaacutendar maacutes sofisticados como JSON (JavaScript Object
Notation)
Al igual que los datos puede publicar los metadatos en muacuteltiples formatos desde la
misma URL
Tenga en cuenta que IDECA a partir de estaacutendares internacionales ha definido los
elementos miacutenimos que debe contener el metadato y que estos pueden ser utilizados
en la publicacioacuten de sus metadatos para facilitar el intercambio de estos
Figura 1 Secciones del Perfil de Metadatos IDECA
Para maacutes informacioacuten consulte la Cartilla para la creacioacuten de metadatos geograacuteficos en
Bogotaacute Distrito Capital
8 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
En la siguiente URL se observa un metadato dispuesto para que los usuarios puedan consultar
faacutecilmente la informacioacuten asociada al dato publicado (Desarrollo Econoacutemico Rural Bogotaacute
DC)
httpmetadatosidecagovcogeoportalcatalogsearchresourcedetailspageuuid=A8AB6E
7A-55FB-40DA-85E1-0AA6B4FE6CE3
Ejemplo 2
En la siguiente URL estaacute disponible el metadato de un nivel de informacioacuten dispuesto por la
Unidad Administrativa Especial de Catastro Distrital ndash UAECD ndash en formato XML (legible por
aplicaciones informaacuteticas
httpmetadatosidecagovcogeoportalrestdocumentid=7BBE5F9AEE-1FBC-4C13-822F-
F2CE44AFDD7E7D
9 Buenas praacutecticas para la publicacioacuten de datos
2 Proporcionar una licencia en donde se especifiquen las limitaciones yo restricciones de acceso y uso de los datos
Una licencia entendida como las condiciones legales bajo las cuales estaacute disponible la obra2 es
un instrumento mediante el cual el propietario del dato autoriza o no a los usuarios para que
accedan a su contenido y tambieacuten lo faculta para su utilizacioacuten Existen diferentes tipos de
licencia para la distribucioacuten y explotacioacuten de obras y cuyo propoacutesito es regular las condiciones
de acceso y uso de los datos
Dependiendo el acceso autorizado a los datos las licencias pueden clasificarse en
Privativas o restrictivas Aquellas licencias conocidas como cerradas o no libres donde la mayoriacutea de las veces solo el autor puede usar la obra o en caso contrario se definen condiciones especiacuteficas que se deben cumplir para hacer uso de la informacioacuten
Semilibres Aquellas licencias que requieren autorizaciones para que los usuarios utilicen copien distribuyan o modifiquen su contenido
Libres o abiertas Aquellas licencias que en teacuterminos generales permiten usar distribuir y compartir los datos con muy pocas restricciones
Cuando un dato se publica acompantildeado de su licencia el usuario conoce las condiciones de
acceso uso y distribucioacuten de los datos que estaacute consumiendo de esta forma se garantiza que
los datos se distribuyan seguacuten los intereses de la entidad que los produce y se minimizan los
usos indebidos de los datos por parte de los usuarios
Ahora bien definir la licencia adecuada para cada dato dependeraacute de las condiciones que
establezca la entidad productora de este Revise los ejemplos y defina la licencia maacutes adecuada
para sus datos
Para maacutes informacioacuten consulte el Instructivo para la definicioacuten de licencias de datos
iquestQueacute logro
Que el usuario evaluacutee si puede o no usar mis datos
Que el usuario conozca las condiciones de acceso uso y manejo sobre los datos
disponibles
Dar claridad y potenciar el uso de los datos disponibles
Que el usuario de los reconocimientos respectivos a la entidad productora de los datos
Que se genere valor agregado sobre los datos disponibles en caso de asignar una
licencia abierta
2 Recuperado de httpsopendefinitionorgod21es
10 Buenas praacutecticas para la publicacioacuten de datos
iexclRecomendaciones
Identifique la licencia que mejor se acomode a su modelo de negocio Recuerde que
mediante la Ley 1712 de 2014 se reguloacute el derecho de acceso a la informacioacuten puacuteblica
y se incluyeron los principios de facilitacioacuten gratuidad y divulgacioacuten proactiva de la
informacioacuten
Disponga una licencia para su conjunto de datos a traveacutes de un enlace una copia
incorporada o dentro del metadato
Prefiera el uso de licencias abiertas de este modo sus datos seraacuten utilizados en una
mayor cantidad de productos servicios y mercados
Ejemplo 1
Mundialmente conocidas las licencias Creative Commons3 tienen como objetivo fortalecer a los
creadores para que sean quienes definan los teacuterminos en que sus obras pueden ser usadas queacute
derechos desean entregar y en queacute condiciones lo haraacuten A continuacioacuten encontraraacute los
enlaces de acceso para conocer las condiciones de cada una de las licencias disponibles
CC0 10 httpscreativecommonsorgpublicdomainzero10deedes
CC BY 40 httpscreativecommonsorglicensesby40
CC BY-SA 40 httpscreativecommonsorglicensesby-sa40
CC BY-ND 40 httpscreativecommonsorglicensesby-nd40
CC BY-NC 40 httpscreativecommonsorglicensesby-nc40
CC BY-NC-SA 40
httpscreativecommonsorglicensesby-nc-sa40
Ejemplo 2
Tambieacuten existen las licencias abiertas para datos Open Data Commons4 proporcionadas por la
mundialmente conocida red Open Knowledge Foundation Network ndash OKFN5 puede consultar
las condiciones ingresando a los siguientes enlaces
ODbL 10 httpsopendatacommonsorglicensesodblsummary
PDDL 10 httpsopendatacommonsorglicensespddlsummary
ODC-BY 10 httpsopendatacommonsorglicensesbysummary
3 httpcreativecommonsorg 4 httpopendatacommonsorg 5 httpsokfnorg
11 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 3
El Mapa de referencia para Bogotaacute estaacute publicado en
httpswwwidecagovcoesserviciosmapa-de-referencia bajo las condiciones descritas en la
ldquoLICENCIA ABIERTA O CONDICIONES DE USO PARA DATOS ABIERTOS DE LA INFRAESTRUCTURA
INTEGRADA DE DATOS ESPACIALES PARA EL DISTRITO CAPITAL (IDECA)rdquo
httpswwwidecagovcoeslicenciaabierta
12 Buenas praacutecticas para la publicacioacuten de datos
3 Utilizar vocabularios estandarizados y reutilizables en la estructuracioacuten y publicacioacuten de los datos
Un vocabulario define los conceptos y las relaciones que se utilizan para describir y representar
un aacuterea de intereacutes6 Cuando se publican datos en la Web los vocabularios permiten integrar
datos cuando existen ambiguumledades en los teacuterminos utilizados en los diferentes conjuntos de
datos En la praacutectica un vocabulario es un conjunto de palabras que permiten a dos usuarios
comunicarse entre siacute La efectividad de dicha comunicacioacuten radica en que el significado de una
palabra para el usuario emisor sea el mismo que para el usuario receptor independientemente
de si utilizaron el mismo teacutermino
Cuando se habla de interoperabilidad de datos lo que se espera es que tanto los usuarios
como las aplicaciones informaacuteticas entiendan y comprendan la mayor cantidad de informacioacuten
que estaacuten consumiendo Para conseguir esto las comunidades de datos han identificado
vocablos palabras o teacuterminos de uso comuacuten los cuales cuentan con significados apropiados y
que actualmente se encuentran integrados y estructurados en diferentes estaacutendares
internacionales
Se recomienda utilizar vocabularios de este tipo para estandarizar los datos contenidos en la
informacioacuten publicada
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios Que se reduzca la ambiguumledad en la interpretacioacuten de mis datos Que mis datos sean interoperables Que mis datos sean procesados en entornos nacionales e internacionales Que mis datos puedan ser compartidos e intercambiados entre sistemas Que mis datos sean maacutes confiables
iexclRecomendaciones
Consulte normas locales o vocabularios internacionales para la estructuracioacuten7 de sus
datos
Apropie los vocabularios consultados y adapte sus datos a estos en los casos en que sea
posible
Incluya vocabularios ya definidos y reconocidos internacionalmente cuando vaya a
producir nuevos datos
6 httpswwww3orgstandardssemanticwebontology 7 Estructurar significa ajustar los datos a un esquema fijo
13 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
A continuacioacuten se presentan algunos vocabularios internacionales que puede consultar y
apropiar para optimizar el intercambio de sus datos
Data Catalog Vocabulary (DCAT) httpswwww3orgTRvocab-dcatclass-catalog
FOAF Vocabulary Specification httpxmlnscomfoaf01
ISOTC 211 Geographic informationGeomatics Terminology
httpwwwisotc211orgTerminologyhtm
The RDF Data Cube Vocabulary httpswwww3orgTR2014REC-vocab-data-cube-20140116
ODRL Vocabulary amp Expression 22
httpswwww3orgTR2018REC-odrl-vocab-20180215
HTTP Vocabulary in RDF 10 httpswwww3orgTR2017NOTE-HTTP-in-RDF10-20170202
vCard Ontology - for describing People and Organizations
httpswwww3orgTRvcard-rdf
Ejemplo 2
En el contexto Nacional el Ministerio de Tecnologiacuteas de la Informacioacuten y las Comunicaciones ha
establecido el Lenguaje Comuacuten de Intercambio de como un instrumento de consulta que
contiene la definicioacuten de los elementos de datos conceptualizados por las entidades del
estado La consulta la puede realizar en httplenguajeminticgovco
14 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 3
La especificacioacuten vCard disponible en httpswwww3orgTRvcard-rdf promueve un
vocabulario especiacutefico para describir personas y organizaciones
Uno de los vocablos que describe esta especificacioacuten es la ldquodireccioacuten de entregardquo llamado
dentro del vocabulario como ADR y definido como ldquola direccioacuten del objeto representado en
partes estructuradasrdquo
Ahora bien este vocabulario especifica los componentes de la direccioacuten de entrega para el
objeto asiacute el nombre del paiacutes la localidad el coacutedigo postal la regioacuten y la direccioacuten dada por
viacuteas (calles y carreras en el caso colombiano) Esto quiere decir que cualquiera de los
componentes descritos puede usarse como direccioacuten de entrega vaacutelida ya que son equivalentes
entre siacute
Aunque en el vocabulario la direccioacuten de entrega se llame ADR el usuario de la informacioacuten
entenderaacute que un nombre de paiacutes o un coacutedigo postal pueden interpretarse como ADR
15 Buenas praacutecticas para la publicacioacuten de datos
4 Anonimizar los datos de caraacutecter personal informacioacuten estadiacutestica informacioacuten indirectamente identificable e informacioacuten sensible o confidencial
Anonimizar es el proceso que impide la identificacioacuten de las unidades de estudio que son fuente
para los registros individuales de un conjunto8 de datos o maacutes claro es la aplicacioacuten de teacutecnicas
que permitan expresar un dato relativo a personas eliminando la referencia a su identidad9
Baacutesicamente lo que se busca es reducir los riesgos en el uso y procesamiento de datos
personales evitar la extraccioacuten de registros que identifican a una persona reducir la
combinacioacuten de dos o maacutes registros en una o varias bases de datos para identificar a una
persona y minimizar la deduccioacuten de datos personales partir de uno o varios datos publicados
iquestQueacute informacioacuten debo prioritariamente anonimizar
Datos personales Informacioacuten numeacuterica alfabeacutetica graacutefica fotograacutefica acuacutestica o
cualquier otro tipo susceptible de recogida registro tratamiento y transmisioacuten
concerniente a personas fiacutesicas identificadas o identificables (tales como nombre
apellidos estado civil sexo edad domicilio identificacioacuten personal nuacutemero de
teleacutefono etc)10
Informacioacuten sensible Informacioacuten considerada como estrictamente confidencial
Informacioacuten y caracteriacutesticas referentes a la edad procedencia salud raza religioacuten
ideologiacutea afiliacioacuten finanzas etc se consideran de caraacutecter sensible y requieren de
una proteccioacuten especial11
iquestQueacute logro
Garantizar que mis datos publicados cuentan con medidas de proteccioacuten de datos
personales
Eliminar de manera efectiva el riesgo de re-identificacioacuten
Evitar que el procesamiento de mis datos tenga consecuencias negativas para alguna
persona
Disponer muchos maacutes datos sin invadir la informacioacuten personal
iexclRecomendaciones
Implemente actividades de proteccioacuten de la privacidad de los datos personales antes
de publicarlos
Elimine cualquier identificador directo de la persona (nombre documento de
identidad etc)
8 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 9 httpdleraeesid=2jjMiRi 10 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 11 Ibidem
16 Buenas praacutecticas para la publicacioacuten de datos
Reemplace los identificadores directos por coacutedigos de referencia pseudoacutenimos
(algoritmos AES12 o un hash cifrado HMAC13) coacutedigos arbitrarios o aleatorios
Si reemplazando el identificador directo auacuten es faacutecil identificar a la persona elimine el
dato
Clasifique yo categorice los datos
Redondee los datos numeacutericos hacia arriba o hacia abajo
Evaluacutee antes durante y despueacutes de publicados los datos si la anonimizacioacuten de sus
datos es suficiente y evaluacutee regularmente los riesgos existentes
Para maacutes informacioacuten consulte los Lineamientos para la Anonimizacioacuten de micro datos
Ejemplo 1
Antes de publicar sus datos retire el identificador directo de la persona En este caso
reemplace en nuacutemero de documento que identifica al usuario y reemplaacutecelo por un
consecutivo
Usuario Beneficio Usuario Beneficio
80123456 Subsidio de vivienda Usuario 1 Subsidio de vivienda
51123456 Subsidio de alimentacioacuten Usuario 2 Subsidio de alimentacioacuten
19123456 Subsidio al adulto mayor Usuario 3 Subsidio al adulto mayor
53123456 Subsidio de desempleo Usuario 4 Subsidio de desempleo
Ejemplo 2
Clasifique o categorice sus datos En este ejemplo asigne rangos a la edad de manera tal que el
titular del registro no sea identificable por este dato
Usuario Edad Usuario Rango de edad
Usuario 1 11 antildeos Usuario 1 Entre 10 y 15 antildeos
Usuario 2 22 antildeos Usuario 2 Entre 20 y 25 antildeos
Usuario 3 36 antildeos Usuario 3 Entre 35 y 40 antildeos
Usuario 4 63 antildeos Usuario 4 Entre 60 y 65 antildeos
12 Advanced Encryption Standard puede consultar como ha sido implementado este algoritmo en httpsrevistasudistritaleducoojsindexphpTecnuraarticleview72368892 13 Hash-based Message Authentication Code puede consultar como se crea este cifrado en httpsdocsoraclecomcdE19253-01819-7804wanboottasks2-51indexhtml
17 Buenas praacutecticas para la publicacioacuten de datos
5 Publicar los datos en formatos estaacutendar reutilizables y legibles por aplicaciones informaacuteticas
Un formato puede ser definido como la estructura de un disco dividido en campos y pistas
seguacuten un determinado sistema operativo lo que permite almacenar en eacutel informacioacuten14
baacutesicamente es la forma en que se codifican los datos en un archivo informaacutetico
Actualmente conocemos formatos comunes de almacenamiento como el doc una extensioacuten
de Word que almacena texto y cuyo propietario es la compantildeiacutea Microsoft Pero iquestqueacute pasa si un
usuario quiere abrir un documento doc en un procesador de texto diferente a Word
difiacutecilmente va a poder conocer el contenido de dicho documento sin tener esta licencia
Lo que queremos lograr con la implementacioacuten de esta praacutectica es que todos los usuarios que
encuentren mis datos puedan accederlos sin necesidad de contar con un software o aplicacioacuten
informaacutetica especiacutefica
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos puedan ser extraiacutedos transformados y procesados por aplicaciones
informaacuteticas
Que mis datos puedan ser compartidos e intercambiados entre sistemas
Disminuir los costos y los tiempos en el uso y la transformacioacuten de mis datos
iexclRecomendaciones
Prefiera publicar su conjunto de datos en formatos abiertos o no propietario ya que
estos facilitan el uso re-uso y distribucioacuten de estos Se busca que un mayor nuacutemero de
aplicaciones informaacuteticas pueda extraer leer y transformar los datos generando mayor
uso y re-uso por los usuarios
Disponga sus datos en muacuteltiples formatos con el fin de incrementar el acceso a los
mismos Se busca que el mayor nuacutemero de usuarios pueda utilizar los datos sin tener
que transformarlos primero en su formato preferido
Utilice Web Services para mejorar el intercambio e interoperabilidad de los datos
publicados
14 httpdleraeessrvsearchm=30ampw=formato
18 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
A continuacioacuten encontraraacute extensiones de formato propietario y no propietario prefiera para
la publicacioacuten de sus datos las extensiones de la derecha
FORMATO PROPIETARIO FORMATO NO PROPIETARIO
DOC GDB TXT ASCII Grid KML RDF
XLS DWG CSV GeoJSON DXF XML
PPT SHP JSON GML ODF
Ejemplo 2
Si no fue posible utilizar una extensioacuten de formato no propietario publique sus datos en una
variedad de formatos que le permita al usuario acceder a los datos desde diferentes
aplicaciones informaacuteticas
Ejemplo 3
Para publicar sus datos conozca diferentes tipos de Web Services que viajan en la red utilizando extensiones XML
SOAP httpswwww3orgTRsoap
REST httprestelksteinorg
WMS httpwwwopengeospatialorgstandardswms
WFS httpwwwopengeospatialorgstandardswfs
WCS httpwwwopengeospatialorgstandardswcs
19 Buenas praacutecticas para la publicacioacuten de datos
6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos publicados
Un diccionario estaacute definido como un repertorio en forma de libro o en soporte electroacutenico en el
que se recogen seguacuten un orden determinado las palabras o expresiones de una o maacutes lenguas
o de una materia concreta acompantildeadas de su definicioacuten equivalencia o explicacioacuten15
especiacuteficamente en un diccionario de datos se encuentran los conceptos de los datos y sus
propiedades (atributos dominios asociaciones y operaciones) acompantildeados de una definicioacuten
en donde se identifica el propoacutesito alcance y campo de aplicacioacuten del dato publicado
Lograr que los usuarios de mis datos entiendan la informacioacuten que estaacute publicada le permitiraacute
decidir si satisfacen o no su necesidad y le facilitaraacute la decisioacuten para explotar lo datos
Para maacutes informacioacuten consulte el Instructivo Diccionario de Datos
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que se eviten ambiguumledades en la interpretacioacuten de mis datos
Que mis datos publicados esteacuten unificados y consistentes
Que los usuarios comprendan mejor y dispongan de claridad sobre los conceptos de
mis datos
iexclRecomendaciones
Publique como miacutenimo un diccionario de datos que contenga la caracterizacioacuten del
conjunto de datos producidos por su entidad
Cree el diccionario de datos teniendo en cuenta como miacutenimo la siguiente informacioacuten
Nombre del atributo Nombre que identifica de manera clara un atributo
Definicioacuten Descripcioacuten del atributo
Tipo de dato Tipo de valor del atributo
Unidad de medida Expresa la unidad de medida del atributo
Dominio Determina si el atributo tiene asociado un dominio
15 httpdleraeesw=diccionario
20 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
Para el conjunto de datos ldquoEstablecimientos Educativos en Bogotaacuterdquo publicariacuteamos un
diccionario de datos similar al siguiente
Nombre del atributo Definicioacuten Tipo de dato
Unidad de Medida
Dominio
Coacutedigo del establecimiento
Coacutedigo DANE asignado al Institucioacuten Educativa Decimal
Nombre del establecimiento
Nombre de la Institucioacuten Educativa Cadena de Caracteres
Aacuterea construida del establecimiento
Aacuterea construida de la Institucioacuten Educativa Decimal Metros
cuadrados
Sector
Clasificacioacuten asignada seguacuten la naturaleza juriacutedica la cual define las principales caracteriacutesticas que desde lo juriacutedico - administrativo y tiene que ver con el origen de su creacioacuten
Entero
EESector
No podriacuteamos olvidar detallar el dominio asociado
Atributo Nombre del Dominio Coacutedigo Definicioacuten
EESector
Oficial 1
Es una institucioacuten donde su naturaleza de servicio puacuteblico cultural y su funcioacuten social le es inherente cumpliendo con las disposiciones legales y estatutarias que las rigen donde sus rentas se conservan y se aplican debidamente
Privado 2
Es una institucioacuten constituida como persona juriacutedica de utilidad comuacuten donde sus rentas se conservan y se aplican debidamente y que en todo lo esencial se cumple con la voluntad de sus fundadores
21 Buenas praacutecticas para la publicacioacuten de datos
7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos
Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para
acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que
conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como
cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o
software
En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos
publicados se proporcionen recursos o documentos adicionales que puedan ser consultados
yo descargados traveacutes de enlaces o links de otro sitio Web
Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los
procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los
documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad
entre otros
iquestQueacute logro
Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos
Que los usuarios comprendan mejor mis datos
Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios
iexclRecomendaciones
Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el
horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del
dato
No olvide vincular o registrar esta informacioacuten en el metadato
16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp
22 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos
Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318
Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57
Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30
Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217
Ejemplo 2
La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en
httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos
o Gestioacuten de los humedales
o Poliacutetica de Humedales del Distrito Capital
o Normatividad
o Planes de Manejo Ambiental
o Comiteacute distrital de humedales documentos de consulta normatividad
23 Buenas praacutecticas para la publicacioacuten de datos
8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza
La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten
juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado
Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para
satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas
y especificaciones establecidas
Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades
de estos sin embargo en este aparte citaremos los elementos principales que usted o su
entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad
Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de
los datos espaciales
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que los usuarios hablen bien de mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean maacutes compartidos
Que mis datos sean maacutes confiables
Recomendacioacuten 1
Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten
descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten
corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Suba 200 Tunjuelito 500
Ameacutericas 100
850
Tunjuelito 500
18 httpdleraeesid=6nVpk8P|6nXVL1Z
Campo duplicado
Campo inconsistente
Campo vaciacuteo
24 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 2
Identifique y transforme si es necesario los datos que hayan sido registrados en un formato
diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida
del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de
formatordquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Tunjuelito 5008 Tunjuelito 500
Fontiboacuten 40 Fontiboacuten 430
Tunjuelito 500 Tunjuelito 500
Recomendacioacuten 3
Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos
se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de
clasificacioacutenrdquo
Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad
Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10
Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20
Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40
Recomendacioacuten 4
Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos
correspondan a valores conocidos como verdaderos El elemento de calidad asociado se
denomina ldquoexactitud de atributos cuantitativosrdquo
Localidad Mes Temperatura Localidad Mes Temperatura
Chapinero Enero 7degC Chapinero Enero 7degC
Suba Agosto -15degC Suba Agosto 15degC
Tunjuelito Abril 60degC Tunjuelito Abril 16degC
Clasificacioacuten inconsistente
Formato inconsistente
Valor inconsistente
25 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 5
Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por
ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que
las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad
asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo
Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro
00 20580101 00 20180101
01 20180102 01 20180102
126 20510403 126 20180103
20 20180104 20 20180104
Recomendacioacuten 6
Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes
de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se
denomina ldquoconsistencia temporalrdquo
Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio
Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231
Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231
Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112
Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112
Recomendacioacuten 7
Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta
corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud
posicionalrdquo
Eventos Deportivos Lugar Eventos Deportivos Lugar
Evento 1 AK 30 25 90 Evento 1 AK 30 25 90
Evento 2 AC 63 215 20 Evento 2 Parque La Florida
Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar
Fecha
inconsistente
Fechas no secuenciales
Lugar inexistente
26 Buenas praacutecticas para la publicacioacuten de datos
9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten
El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de
alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una
institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las
variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a
cabo los traacutemites de una entidad etc
Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un
espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados
Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten
asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un
establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario
identificar la localizacioacuten del dato publicado
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean puedan compartir en maacutes plataformas
Que los usuarios puedan visualizar mis datos en un mapa
iexclRecomendaciones
Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o
lugares geograacuteficos
Ejemplo 1
Incluya direcciones que permitan localizar espacialmente sus datos
Programa Direccioacuten
Registro de atencioacuten a la ciudadaniacutea CL 138 108 16
Centro de autocuidado KR 18 D 77 A 11 SUR
Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46
Centro de autocuidado KR 18 D 73 A 33 SUR
19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico
27 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 2
Utilice coordenadas para indicar la ubicacioacuten de sus datos
EPS Coordenada X Coordenada Y
EPS Convida 9087496334 1051342164
Capital Salud EPS 986321006 954875808
EPS Famisanar 9742508812 8837031501
Aliansalud EPS 9716943356 9659706891
Salud Total EPS 9215624975 9625189518
Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro
de su metadato el Sistema de referencia empleado
MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686
MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116
MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458
Ejemplo 3
Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute
Usuario Vacunado Lugar de Vacunacioacuten
Usuario 1 BOSQUE IZQUIERDO
Usuario 2 LAGUNITAS URBANO
Usuario 3 LA CAPUCHINA
Usuario 4 SAN JOSE SUR
Usuario 5 VENECIA
28 Buenas praacutecticas para la publicacioacuten de datos
10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado
Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el
dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los
usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la
citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el
formato de este
En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero
de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de
su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la
informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado
y reconocido faacutecilmente entre los demaacutes datos
Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de
identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por
cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta
gestioacuten y reutilizacioacuten de sus datos
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean compartidos en maacutes plataformas
Que mis datos puedan vincularse a otros datos en el entorno Web
Que mis datos sean encontrados usados y citados inequiacutevocamente
Garantizar y monitorear la reutilizacioacuten de mis datos
Reducir del uso erroacuteneo de mis datos
iexclRecomendaciones
Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar
Utilice siempre el identificador asignado para publicar sus datos
29 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos
httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la
creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la
asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten
de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito
garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar
descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando
asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten
geograacutefica
Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems
publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace
referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades
territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el
planeamiento del suelo urbano de expansioacuten y ruralrdquo
30 Buenas praacutecticas para la publicacioacuten de datos
OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS
Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten
Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado
Nivel Baacutesico
En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)
Nivel Intermedio
Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)
Nivel Avanzado
Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)
31 Buenas praacutecticas para la publicacioacuten de datos
REFERENCIAS
Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best
Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp
Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices
for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp
Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington
Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec
Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI
Recommendation URL httpdublincoreorgdocumentsdcmi-terms
Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C
Recommendation URL httpswwww3orgTRvocab-dcat
ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de
2014 International Standard
ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers
noviembre de 2009 International Standard
ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013
International Standard
Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best
Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp
T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax
Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986
World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg
W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second
Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-
overview
W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado
el 12 de septiembre de 2018
6 Buenas praacutecticas para la publicacioacuten de datos
BUENAS PRAacuteCTICAS PARA LA PUBLICACIOacuteN DE DATOS
1 Proporcionar metadatos asociados con los datos publicados Estos metadatos permitiraacuten conocer las caracteriacutesticas de los datos y deberaacuten ser interpretables tanto por usuarios como por aplicaciones informaacuteticas
Un metadato entendido como la informacioacuten acerca de un recurso1 es un dato con muchos
elementos que le permiten al usuario conocer desde la visioacuten del productor las caracteriacutesticas
propias de los datos publicados tales como las fechas de creacioacuten y actualizacioacuten el canal de
acceso la calidad del dato las condiciones de uso quieacuten lo produjo quieacuten lo distribuye etc
esto quiere decir que el metadato explica el dato en eacutel estaacute contenida toda la informacioacuten
relevante del dato
En la vida cotidiana la ceacutedula de ciudadaniacutea es el documento que contiene la informacioacuten
miacutenima de las personas (nombre sexo fecha de nacimiento GS RH estatura lugar de
nacimiento) esta informacioacuten permite que el ciudadano se identifique en cualquier lugar del
territorio nacional ante otras personas o autoridades que requieran conocerlo
Con los datos el tratamiento es similar el dato corresponde a la persona y el metadato
corresponde a la ceacutedula de ciudadaniacutea Asiacute como en Colombia todo ciudadano debe portar su
documento de identificacioacuten en el entorno Web todo dato debe portar su metadato en otras
palabras el metadato es parte integral del dato y existe entre ambos un viacutenculo inseparable
Los datos siempre deberaacuten publicarse con su respectivo metadato este uacuteltimo deberaacute contar
con informacioacuten completa y estandarizada que garantice que los usuarios encuentren
conozcan y utilicen los datos que producimos
Recuerde que la publicacioacuten del metadato es igual de importante que la publicacioacuten del
dato
iquestQueacute logro
Al publicar datos en conjunto con su metadato obtengo
Que mis datos sean encontrados y utilizados por maacutes usuarios Que los usuarios logren una correcta interpretacioacuten de la naturaleza calidad y
distribucioacuten de mis datos
Que mis datos sean entendidos evaluados y retroalimentados por maacutes usuarios
Que mis datos puedan ser compartidos e intercambiados entre sistemas
Que los motores de buacutesqueda encuentren mis datos publicados
Que las aplicaciones informaacuteticas procesen mejor y en mayor cantidad mis datos
1 ISO 19115-12014 410
7 Buenas praacutecticas para la publicacioacuten de datos
iexclRecomendaciones
Disponga metadatos suficientes que permitan a los usuarios tener la informacioacuten
correcta para decidir si el dato publicado satisface o no sus necesidades
Incluya en sus metadatos la ubicacioacuten del dato a traveacutes de la descripcioacuten del lugar
(localidad parque riacuteo etc) o a traveacutes de localizacioacuten por coordenadas geograacuteficas x e
y
Publique sus metadatos como una paacutegina Web HTML (HyperText Markup Language) o
simplemente como un archivo de texto separado
Disponga sus metadatos en el formato baacutesico de intercambio XML (Extensible Markup
Language) o en formatos estaacutendar maacutes sofisticados como JSON (JavaScript Object
Notation)
Al igual que los datos puede publicar los metadatos en muacuteltiples formatos desde la
misma URL
Tenga en cuenta que IDECA a partir de estaacutendares internacionales ha definido los
elementos miacutenimos que debe contener el metadato y que estos pueden ser utilizados
en la publicacioacuten de sus metadatos para facilitar el intercambio de estos
Figura 1 Secciones del Perfil de Metadatos IDECA
Para maacutes informacioacuten consulte la Cartilla para la creacioacuten de metadatos geograacuteficos en
Bogotaacute Distrito Capital
8 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
En la siguiente URL se observa un metadato dispuesto para que los usuarios puedan consultar
faacutecilmente la informacioacuten asociada al dato publicado (Desarrollo Econoacutemico Rural Bogotaacute
DC)
httpmetadatosidecagovcogeoportalcatalogsearchresourcedetailspageuuid=A8AB6E
7A-55FB-40DA-85E1-0AA6B4FE6CE3
Ejemplo 2
En la siguiente URL estaacute disponible el metadato de un nivel de informacioacuten dispuesto por la
Unidad Administrativa Especial de Catastro Distrital ndash UAECD ndash en formato XML (legible por
aplicaciones informaacuteticas
httpmetadatosidecagovcogeoportalrestdocumentid=7BBE5F9AEE-1FBC-4C13-822F-
F2CE44AFDD7E7D
9 Buenas praacutecticas para la publicacioacuten de datos
2 Proporcionar una licencia en donde se especifiquen las limitaciones yo restricciones de acceso y uso de los datos
Una licencia entendida como las condiciones legales bajo las cuales estaacute disponible la obra2 es
un instrumento mediante el cual el propietario del dato autoriza o no a los usuarios para que
accedan a su contenido y tambieacuten lo faculta para su utilizacioacuten Existen diferentes tipos de
licencia para la distribucioacuten y explotacioacuten de obras y cuyo propoacutesito es regular las condiciones
de acceso y uso de los datos
Dependiendo el acceso autorizado a los datos las licencias pueden clasificarse en
Privativas o restrictivas Aquellas licencias conocidas como cerradas o no libres donde la mayoriacutea de las veces solo el autor puede usar la obra o en caso contrario se definen condiciones especiacuteficas que se deben cumplir para hacer uso de la informacioacuten
Semilibres Aquellas licencias que requieren autorizaciones para que los usuarios utilicen copien distribuyan o modifiquen su contenido
Libres o abiertas Aquellas licencias que en teacuterminos generales permiten usar distribuir y compartir los datos con muy pocas restricciones
Cuando un dato se publica acompantildeado de su licencia el usuario conoce las condiciones de
acceso uso y distribucioacuten de los datos que estaacute consumiendo de esta forma se garantiza que
los datos se distribuyan seguacuten los intereses de la entidad que los produce y se minimizan los
usos indebidos de los datos por parte de los usuarios
Ahora bien definir la licencia adecuada para cada dato dependeraacute de las condiciones que
establezca la entidad productora de este Revise los ejemplos y defina la licencia maacutes adecuada
para sus datos
Para maacutes informacioacuten consulte el Instructivo para la definicioacuten de licencias de datos
iquestQueacute logro
Que el usuario evaluacutee si puede o no usar mis datos
Que el usuario conozca las condiciones de acceso uso y manejo sobre los datos
disponibles
Dar claridad y potenciar el uso de los datos disponibles
Que el usuario de los reconocimientos respectivos a la entidad productora de los datos
Que se genere valor agregado sobre los datos disponibles en caso de asignar una
licencia abierta
2 Recuperado de httpsopendefinitionorgod21es
10 Buenas praacutecticas para la publicacioacuten de datos
iexclRecomendaciones
Identifique la licencia que mejor se acomode a su modelo de negocio Recuerde que
mediante la Ley 1712 de 2014 se reguloacute el derecho de acceso a la informacioacuten puacuteblica
y se incluyeron los principios de facilitacioacuten gratuidad y divulgacioacuten proactiva de la
informacioacuten
Disponga una licencia para su conjunto de datos a traveacutes de un enlace una copia
incorporada o dentro del metadato
Prefiera el uso de licencias abiertas de este modo sus datos seraacuten utilizados en una
mayor cantidad de productos servicios y mercados
Ejemplo 1
Mundialmente conocidas las licencias Creative Commons3 tienen como objetivo fortalecer a los
creadores para que sean quienes definan los teacuterminos en que sus obras pueden ser usadas queacute
derechos desean entregar y en queacute condiciones lo haraacuten A continuacioacuten encontraraacute los
enlaces de acceso para conocer las condiciones de cada una de las licencias disponibles
CC0 10 httpscreativecommonsorgpublicdomainzero10deedes
CC BY 40 httpscreativecommonsorglicensesby40
CC BY-SA 40 httpscreativecommonsorglicensesby-sa40
CC BY-ND 40 httpscreativecommonsorglicensesby-nd40
CC BY-NC 40 httpscreativecommonsorglicensesby-nc40
CC BY-NC-SA 40
httpscreativecommonsorglicensesby-nc-sa40
Ejemplo 2
Tambieacuten existen las licencias abiertas para datos Open Data Commons4 proporcionadas por la
mundialmente conocida red Open Knowledge Foundation Network ndash OKFN5 puede consultar
las condiciones ingresando a los siguientes enlaces
ODbL 10 httpsopendatacommonsorglicensesodblsummary
PDDL 10 httpsopendatacommonsorglicensespddlsummary
ODC-BY 10 httpsopendatacommonsorglicensesbysummary
3 httpcreativecommonsorg 4 httpopendatacommonsorg 5 httpsokfnorg
11 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 3
El Mapa de referencia para Bogotaacute estaacute publicado en
httpswwwidecagovcoesserviciosmapa-de-referencia bajo las condiciones descritas en la
ldquoLICENCIA ABIERTA O CONDICIONES DE USO PARA DATOS ABIERTOS DE LA INFRAESTRUCTURA
INTEGRADA DE DATOS ESPACIALES PARA EL DISTRITO CAPITAL (IDECA)rdquo
httpswwwidecagovcoeslicenciaabierta
12 Buenas praacutecticas para la publicacioacuten de datos
3 Utilizar vocabularios estandarizados y reutilizables en la estructuracioacuten y publicacioacuten de los datos
Un vocabulario define los conceptos y las relaciones que se utilizan para describir y representar
un aacuterea de intereacutes6 Cuando se publican datos en la Web los vocabularios permiten integrar
datos cuando existen ambiguumledades en los teacuterminos utilizados en los diferentes conjuntos de
datos En la praacutectica un vocabulario es un conjunto de palabras que permiten a dos usuarios
comunicarse entre siacute La efectividad de dicha comunicacioacuten radica en que el significado de una
palabra para el usuario emisor sea el mismo que para el usuario receptor independientemente
de si utilizaron el mismo teacutermino
Cuando se habla de interoperabilidad de datos lo que se espera es que tanto los usuarios
como las aplicaciones informaacuteticas entiendan y comprendan la mayor cantidad de informacioacuten
que estaacuten consumiendo Para conseguir esto las comunidades de datos han identificado
vocablos palabras o teacuterminos de uso comuacuten los cuales cuentan con significados apropiados y
que actualmente se encuentran integrados y estructurados en diferentes estaacutendares
internacionales
Se recomienda utilizar vocabularios de este tipo para estandarizar los datos contenidos en la
informacioacuten publicada
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios Que se reduzca la ambiguumledad en la interpretacioacuten de mis datos Que mis datos sean interoperables Que mis datos sean procesados en entornos nacionales e internacionales Que mis datos puedan ser compartidos e intercambiados entre sistemas Que mis datos sean maacutes confiables
iexclRecomendaciones
Consulte normas locales o vocabularios internacionales para la estructuracioacuten7 de sus
datos
Apropie los vocabularios consultados y adapte sus datos a estos en los casos en que sea
posible
Incluya vocabularios ya definidos y reconocidos internacionalmente cuando vaya a
producir nuevos datos
6 httpswwww3orgstandardssemanticwebontology 7 Estructurar significa ajustar los datos a un esquema fijo
13 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
A continuacioacuten se presentan algunos vocabularios internacionales que puede consultar y
apropiar para optimizar el intercambio de sus datos
Data Catalog Vocabulary (DCAT) httpswwww3orgTRvocab-dcatclass-catalog
FOAF Vocabulary Specification httpxmlnscomfoaf01
ISOTC 211 Geographic informationGeomatics Terminology
httpwwwisotc211orgTerminologyhtm
The RDF Data Cube Vocabulary httpswwww3orgTR2014REC-vocab-data-cube-20140116
ODRL Vocabulary amp Expression 22
httpswwww3orgTR2018REC-odrl-vocab-20180215
HTTP Vocabulary in RDF 10 httpswwww3orgTR2017NOTE-HTTP-in-RDF10-20170202
vCard Ontology - for describing People and Organizations
httpswwww3orgTRvcard-rdf
Ejemplo 2
En el contexto Nacional el Ministerio de Tecnologiacuteas de la Informacioacuten y las Comunicaciones ha
establecido el Lenguaje Comuacuten de Intercambio de como un instrumento de consulta que
contiene la definicioacuten de los elementos de datos conceptualizados por las entidades del
estado La consulta la puede realizar en httplenguajeminticgovco
14 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 3
La especificacioacuten vCard disponible en httpswwww3orgTRvcard-rdf promueve un
vocabulario especiacutefico para describir personas y organizaciones
Uno de los vocablos que describe esta especificacioacuten es la ldquodireccioacuten de entregardquo llamado
dentro del vocabulario como ADR y definido como ldquola direccioacuten del objeto representado en
partes estructuradasrdquo
Ahora bien este vocabulario especifica los componentes de la direccioacuten de entrega para el
objeto asiacute el nombre del paiacutes la localidad el coacutedigo postal la regioacuten y la direccioacuten dada por
viacuteas (calles y carreras en el caso colombiano) Esto quiere decir que cualquiera de los
componentes descritos puede usarse como direccioacuten de entrega vaacutelida ya que son equivalentes
entre siacute
Aunque en el vocabulario la direccioacuten de entrega se llame ADR el usuario de la informacioacuten
entenderaacute que un nombre de paiacutes o un coacutedigo postal pueden interpretarse como ADR
15 Buenas praacutecticas para la publicacioacuten de datos
4 Anonimizar los datos de caraacutecter personal informacioacuten estadiacutestica informacioacuten indirectamente identificable e informacioacuten sensible o confidencial
Anonimizar es el proceso que impide la identificacioacuten de las unidades de estudio que son fuente
para los registros individuales de un conjunto8 de datos o maacutes claro es la aplicacioacuten de teacutecnicas
que permitan expresar un dato relativo a personas eliminando la referencia a su identidad9
Baacutesicamente lo que se busca es reducir los riesgos en el uso y procesamiento de datos
personales evitar la extraccioacuten de registros que identifican a una persona reducir la
combinacioacuten de dos o maacutes registros en una o varias bases de datos para identificar a una
persona y minimizar la deduccioacuten de datos personales partir de uno o varios datos publicados
iquestQueacute informacioacuten debo prioritariamente anonimizar
Datos personales Informacioacuten numeacuterica alfabeacutetica graacutefica fotograacutefica acuacutestica o
cualquier otro tipo susceptible de recogida registro tratamiento y transmisioacuten
concerniente a personas fiacutesicas identificadas o identificables (tales como nombre
apellidos estado civil sexo edad domicilio identificacioacuten personal nuacutemero de
teleacutefono etc)10
Informacioacuten sensible Informacioacuten considerada como estrictamente confidencial
Informacioacuten y caracteriacutesticas referentes a la edad procedencia salud raza religioacuten
ideologiacutea afiliacioacuten finanzas etc se consideran de caraacutecter sensible y requieren de
una proteccioacuten especial11
iquestQueacute logro
Garantizar que mis datos publicados cuentan con medidas de proteccioacuten de datos
personales
Eliminar de manera efectiva el riesgo de re-identificacioacuten
Evitar que el procesamiento de mis datos tenga consecuencias negativas para alguna
persona
Disponer muchos maacutes datos sin invadir la informacioacuten personal
iexclRecomendaciones
Implemente actividades de proteccioacuten de la privacidad de los datos personales antes
de publicarlos
Elimine cualquier identificador directo de la persona (nombre documento de
identidad etc)
8 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 9 httpdleraeesid=2jjMiRi 10 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 11 Ibidem
16 Buenas praacutecticas para la publicacioacuten de datos
Reemplace los identificadores directos por coacutedigos de referencia pseudoacutenimos
(algoritmos AES12 o un hash cifrado HMAC13) coacutedigos arbitrarios o aleatorios
Si reemplazando el identificador directo auacuten es faacutecil identificar a la persona elimine el
dato
Clasifique yo categorice los datos
Redondee los datos numeacutericos hacia arriba o hacia abajo
Evaluacutee antes durante y despueacutes de publicados los datos si la anonimizacioacuten de sus
datos es suficiente y evaluacutee regularmente los riesgos existentes
Para maacutes informacioacuten consulte los Lineamientos para la Anonimizacioacuten de micro datos
Ejemplo 1
Antes de publicar sus datos retire el identificador directo de la persona En este caso
reemplace en nuacutemero de documento que identifica al usuario y reemplaacutecelo por un
consecutivo
Usuario Beneficio Usuario Beneficio
80123456 Subsidio de vivienda Usuario 1 Subsidio de vivienda
51123456 Subsidio de alimentacioacuten Usuario 2 Subsidio de alimentacioacuten
19123456 Subsidio al adulto mayor Usuario 3 Subsidio al adulto mayor
53123456 Subsidio de desempleo Usuario 4 Subsidio de desempleo
Ejemplo 2
Clasifique o categorice sus datos En este ejemplo asigne rangos a la edad de manera tal que el
titular del registro no sea identificable por este dato
Usuario Edad Usuario Rango de edad
Usuario 1 11 antildeos Usuario 1 Entre 10 y 15 antildeos
Usuario 2 22 antildeos Usuario 2 Entre 20 y 25 antildeos
Usuario 3 36 antildeos Usuario 3 Entre 35 y 40 antildeos
Usuario 4 63 antildeos Usuario 4 Entre 60 y 65 antildeos
12 Advanced Encryption Standard puede consultar como ha sido implementado este algoritmo en httpsrevistasudistritaleducoojsindexphpTecnuraarticleview72368892 13 Hash-based Message Authentication Code puede consultar como se crea este cifrado en httpsdocsoraclecomcdE19253-01819-7804wanboottasks2-51indexhtml
17 Buenas praacutecticas para la publicacioacuten de datos
5 Publicar los datos en formatos estaacutendar reutilizables y legibles por aplicaciones informaacuteticas
Un formato puede ser definido como la estructura de un disco dividido en campos y pistas
seguacuten un determinado sistema operativo lo que permite almacenar en eacutel informacioacuten14
baacutesicamente es la forma en que se codifican los datos en un archivo informaacutetico
Actualmente conocemos formatos comunes de almacenamiento como el doc una extensioacuten
de Word que almacena texto y cuyo propietario es la compantildeiacutea Microsoft Pero iquestqueacute pasa si un
usuario quiere abrir un documento doc en un procesador de texto diferente a Word
difiacutecilmente va a poder conocer el contenido de dicho documento sin tener esta licencia
Lo que queremos lograr con la implementacioacuten de esta praacutectica es que todos los usuarios que
encuentren mis datos puedan accederlos sin necesidad de contar con un software o aplicacioacuten
informaacutetica especiacutefica
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos puedan ser extraiacutedos transformados y procesados por aplicaciones
informaacuteticas
Que mis datos puedan ser compartidos e intercambiados entre sistemas
Disminuir los costos y los tiempos en el uso y la transformacioacuten de mis datos
iexclRecomendaciones
Prefiera publicar su conjunto de datos en formatos abiertos o no propietario ya que
estos facilitan el uso re-uso y distribucioacuten de estos Se busca que un mayor nuacutemero de
aplicaciones informaacuteticas pueda extraer leer y transformar los datos generando mayor
uso y re-uso por los usuarios
Disponga sus datos en muacuteltiples formatos con el fin de incrementar el acceso a los
mismos Se busca que el mayor nuacutemero de usuarios pueda utilizar los datos sin tener
que transformarlos primero en su formato preferido
Utilice Web Services para mejorar el intercambio e interoperabilidad de los datos
publicados
14 httpdleraeessrvsearchm=30ampw=formato
18 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
A continuacioacuten encontraraacute extensiones de formato propietario y no propietario prefiera para
la publicacioacuten de sus datos las extensiones de la derecha
FORMATO PROPIETARIO FORMATO NO PROPIETARIO
DOC GDB TXT ASCII Grid KML RDF
XLS DWG CSV GeoJSON DXF XML
PPT SHP JSON GML ODF
Ejemplo 2
Si no fue posible utilizar una extensioacuten de formato no propietario publique sus datos en una
variedad de formatos que le permita al usuario acceder a los datos desde diferentes
aplicaciones informaacuteticas
Ejemplo 3
Para publicar sus datos conozca diferentes tipos de Web Services que viajan en la red utilizando extensiones XML
SOAP httpswwww3orgTRsoap
REST httprestelksteinorg
WMS httpwwwopengeospatialorgstandardswms
WFS httpwwwopengeospatialorgstandardswfs
WCS httpwwwopengeospatialorgstandardswcs
19 Buenas praacutecticas para la publicacioacuten de datos
6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos publicados
Un diccionario estaacute definido como un repertorio en forma de libro o en soporte electroacutenico en el
que se recogen seguacuten un orden determinado las palabras o expresiones de una o maacutes lenguas
o de una materia concreta acompantildeadas de su definicioacuten equivalencia o explicacioacuten15
especiacuteficamente en un diccionario de datos se encuentran los conceptos de los datos y sus
propiedades (atributos dominios asociaciones y operaciones) acompantildeados de una definicioacuten
en donde se identifica el propoacutesito alcance y campo de aplicacioacuten del dato publicado
Lograr que los usuarios de mis datos entiendan la informacioacuten que estaacute publicada le permitiraacute
decidir si satisfacen o no su necesidad y le facilitaraacute la decisioacuten para explotar lo datos
Para maacutes informacioacuten consulte el Instructivo Diccionario de Datos
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que se eviten ambiguumledades en la interpretacioacuten de mis datos
Que mis datos publicados esteacuten unificados y consistentes
Que los usuarios comprendan mejor y dispongan de claridad sobre los conceptos de
mis datos
iexclRecomendaciones
Publique como miacutenimo un diccionario de datos que contenga la caracterizacioacuten del
conjunto de datos producidos por su entidad
Cree el diccionario de datos teniendo en cuenta como miacutenimo la siguiente informacioacuten
Nombre del atributo Nombre que identifica de manera clara un atributo
Definicioacuten Descripcioacuten del atributo
Tipo de dato Tipo de valor del atributo
Unidad de medida Expresa la unidad de medida del atributo
Dominio Determina si el atributo tiene asociado un dominio
15 httpdleraeesw=diccionario
20 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
Para el conjunto de datos ldquoEstablecimientos Educativos en Bogotaacuterdquo publicariacuteamos un
diccionario de datos similar al siguiente
Nombre del atributo Definicioacuten Tipo de dato
Unidad de Medida
Dominio
Coacutedigo del establecimiento
Coacutedigo DANE asignado al Institucioacuten Educativa Decimal
Nombre del establecimiento
Nombre de la Institucioacuten Educativa Cadena de Caracteres
Aacuterea construida del establecimiento
Aacuterea construida de la Institucioacuten Educativa Decimal Metros
cuadrados
Sector
Clasificacioacuten asignada seguacuten la naturaleza juriacutedica la cual define las principales caracteriacutesticas que desde lo juriacutedico - administrativo y tiene que ver con el origen de su creacioacuten
Entero
EESector
No podriacuteamos olvidar detallar el dominio asociado
Atributo Nombre del Dominio Coacutedigo Definicioacuten
EESector
Oficial 1
Es una institucioacuten donde su naturaleza de servicio puacuteblico cultural y su funcioacuten social le es inherente cumpliendo con las disposiciones legales y estatutarias que las rigen donde sus rentas se conservan y se aplican debidamente
Privado 2
Es una institucioacuten constituida como persona juriacutedica de utilidad comuacuten donde sus rentas se conservan y se aplican debidamente y que en todo lo esencial se cumple con la voluntad de sus fundadores
21 Buenas praacutecticas para la publicacioacuten de datos
7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos
Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para
acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que
conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como
cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o
software
En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos
publicados se proporcionen recursos o documentos adicionales que puedan ser consultados
yo descargados traveacutes de enlaces o links de otro sitio Web
Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los
procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los
documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad
entre otros
iquestQueacute logro
Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos
Que los usuarios comprendan mejor mis datos
Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios
iexclRecomendaciones
Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el
horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del
dato
No olvide vincular o registrar esta informacioacuten en el metadato
16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp
22 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos
Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318
Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57
Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30
Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217
Ejemplo 2
La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en
httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos
o Gestioacuten de los humedales
o Poliacutetica de Humedales del Distrito Capital
o Normatividad
o Planes de Manejo Ambiental
o Comiteacute distrital de humedales documentos de consulta normatividad
23 Buenas praacutecticas para la publicacioacuten de datos
8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza
La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten
juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado
Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para
satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas
y especificaciones establecidas
Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades
de estos sin embargo en este aparte citaremos los elementos principales que usted o su
entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad
Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de
los datos espaciales
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que los usuarios hablen bien de mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean maacutes compartidos
Que mis datos sean maacutes confiables
Recomendacioacuten 1
Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten
descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten
corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Suba 200 Tunjuelito 500
Ameacutericas 100
850
Tunjuelito 500
18 httpdleraeesid=6nVpk8P|6nXVL1Z
Campo duplicado
Campo inconsistente
Campo vaciacuteo
24 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 2
Identifique y transforme si es necesario los datos que hayan sido registrados en un formato
diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida
del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de
formatordquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Tunjuelito 5008 Tunjuelito 500
Fontiboacuten 40 Fontiboacuten 430
Tunjuelito 500 Tunjuelito 500
Recomendacioacuten 3
Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos
se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de
clasificacioacutenrdquo
Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad
Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10
Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20
Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40
Recomendacioacuten 4
Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos
correspondan a valores conocidos como verdaderos El elemento de calidad asociado se
denomina ldquoexactitud de atributos cuantitativosrdquo
Localidad Mes Temperatura Localidad Mes Temperatura
Chapinero Enero 7degC Chapinero Enero 7degC
Suba Agosto -15degC Suba Agosto 15degC
Tunjuelito Abril 60degC Tunjuelito Abril 16degC
Clasificacioacuten inconsistente
Formato inconsistente
Valor inconsistente
25 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 5
Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por
ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que
las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad
asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo
Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro
00 20580101 00 20180101
01 20180102 01 20180102
126 20510403 126 20180103
20 20180104 20 20180104
Recomendacioacuten 6
Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes
de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se
denomina ldquoconsistencia temporalrdquo
Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio
Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231
Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231
Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112
Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112
Recomendacioacuten 7
Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta
corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud
posicionalrdquo
Eventos Deportivos Lugar Eventos Deportivos Lugar
Evento 1 AK 30 25 90 Evento 1 AK 30 25 90
Evento 2 AC 63 215 20 Evento 2 Parque La Florida
Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar
Fecha
inconsistente
Fechas no secuenciales
Lugar inexistente
26 Buenas praacutecticas para la publicacioacuten de datos
9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten
El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de
alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una
institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las
variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a
cabo los traacutemites de una entidad etc
Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un
espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados
Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten
asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un
establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario
identificar la localizacioacuten del dato publicado
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean puedan compartir en maacutes plataformas
Que los usuarios puedan visualizar mis datos en un mapa
iexclRecomendaciones
Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o
lugares geograacuteficos
Ejemplo 1
Incluya direcciones que permitan localizar espacialmente sus datos
Programa Direccioacuten
Registro de atencioacuten a la ciudadaniacutea CL 138 108 16
Centro de autocuidado KR 18 D 77 A 11 SUR
Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46
Centro de autocuidado KR 18 D 73 A 33 SUR
19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico
27 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 2
Utilice coordenadas para indicar la ubicacioacuten de sus datos
EPS Coordenada X Coordenada Y
EPS Convida 9087496334 1051342164
Capital Salud EPS 986321006 954875808
EPS Famisanar 9742508812 8837031501
Aliansalud EPS 9716943356 9659706891
Salud Total EPS 9215624975 9625189518
Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro
de su metadato el Sistema de referencia empleado
MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686
MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116
MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458
Ejemplo 3
Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute
Usuario Vacunado Lugar de Vacunacioacuten
Usuario 1 BOSQUE IZQUIERDO
Usuario 2 LAGUNITAS URBANO
Usuario 3 LA CAPUCHINA
Usuario 4 SAN JOSE SUR
Usuario 5 VENECIA
28 Buenas praacutecticas para la publicacioacuten de datos
10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado
Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el
dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los
usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la
citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el
formato de este
En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero
de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de
su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la
informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado
y reconocido faacutecilmente entre los demaacutes datos
Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de
identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por
cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta
gestioacuten y reutilizacioacuten de sus datos
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean compartidos en maacutes plataformas
Que mis datos puedan vincularse a otros datos en el entorno Web
Que mis datos sean encontrados usados y citados inequiacutevocamente
Garantizar y monitorear la reutilizacioacuten de mis datos
Reducir del uso erroacuteneo de mis datos
iexclRecomendaciones
Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar
Utilice siempre el identificador asignado para publicar sus datos
29 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos
httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la
creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la
asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten
de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito
garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar
descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando
asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten
geograacutefica
Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems
publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace
referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades
territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el
planeamiento del suelo urbano de expansioacuten y ruralrdquo
30 Buenas praacutecticas para la publicacioacuten de datos
OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS
Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten
Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado
Nivel Baacutesico
En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)
Nivel Intermedio
Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)
Nivel Avanzado
Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)
31 Buenas praacutecticas para la publicacioacuten de datos
REFERENCIAS
Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best
Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp
Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices
for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp
Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington
Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec
Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI
Recommendation URL httpdublincoreorgdocumentsdcmi-terms
Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C
Recommendation URL httpswwww3orgTRvocab-dcat
ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de
2014 International Standard
ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers
noviembre de 2009 International Standard
ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013
International Standard
Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best
Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp
T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax
Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986
World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg
W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second
Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-
overview
W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado
el 12 de septiembre de 2018
7 Buenas praacutecticas para la publicacioacuten de datos
iexclRecomendaciones
Disponga metadatos suficientes que permitan a los usuarios tener la informacioacuten
correcta para decidir si el dato publicado satisface o no sus necesidades
Incluya en sus metadatos la ubicacioacuten del dato a traveacutes de la descripcioacuten del lugar
(localidad parque riacuteo etc) o a traveacutes de localizacioacuten por coordenadas geograacuteficas x e
y
Publique sus metadatos como una paacutegina Web HTML (HyperText Markup Language) o
simplemente como un archivo de texto separado
Disponga sus metadatos en el formato baacutesico de intercambio XML (Extensible Markup
Language) o en formatos estaacutendar maacutes sofisticados como JSON (JavaScript Object
Notation)
Al igual que los datos puede publicar los metadatos en muacuteltiples formatos desde la
misma URL
Tenga en cuenta que IDECA a partir de estaacutendares internacionales ha definido los
elementos miacutenimos que debe contener el metadato y que estos pueden ser utilizados
en la publicacioacuten de sus metadatos para facilitar el intercambio de estos
Figura 1 Secciones del Perfil de Metadatos IDECA
Para maacutes informacioacuten consulte la Cartilla para la creacioacuten de metadatos geograacuteficos en
Bogotaacute Distrito Capital
8 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
En la siguiente URL se observa un metadato dispuesto para que los usuarios puedan consultar
faacutecilmente la informacioacuten asociada al dato publicado (Desarrollo Econoacutemico Rural Bogotaacute
DC)
httpmetadatosidecagovcogeoportalcatalogsearchresourcedetailspageuuid=A8AB6E
7A-55FB-40DA-85E1-0AA6B4FE6CE3
Ejemplo 2
En la siguiente URL estaacute disponible el metadato de un nivel de informacioacuten dispuesto por la
Unidad Administrativa Especial de Catastro Distrital ndash UAECD ndash en formato XML (legible por
aplicaciones informaacuteticas
httpmetadatosidecagovcogeoportalrestdocumentid=7BBE5F9AEE-1FBC-4C13-822F-
F2CE44AFDD7E7D
9 Buenas praacutecticas para la publicacioacuten de datos
2 Proporcionar una licencia en donde se especifiquen las limitaciones yo restricciones de acceso y uso de los datos
Una licencia entendida como las condiciones legales bajo las cuales estaacute disponible la obra2 es
un instrumento mediante el cual el propietario del dato autoriza o no a los usuarios para que
accedan a su contenido y tambieacuten lo faculta para su utilizacioacuten Existen diferentes tipos de
licencia para la distribucioacuten y explotacioacuten de obras y cuyo propoacutesito es regular las condiciones
de acceso y uso de los datos
Dependiendo el acceso autorizado a los datos las licencias pueden clasificarse en
Privativas o restrictivas Aquellas licencias conocidas como cerradas o no libres donde la mayoriacutea de las veces solo el autor puede usar la obra o en caso contrario se definen condiciones especiacuteficas que se deben cumplir para hacer uso de la informacioacuten
Semilibres Aquellas licencias que requieren autorizaciones para que los usuarios utilicen copien distribuyan o modifiquen su contenido
Libres o abiertas Aquellas licencias que en teacuterminos generales permiten usar distribuir y compartir los datos con muy pocas restricciones
Cuando un dato se publica acompantildeado de su licencia el usuario conoce las condiciones de
acceso uso y distribucioacuten de los datos que estaacute consumiendo de esta forma se garantiza que
los datos se distribuyan seguacuten los intereses de la entidad que los produce y se minimizan los
usos indebidos de los datos por parte de los usuarios
Ahora bien definir la licencia adecuada para cada dato dependeraacute de las condiciones que
establezca la entidad productora de este Revise los ejemplos y defina la licencia maacutes adecuada
para sus datos
Para maacutes informacioacuten consulte el Instructivo para la definicioacuten de licencias de datos
iquestQueacute logro
Que el usuario evaluacutee si puede o no usar mis datos
Que el usuario conozca las condiciones de acceso uso y manejo sobre los datos
disponibles
Dar claridad y potenciar el uso de los datos disponibles
Que el usuario de los reconocimientos respectivos a la entidad productora de los datos
Que se genere valor agregado sobre los datos disponibles en caso de asignar una
licencia abierta
2 Recuperado de httpsopendefinitionorgod21es
10 Buenas praacutecticas para la publicacioacuten de datos
iexclRecomendaciones
Identifique la licencia que mejor se acomode a su modelo de negocio Recuerde que
mediante la Ley 1712 de 2014 se reguloacute el derecho de acceso a la informacioacuten puacuteblica
y se incluyeron los principios de facilitacioacuten gratuidad y divulgacioacuten proactiva de la
informacioacuten
Disponga una licencia para su conjunto de datos a traveacutes de un enlace una copia
incorporada o dentro del metadato
Prefiera el uso de licencias abiertas de este modo sus datos seraacuten utilizados en una
mayor cantidad de productos servicios y mercados
Ejemplo 1
Mundialmente conocidas las licencias Creative Commons3 tienen como objetivo fortalecer a los
creadores para que sean quienes definan los teacuterminos en que sus obras pueden ser usadas queacute
derechos desean entregar y en queacute condiciones lo haraacuten A continuacioacuten encontraraacute los
enlaces de acceso para conocer las condiciones de cada una de las licencias disponibles
CC0 10 httpscreativecommonsorgpublicdomainzero10deedes
CC BY 40 httpscreativecommonsorglicensesby40
CC BY-SA 40 httpscreativecommonsorglicensesby-sa40
CC BY-ND 40 httpscreativecommonsorglicensesby-nd40
CC BY-NC 40 httpscreativecommonsorglicensesby-nc40
CC BY-NC-SA 40
httpscreativecommonsorglicensesby-nc-sa40
Ejemplo 2
Tambieacuten existen las licencias abiertas para datos Open Data Commons4 proporcionadas por la
mundialmente conocida red Open Knowledge Foundation Network ndash OKFN5 puede consultar
las condiciones ingresando a los siguientes enlaces
ODbL 10 httpsopendatacommonsorglicensesodblsummary
PDDL 10 httpsopendatacommonsorglicensespddlsummary
ODC-BY 10 httpsopendatacommonsorglicensesbysummary
3 httpcreativecommonsorg 4 httpopendatacommonsorg 5 httpsokfnorg
11 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 3
El Mapa de referencia para Bogotaacute estaacute publicado en
httpswwwidecagovcoesserviciosmapa-de-referencia bajo las condiciones descritas en la
ldquoLICENCIA ABIERTA O CONDICIONES DE USO PARA DATOS ABIERTOS DE LA INFRAESTRUCTURA
INTEGRADA DE DATOS ESPACIALES PARA EL DISTRITO CAPITAL (IDECA)rdquo
httpswwwidecagovcoeslicenciaabierta
12 Buenas praacutecticas para la publicacioacuten de datos
3 Utilizar vocabularios estandarizados y reutilizables en la estructuracioacuten y publicacioacuten de los datos
Un vocabulario define los conceptos y las relaciones que se utilizan para describir y representar
un aacuterea de intereacutes6 Cuando se publican datos en la Web los vocabularios permiten integrar
datos cuando existen ambiguumledades en los teacuterminos utilizados en los diferentes conjuntos de
datos En la praacutectica un vocabulario es un conjunto de palabras que permiten a dos usuarios
comunicarse entre siacute La efectividad de dicha comunicacioacuten radica en que el significado de una
palabra para el usuario emisor sea el mismo que para el usuario receptor independientemente
de si utilizaron el mismo teacutermino
Cuando se habla de interoperabilidad de datos lo que se espera es que tanto los usuarios
como las aplicaciones informaacuteticas entiendan y comprendan la mayor cantidad de informacioacuten
que estaacuten consumiendo Para conseguir esto las comunidades de datos han identificado
vocablos palabras o teacuterminos de uso comuacuten los cuales cuentan con significados apropiados y
que actualmente se encuentran integrados y estructurados en diferentes estaacutendares
internacionales
Se recomienda utilizar vocabularios de este tipo para estandarizar los datos contenidos en la
informacioacuten publicada
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios Que se reduzca la ambiguumledad en la interpretacioacuten de mis datos Que mis datos sean interoperables Que mis datos sean procesados en entornos nacionales e internacionales Que mis datos puedan ser compartidos e intercambiados entre sistemas Que mis datos sean maacutes confiables
iexclRecomendaciones
Consulte normas locales o vocabularios internacionales para la estructuracioacuten7 de sus
datos
Apropie los vocabularios consultados y adapte sus datos a estos en los casos en que sea
posible
Incluya vocabularios ya definidos y reconocidos internacionalmente cuando vaya a
producir nuevos datos
6 httpswwww3orgstandardssemanticwebontology 7 Estructurar significa ajustar los datos a un esquema fijo
13 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
A continuacioacuten se presentan algunos vocabularios internacionales que puede consultar y
apropiar para optimizar el intercambio de sus datos
Data Catalog Vocabulary (DCAT) httpswwww3orgTRvocab-dcatclass-catalog
FOAF Vocabulary Specification httpxmlnscomfoaf01
ISOTC 211 Geographic informationGeomatics Terminology
httpwwwisotc211orgTerminologyhtm
The RDF Data Cube Vocabulary httpswwww3orgTR2014REC-vocab-data-cube-20140116
ODRL Vocabulary amp Expression 22
httpswwww3orgTR2018REC-odrl-vocab-20180215
HTTP Vocabulary in RDF 10 httpswwww3orgTR2017NOTE-HTTP-in-RDF10-20170202
vCard Ontology - for describing People and Organizations
httpswwww3orgTRvcard-rdf
Ejemplo 2
En el contexto Nacional el Ministerio de Tecnologiacuteas de la Informacioacuten y las Comunicaciones ha
establecido el Lenguaje Comuacuten de Intercambio de como un instrumento de consulta que
contiene la definicioacuten de los elementos de datos conceptualizados por las entidades del
estado La consulta la puede realizar en httplenguajeminticgovco
14 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 3
La especificacioacuten vCard disponible en httpswwww3orgTRvcard-rdf promueve un
vocabulario especiacutefico para describir personas y organizaciones
Uno de los vocablos que describe esta especificacioacuten es la ldquodireccioacuten de entregardquo llamado
dentro del vocabulario como ADR y definido como ldquola direccioacuten del objeto representado en
partes estructuradasrdquo
Ahora bien este vocabulario especifica los componentes de la direccioacuten de entrega para el
objeto asiacute el nombre del paiacutes la localidad el coacutedigo postal la regioacuten y la direccioacuten dada por
viacuteas (calles y carreras en el caso colombiano) Esto quiere decir que cualquiera de los
componentes descritos puede usarse como direccioacuten de entrega vaacutelida ya que son equivalentes
entre siacute
Aunque en el vocabulario la direccioacuten de entrega se llame ADR el usuario de la informacioacuten
entenderaacute que un nombre de paiacutes o un coacutedigo postal pueden interpretarse como ADR
15 Buenas praacutecticas para la publicacioacuten de datos
4 Anonimizar los datos de caraacutecter personal informacioacuten estadiacutestica informacioacuten indirectamente identificable e informacioacuten sensible o confidencial
Anonimizar es el proceso que impide la identificacioacuten de las unidades de estudio que son fuente
para los registros individuales de un conjunto8 de datos o maacutes claro es la aplicacioacuten de teacutecnicas
que permitan expresar un dato relativo a personas eliminando la referencia a su identidad9
Baacutesicamente lo que se busca es reducir los riesgos en el uso y procesamiento de datos
personales evitar la extraccioacuten de registros que identifican a una persona reducir la
combinacioacuten de dos o maacutes registros en una o varias bases de datos para identificar a una
persona y minimizar la deduccioacuten de datos personales partir de uno o varios datos publicados
iquestQueacute informacioacuten debo prioritariamente anonimizar
Datos personales Informacioacuten numeacuterica alfabeacutetica graacutefica fotograacutefica acuacutestica o
cualquier otro tipo susceptible de recogida registro tratamiento y transmisioacuten
concerniente a personas fiacutesicas identificadas o identificables (tales como nombre
apellidos estado civil sexo edad domicilio identificacioacuten personal nuacutemero de
teleacutefono etc)10
Informacioacuten sensible Informacioacuten considerada como estrictamente confidencial
Informacioacuten y caracteriacutesticas referentes a la edad procedencia salud raza religioacuten
ideologiacutea afiliacioacuten finanzas etc se consideran de caraacutecter sensible y requieren de
una proteccioacuten especial11
iquestQueacute logro
Garantizar que mis datos publicados cuentan con medidas de proteccioacuten de datos
personales
Eliminar de manera efectiva el riesgo de re-identificacioacuten
Evitar que el procesamiento de mis datos tenga consecuencias negativas para alguna
persona
Disponer muchos maacutes datos sin invadir la informacioacuten personal
iexclRecomendaciones
Implemente actividades de proteccioacuten de la privacidad de los datos personales antes
de publicarlos
Elimine cualquier identificador directo de la persona (nombre documento de
identidad etc)
8 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 9 httpdleraeesid=2jjMiRi 10 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 11 Ibidem
16 Buenas praacutecticas para la publicacioacuten de datos
Reemplace los identificadores directos por coacutedigos de referencia pseudoacutenimos
(algoritmos AES12 o un hash cifrado HMAC13) coacutedigos arbitrarios o aleatorios
Si reemplazando el identificador directo auacuten es faacutecil identificar a la persona elimine el
dato
Clasifique yo categorice los datos
Redondee los datos numeacutericos hacia arriba o hacia abajo
Evaluacutee antes durante y despueacutes de publicados los datos si la anonimizacioacuten de sus
datos es suficiente y evaluacutee regularmente los riesgos existentes
Para maacutes informacioacuten consulte los Lineamientos para la Anonimizacioacuten de micro datos
Ejemplo 1
Antes de publicar sus datos retire el identificador directo de la persona En este caso
reemplace en nuacutemero de documento que identifica al usuario y reemplaacutecelo por un
consecutivo
Usuario Beneficio Usuario Beneficio
80123456 Subsidio de vivienda Usuario 1 Subsidio de vivienda
51123456 Subsidio de alimentacioacuten Usuario 2 Subsidio de alimentacioacuten
19123456 Subsidio al adulto mayor Usuario 3 Subsidio al adulto mayor
53123456 Subsidio de desempleo Usuario 4 Subsidio de desempleo
Ejemplo 2
Clasifique o categorice sus datos En este ejemplo asigne rangos a la edad de manera tal que el
titular del registro no sea identificable por este dato
Usuario Edad Usuario Rango de edad
Usuario 1 11 antildeos Usuario 1 Entre 10 y 15 antildeos
Usuario 2 22 antildeos Usuario 2 Entre 20 y 25 antildeos
Usuario 3 36 antildeos Usuario 3 Entre 35 y 40 antildeos
Usuario 4 63 antildeos Usuario 4 Entre 60 y 65 antildeos
12 Advanced Encryption Standard puede consultar como ha sido implementado este algoritmo en httpsrevistasudistritaleducoojsindexphpTecnuraarticleview72368892 13 Hash-based Message Authentication Code puede consultar como se crea este cifrado en httpsdocsoraclecomcdE19253-01819-7804wanboottasks2-51indexhtml
17 Buenas praacutecticas para la publicacioacuten de datos
5 Publicar los datos en formatos estaacutendar reutilizables y legibles por aplicaciones informaacuteticas
Un formato puede ser definido como la estructura de un disco dividido en campos y pistas
seguacuten un determinado sistema operativo lo que permite almacenar en eacutel informacioacuten14
baacutesicamente es la forma en que se codifican los datos en un archivo informaacutetico
Actualmente conocemos formatos comunes de almacenamiento como el doc una extensioacuten
de Word que almacena texto y cuyo propietario es la compantildeiacutea Microsoft Pero iquestqueacute pasa si un
usuario quiere abrir un documento doc en un procesador de texto diferente a Word
difiacutecilmente va a poder conocer el contenido de dicho documento sin tener esta licencia
Lo que queremos lograr con la implementacioacuten de esta praacutectica es que todos los usuarios que
encuentren mis datos puedan accederlos sin necesidad de contar con un software o aplicacioacuten
informaacutetica especiacutefica
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos puedan ser extraiacutedos transformados y procesados por aplicaciones
informaacuteticas
Que mis datos puedan ser compartidos e intercambiados entre sistemas
Disminuir los costos y los tiempos en el uso y la transformacioacuten de mis datos
iexclRecomendaciones
Prefiera publicar su conjunto de datos en formatos abiertos o no propietario ya que
estos facilitan el uso re-uso y distribucioacuten de estos Se busca que un mayor nuacutemero de
aplicaciones informaacuteticas pueda extraer leer y transformar los datos generando mayor
uso y re-uso por los usuarios
Disponga sus datos en muacuteltiples formatos con el fin de incrementar el acceso a los
mismos Se busca que el mayor nuacutemero de usuarios pueda utilizar los datos sin tener
que transformarlos primero en su formato preferido
Utilice Web Services para mejorar el intercambio e interoperabilidad de los datos
publicados
14 httpdleraeessrvsearchm=30ampw=formato
18 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
A continuacioacuten encontraraacute extensiones de formato propietario y no propietario prefiera para
la publicacioacuten de sus datos las extensiones de la derecha
FORMATO PROPIETARIO FORMATO NO PROPIETARIO
DOC GDB TXT ASCII Grid KML RDF
XLS DWG CSV GeoJSON DXF XML
PPT SHP JSON GML ODF
Ejemplo 2
Si no fue posible utilizar una extensioacuten de formato no propietario publique sus datos en una
variedad de formatos que le permita al usuario acceder a los datos desde diferentes
aplicaciones informaacuteticas
Ejemplo 3
Para publicar sus datos conozca diferentes tipos de Web Services que viajan en la red utilizando extensiones XML
SOAP httpswwww3orgTRsoap
REST httprestelksteinorg
WMS httpwwwopengeospatialorgstandardswms
WFS httpwwwopengeospatialorgstandardswfs
WCS httpwwwopengeospatialorgstandardswcs
19 Buenas praacutecticas para la publicacioacuten de datos
6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos publicados
Un diccionario estaacute definido como un repertorio en forma de libro o en soporte electroacutenico en el
que se recogen seguacuten un orden determinado las palabras o expresiones de una o maacutes lenguas
o de una materia concreta acompantildeadas de su definicioacuten equivalencia o explicacioacuten15
especiacuteficamente en un diccionario de datos se encuentran los conceptos de los datos y sus
propiedades (atributos dominios asociaciones y operaciones) acompantildeados de una definicioacuten
en donde se identifica el propoacutesito alcance y campo de aplicacioacuten del dato publicado
Lograr que los usuarios de mis datos entiendan la informacioacuten que estaacute publicada le permitiraacute
decidir si satisfacen o no su necesidad y le facilitaraacute la decisioacuten para explotar lo datos
Para maacutes informacioacuten consulte el Instructivo Diccionario de Datos
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que se eviten ambiguumledades en la interpretacioacuten de mis datos
Que mis datos publicados esteacuten unificados y consistentes
Que los usuarios comprendan mejor y dispongan de claridad sobre los conceptos de
mis datos
iexclRecomendaciones
Publique como miacutenimo un diccionario de datos que contenga la caracterizacioacuten del
conjunto de datos producidos por su entidad
Cree el diccionario de datos teniendo en cuenta como miacutenimo la siguiente informacioacuten
Nombre del atributo Nombre que identifica de manera clara un atributo
Definicioacuten Descripcioacuten del atributo
Tipo de dato Tipo de valor del atributo
Unidad de medida Expresa la unidad de medida del atributo
Dominio Determina si el atributo tiene asociado un dominio
15 httpdleraeesw=diccionario
20 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
Para el conjunto de datos ldquoEstablecimientos Educativos en Bogotaacuterdquo publicariacuteamos un
diccionario de datos similar al siguiente
Nombre del atributo Definicioacuten Tipo de dato
Unidad de Medida
Dominio
Coacutedigo del establecimiento
Coacutedigo DANE asignado al Institucioacuten Educativa Decimal
Nombre del establecimiento
Nombre de la Institucioacuten Educativa Cadena de Caracteres
Aacuterea construida del establecimiento
Aacuterea construida de la Institucioacuten Educativa Decimal Metros
cuadrados
Sector
Clasificacioacuten asignada seguacuten la naturaleza juriacutedica la cual define las principales caracteriacutesticas que desde lo juriacutedico - administrativo y tiene que ver con el origen de su creacioacuten
Entero
EESector
No podriacuteamos olvidar detallar el dominio asociado
Atributo Nombre del Dominio Coacutedigo Definicioacuten
EESector
Oficial 1
Es una institucioacuten donde su naturaleza de servicio puacuteblico cultural y su funcioacuten social le es inherente cumpliendo con las disposiciones legales y estatutarias que las rigen donde sus rentas se conservan y se aplican debidamente
Privado 2
Es una institucioacuten constituida como persona juriacutedica de utilidad comuacuten donde sus rentas se conservan y se aplican debidamente y que en todo lo esencial se cumple con la voluntad de sus fundadores
21 Buenas praacutecticas para la publicacioacuten de datos
7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos
Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para
acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que
conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como
cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o
software
En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos
publicados se proporcionen recursos o documentos adicionales que puedan ser consultados
yo descargados traveacutes de enlaces o links de otro sitio Web
Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los
procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los
documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad
entre otros
iquestQueacute logro
Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos
Que los usuarios comprendan mejor mis datos
Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios
iexclRecomendaciones
Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el
horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del
dato
No olvide vincular o registrar esta informacioacuten en el metadato
16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp
22 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos
Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318
Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57
Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30
Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217
Ejemplo 2
La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en
httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos
o Gestioacuten de los humedales
o Poliacutetica de Humedales del Distrito Capital
o Normatividad
o Planes de Manejo Ambiental
o Comiteacute distrital de humedales documentos de consulta normatividad
23 Buenas praacutecticas para la publicacioacuten de datos
8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza
La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten
juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado
Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para
satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas
y especificaciones establecidas
Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades
de estos sin embargo en este aparte citaremos los elementos principales que usted o su
entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad
Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de
los datos espaciales
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que los usuarios hablen bien de mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean maacutes compartidos
Que mis datos sean maacutes confiables
Recomendacioacuten 1
Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten
descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten
corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Suba 200 Tunjuelito 500
Ameacutericas 100
850
Tunjuelito 500
18 httpdleraeesid=6nVpk8P|6nXVL1Z
Campo duplicado
Campo inconsistente
Campo vaciacuteo
24 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 2
Identifique y transforme si es necesario los datos que hayan sido registrados en un formato
diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida
del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de
formatordquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Tunjuelito 5008 Tunjuelito 500
Fontiboacuten 40 Fontiboacuten 430
Tunjuelito 500 Tunjuelito 500
Recomendacioacuten 3
Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos
se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de
clasificacioacutenrdquo
Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad
Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10
Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20
Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40
Recomendacioacuten 4
Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos
correspondan a valores conocidos como verdaderos El elemento de calidad asociado se
denomina ldquoexactitud de atributos cuantitativosrdquo
Localidad Mes Temperatura Localidad Mes Temperatura
Chapinero Enero 7degC Chapinero Enero 7degC
Suba Agosto -15degC Suba Agosto 15degC
Tunjuelito Abril 60degC Tunjuelito Abril 16degC
Clasificacioacuten inconsistente
Formato inconsistente
Valor inconsistente
25 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 5
Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por
ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que
las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad
asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo
Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro
00 20580101 00 20180101
01 20180102 01 20180102
126 20510403 126 20180103
20 20180104 20 20180104
Recomendacioacuten 6
Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes
de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se
denomina ldquoconsistencia temporalrdquo
Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio
Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231
Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231
Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112
Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112
Recomendacioacuten 7
Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta
corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud
posicionalrdquo
Eventos Deportivos Lugar Eventos Deportivos Lugar
Evento 1 AK 30 25 90 Evento 1 AK 30 25 90
Evento 2 AC 63 215 20 Evento 2 Parque La Florida
Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar
Fecha
inconsistente
Fechas no secuenciales
Lugar inexistente
26 Buenas praacutecticas para la publicacioacuten de datos
9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten
El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de
alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una
institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las
variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a
cabo los traacutemites de una entidad etc
Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un
espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados
Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten
asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un
establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario
identificar la localizacioacuten del dato publicado
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean puedan compartir en maacutes plataformas
Que los usuarios puedan visualizar mis datos en un mapa
iexclRecomendaciones
Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o
lugares geograacuteficos
Ejemplo 1
Incluya direcciones que permitan localizar espacialmente sus datos
Programa Direccioacuten
Registro de atencioacuten a la ciudadaniacutea CL 138 108 16
Centro de autocuidado KR 18 D 77 A 11 SUR
Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46
Centro de autocuidado KR 18 D 73 A 33 SUR
19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico
27 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 2
Utilice coordenadas para indicar la ubicacioacuten de sus datos
EPS Coordenada X Coordenada Y
EPS Convida 9087496334 1051342164
Capital Salud EPS 986321006 954875808
EPS Famisanar 9742508812 8837031501
Aliansalud EPS 9716943356 9659706891
Salud Total EPS 9215624975 9625189518
Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro
de su metadato el Sistema de referencia empleado
MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686
MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116
MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458
Ejemplo 3
Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute
Usuario Vacunado Lugar de Vacunacioacuten
Usuario 1 BOSQUE IZQUIERDO
Usuario 2 LAGUNITAS URBANO
Usuario 3 LA CAPUCHINA
Usuario 4 SAN JOSE SUR
Usuario 5 VENECIA
28 Buenas praacutecticas para la publicacioacuten de datos
10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado
Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el
dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los
usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la
citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el
formato de este
En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero
de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de
su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la
informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado
y reconocido faacutecilmente entre los demaacutes datos
Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de
identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por
cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta
gestioacuten y reutilizacioacuten de sus datos
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean compartidos en maacutes plataformas
Que mis datos puedan vincularse a otros datos en el entorno Web
Que mis datos sean encontrados usados y citados inequiacutevocamente
Garantizar y monitorear la reutilizacioacuten de mis datos
Reducir del uso erroacuteneo de mis datos
iexclRecomendaciones
Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar
Utilice siempre el identificador asignado para publicar sus datos
29 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos
httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la
creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la
asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten
de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito
garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar
descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando
asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten
geograacutefica
Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems
publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace
referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades
territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el
planeamiento del suelo urbano de expansioacuten y ruralrdquo
30 Buenas praacutecticas para la publicacioacuten de datos
OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS
Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten
Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado
Nivel Baacutesico
En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)
Nivel Intermedio
Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)
Nivel Avanzado
Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)
31 Buenas praacutecticas para la publicacioacuten de datos
REFERENCIAS
Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best
Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp
Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices
for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp
Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington
Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec
Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI
Recommendation URL httpdublincoreorgdocumentsdcmi-terms
Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C
Recommendation URL httpswwww3orgTRvocab-dcat
ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de
2014 International Standard
ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers
noviembre de 2009 International Standard
ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013
International Standard
Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best
Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp
T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax
Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986
World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg
W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second
Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-
overview
W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado
el 12 de septiembre de 2018
8 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
En la siguiente URL se observa un metadato dispuesto para que los usuarios puedan consultar
faacutecilmente la informacioacuten asociada al dato publicado (Desarrollo Econoacutemico Rural Bogotaacute
DC)
httpmetadatosidecagovcogeoportalcatalogsearchresourcedetailspageuuid=A8AB6E
7A-55FB-40DA-85E1-0AA6B4FE6CE3
Ejemplo 2
En la siguiente URL estaacute disponible el metadato de un nivel de informacioacuten dispuesto por la
Unidad Administrativa Especial de Catastro Distrital ndash UAECD ndash en formato XML (legible por
aplicaciones informaacuteticas
httpmetadatosidecagovcogeoportalrestdocumentid=7BBE5F9AEE-1FBC-4C13-822F-
F2CE44AFDD7E7D
9 Buenas praacutecticas para la publicacioacuten de datos
2 Proporcionar una licencia en donde se especifiquen las limitaciones yo restricciones de acceso y uso de los datos
Una licencia entendida como las condiciones legales bajo las cuales estaacute disponible la obra2 es
un instrumento mediante el cual el propietario del dato autoriza o no a los usuarios para que
accedan a su contenido y tambieacuten lo faculta para su utilizacioacuten Existen diferentes tipos de
licencia para la distribucioacuten y explotacioacuten de obras y cuyo propoacutesito es regular las condiciones
de acceso y uso de los datos
Dependiendo el acceso autorizado a los datos las licencias pueden clasificarse en
Privativas o restrictivas Aquellas licencias conocidas como cerradas o no libres donde la mayoriacutea de las veces solo el autor puede usar la obra o en caso contrario se definen condiciones especiacuteficas que se deben cumplir para hacer uso de la informacioacuten
Semilibres Aquellas licencias que requieren autorizaciones para que los usuarios utilicen copien distribuyan o modifiquen su contenido
Libres o abiertas Aquellas licencias que en teacuterminos generales permiten usar distribuir y compartir los datos con muy pocas restricciones
Cuando un dato se publica acompantildeado de su licencia el usuario conoce las condiciones de
acceso uso y distribucioacuten de los datos que estaacute consumiendo de esta forma se garantiza que
los datos se distribuyan seguacuten los intereses de la entidad que los produce y se minimizan los
usos indebidos de los datos por parte de los usuarios
Ahora bien definir la licencia adecuada para cada dato dependeraacute de las condiciones que
establezca la entidad productora de este Revise los ejemplos y defina la licencia maacutes adecuada
para sus datos
Para maacutes informacioacuten consulte el Instructivo para la definicioacuten de licencias de datos
iquestQueacute logro
Que el usuario evaluacutee si puede o no usar mis datos
Que el usuario conozca las condiciones de acceso uso y manejo sobre los datos
disponibles
Dar claridad y potenciar el uso de los datos disponibles
Que el usuario de los reconocimientos respectivos a la entidad productora de los datos
Que se genere valor agregado sobre los datos disponibles en caso de asignar una
licencia abierta
2 Recuperado de httpsopendefinitionorgod21es
10 Buenas praacutecticas para la publicacioacuten de datos
iexclRecomendaciones
Identifique la licencia que mejor se acomode a su modelo de negocio Recuerde que
mediante la Ley 1712 de 2014 se reguloacute el derecho de acceso a la informacioacuten puacuteblica
y se incluyeron los principios de facilitacioacuten gratuidad y divulgacioacuten proactiva de la
informacioacuten
Disponga una licencia para su conjunto de datos a traveacutes de un enlace una copia
incorporada o dentro del metadato
Prefiera el uso de licencias abiertas de este modo sus datos seraacuten utilizados en una
mayor cantidad de productos servicios y mercados
Ejemplo 1
Mundialmente conocidas las licencias Creative Commons3 tienen como objetivo fortalecer a los
creadores para que sean quienes definan los teacuterminos en que sus obras pueden ser usadas queacute
derechos desean entregar y en queacute condiciones lo haraacuten A continuacioacuten encontraraacute los
enlaces de acceso para conocer las condiciones de cada una de las licencias disponibles
CC0 10 httpscreativecommonsorgpublicdomainzero10deedes
CC BY 40 httpscreativecommonsorglicensesby40
CC BY-SA 40 httpscreativecommonsorglicensesby-sa40
CC BY-ND 40 httpscreativecommonsorglicensesby-nd40
CC BY-NC 40 httpscreativecommonsorglicensesby-nc40
CC BY-NC-SA 40
httpscreativecommonsorglicensesby-nc-sa40
Ejemplo 2
Tambieacuten existen las licencias abiertas para datos Open Data Commons4 proporcionadas por la
mundialmente conocida red Open Knowledge Foundation Network ndash OKFN5 puede consultar
las condiciones ingresando a los siguientes enlaces
ODbL 10 httpsopendatacommonsorglicensesodblsummary
PDDL 10 httpsopendatacommonsorglicensespddlsummary
ODC-BY 10 httpsopendatacommonsorglicensesbysummary
3 httpcreativecommonsorg 4 httpopendatacommonsorg 5 httpsokfnorg
11 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 3
El Mapa de referencia para Bogotaacute estaacute publicado en
httpswwwidecagovcoesserviciosmapa-de-referencia bajo las condiciones descritas en la
ldquoLICENCIA ABIERTA O CONDICIONES DE USO PARA DATOS ABIERTOS DE LA INFRAESTRUCTURA
INTEGRADA DE DATOS ESPACIALES PARA EL DISTRITO CAPITAL (IDECA)rdquo
httpswwwidecagovcoeslicenciaabierta
12 Buenas praacutecticas para la publicacioacuten de datos
3 Utilizar vocabularios estandarizados y reutilizables en la estructuracioacuten y publicacioacuten de los datos
Un vocabulario define los conceptos y las relaciones que se utilizan para describir y representar
un aacuterea de intereacutes6 Cuando se publican datos en la Web los vocabularios permiten integrar
datos cuando existen ambiguumledades en los teacuterminos utilizados en los diferentes conjuntos de
datos En la praacutectica un vocabulario es un conjunto de palabras que permiten a dos usuarios
comunicarse entre siacute La efectividad de dicha comunicacioacuten radica en que el significado de una
palabra para el usuario emisor sea el mismo que para el usuario receptor independientemente
de si utilizaron el mismo teacutermino
Cuando se habla de interoperabilidad de datos lo que se espera es que tanto los usuarios
como las aplicaciones informaacuteticas entiendan y comprendan la mayor cantidad de informacioacuten
que estaacuten consumiendo Para conseguir esto las comunidades de datos han identificado
vocablos palabras o teacuterminos de uso comuacuten los cuales cuentan con significados apropiados y
que actualmente se encuentran integrados y estructurados en diferentes estaacutendares
internacionales
Se recomienda utilizar vocabularios de este tipo para estandarizar los datos contenidos en la
informacioacuten publicada
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios Que se reduzca la ambiguumledad en la interpretacioacuten de mis datos Que mis datos sean interoperables Que mis datos sean procesados en entornos nacionales e internacionales Que mis datos puedan ser compartidos e intercambiados entre sistemas Que mis datos sean maacutes confiables
iexclRecomendaciones
Consulte normas locales o vocabularios internacionales para la estructuracioacuten7 de sus
datos
Apropie los vocabularios consultados y adapte sus datos a estos en los casos en que sea
posible
Incluya vocabularios ya definidos y reconocidos internacionalmente cuando vaya a
producir nuevos datos
6 httpswwww3orgstandardssemanticwebontology 7 Estructurar significa ajustar los datos a un esquema fijo
13 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
A continuacioacuten se presentan algunos vocabularios internacionales que puede consultar y
apropiar para optimizar el intercambio de sus datos
Data Catalog Vocabulary (DCAT) httpswwww3orgTRvocab-dcatclass-catalog
FOAF Vocabulary Specification httpxmlnscomfoaf01
ISOTC 211 Geographic informationGeomatics Terminology
httpwwwisotc211orgTerminologyhtm
The RDF Data Cube Vocabulary httpswwww3orgTR2014REC-vocab-data-cube-20140116
ODRL Vocabulary amp Expression 22
httpswwww3orgTR2018REC-odrl-vocab-20180215
HTTP Vocabulary in RDF 10 httpswwww3orgTR2017NOTE-HTTP-in-RDF10-20170202
vCard Ontology - for describing People and Organizations
httpswwww3orgTRvcard-rdf
Ejemplo 2
En el contexto Nacional el Ministerio de Tecnologiacuteas de la Informacioacuten y las Comunicaciones ha
establecido el Lenguaje Comuacuten de Intercambio de como un instrumento de consulta que
contiene la definicioacuten de los elementos de datos conceptualizados por las entidades del
estado La consulta la puede realizar en httplenguajeminticgovco
14 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 3
La especificacioacuten vCard disponible en httpswwww3orgTRvcard-rdf promueve un
vocabulario especiacutefico para describir personas y organizaciones
Uno de los vocablos que describe esta especificacioacuten es la ldquodireccioacuten de entregardquo llamado
dentro del vocabulario como ADR y definido como ldquola direccioacuten del objeto representado en
partes estructuradasrdquo
Ahora bien este vocabulario especifica los componentes de la direccioacuten de entrega para el
objeto asiacute el nombre del paiacutes la localidad el coacutedigo postal la regioacuten y la direccioacuten dada por
viacuteas (calles y carreras en el caso colombiano) Esto quiere decir que cualquiera de los
componentes descritos puede usarse como direccioacuten de entrega vaacutelida ya que son equivalentes
entre siacute
Aunque en el vocabulario la direccioacuten de entrega se llame ADR el usuario de la informacioacuten
entenderaacute que un nombre de paiacutes o un coacutedigo postal pueden interpretarse como ADR
15 Buenas praacutecticas para la publicacioacuten de datos
4 Anonimizar los datos de caraacutecter personal informacioacuten estadiacutestica informacioacuten indirectamente identificable e informacioacuten sensible o confidencial
Anonimizar es el proceso que impide la identificacioacuten de las unidades de estudio que son fuente
para los registros individuales de un conjunto8 de datos o maacutes claro es la aplicacioacuten de teacutecnicas
que permitan expresar un dato relativo a personas eliminando la referencia a su identidad9
Baacutesicamente lo que se busca es reducir los riesgos en el uso y procesamiento de datos
personales evitar la extraccioacuten de registros que identifican a una persona reducir la
combinacioacuten de dos o maacutes registros en una o varias bases de datos para identificar a una
persona y minimizar la deduccioacuten de datos personales partir de uno o varios datos publicados
iquestQueacute informacioacuten debo prioritariamente anonimizar
Datos personales Informacioacuten numeacuterica alfabeacutetica graacutefica fotograacutefica acuacutestica o
cualquier otro tipo susceptible de recogida registro tratamiento y transmisioacuten
concerniente a personas fiacutesicas identificadas o identificables (tales como nombre
apellidos estado civil sexo edad domicilio identificacioacuten personal nuacutemero de
teleacutefono etc)10
Informacioacuten sensible Informacioacuten considerada como estrictamente confidencial
Informacioacuten y caracteriacutesticas referentes a la edad procedencia salud raza religioacuten
ideologiacutea afiliacioacuten finanzas etc se consideran de caraacutecter sensible y requieren de
una proteccioacuten especial11
iquestQueacute logro
Garantizar que mis datos publicados cuentan con medidas de proteccioacuten de datos
personales
Eliminar de manera efectiva el riesgo de re-identificacioacuten
Evitar que el procesamiento de mis datos tenga consecuencias negativas para alguna
persona
Disponer muchos maacutes datos sin invadir la informacioacuten personal
iexclRecomendaciones
Implemente actividades de proteccioacuten de la privacidad de los datos personales antes
de publicarlos
Elimine cualquier identificador directo de la persona (nombre documento de
identidad etc)
8 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 9 httpdleraeesid=2jjMiRi 10 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 11 Ibidem
16 Buenas praacutecticas para la publicacioacuten de datos
Reemplace los identificadores directos por coacutedigos de referencia pseudoacutenimos
(algoritmos AES12 o un hash cifrado HMAC13) coacutedigos arbitrarios o aleatorios
Si reemplazando el identificador directo auacuten es faacutecil identificar a la persona elimine el
dato
Clasifique yo categorice los datos
Redondee los datos numeacutericos hacia arriba o hacia abajo
Evaluacutee antes durante y despueacutes de publicados los datos si la anonimizacioacuten de sus
datos es suficiente y evaluacutee regularmente los riesgos existentes
Para maacutes informacioacuten consulte los Lineamientos para la Anonimizacioacuten de micro datos
Ejemplo 1
Antes de publicar sus datos retire el identificador directo de la persona En este caso
reemplace en nuacutemero de documento que identifica al usuario y reemplaacutecelo por un
consecutivo
Usuario Beneficio Usuario Beneficio
80123456 Subsidio de vivienda Usuario 1 Subsidio de vivienda
51123456 Subsidio de alimentacioacuten Usuario 2 Subsidio de alimentacioacuten
19123456 Subsidio al adulto mayor Usuario 3 Subsidio al adulto mayor
53123456 Subsidio de desempleo Usuario 4 Subsidio de desempleo
Ejemplo 2
Clasifique o categorice sus datos En este ejemplo asigne rangos a la edad de manera tal que el
titular del registro no sea identificable por este dato
Usuario Edad Usuario Rango de edad
Usuario 1 11 antildeos Usuario 1 Entre 10 y 15 antildeos
Usuario 2 22 antildeos Usuario 2 Entre 20 y 25 antildeos
Usuario 3 36 antildeos Usuario 3 Entre 35 y 40 antildeos
Usuario 4 63 antildeos Usuario 4 Entre 60 y 65 antildeos
12 Advanced Encryption Standard puede consultar como ha sido implementado este algoritmo en httpsrevistasudistritaleducoojsindexphpTecnuraarticleview72368892 13 Hash-based Message Authentication Code puede consultar como se crea este cifrado en httpsdocsoraclecomcdE19253-01819-7804wanboottasks2-51indexhtml
17 Buenas praacutecticas para la publicacioacuten de datos
5 Publicar los datos en formatos estaacutendar reutilizables y legibles por aplicaciones informaacuteticas
Un formato puede ser definido como la estructura de un disco dividido en campos y pistas
seguacuten un determinado sistema operativo lo que permite almacenar en eacutel informacioacuten14
baacutesicamente es la forma en que se codifican los datos en un archivo informaacutetico
Actualmente conocemos formatos comunes de almacenamiento como el doc una extensioacuten
de Word que almacena texto y cuyo propietario es la compantildeiacutea Microsoft Pero iquestqueacute pasa si un
usuario quiere abrir un documento doc en un procesador de texto diferente a Word
difiacutecilmente va a poder conocer el contenido de dicho documento sin tener esta licencia
Lo que queremos lograr con la implementacioacuten de esta praacutectica es que todos los usuarios que
encuentren mis datos puedan accederlos sin necesidad de contar con un software o aplicacioacuten
informaacutetica especiacutefica
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos puedan ser extraiacutedos transformados y procesados por aplicaciones
informaacuteticas
Que mis datos puedan ser compartidos e intercambiados entre sistemas
Disminuir los costos y los tiempos en el uso y la transformacioacuten de mis datos
iexclRecomendaciones
Prefiera publicar su conjunto de datos en formatos abiertos o no propietario ya que
estos facilitan el uso re-uso y distribucioacuten de estos Se busca que un mayor nuacutemero de
aplicaciones informaacuteticas pueda extraer leer y transformar los datos generando mayor
uso y re-uso por los usuarios
Disponga sus datos en muacuteltiples formatos con el fin de incrementar el acceso a los
mismos Se busca que el mayor nuacutemero de usuarios pueda utilizar los datos sin tener
que transformarlos primero en su formato preferido
Utilice Web Services para mejorar el intercambio e interoperabilidad de los datos
publicados
14 httpdleraeessrvsearchm=30ampw=formato
18 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
A continuacioacuten encontraraacute extensiones de formato propietario y no propietario prefiera para
la publicacioacuten de sus datos las extensiones de la derecha
FORMATO PROPIETARIO FORMATO NO PROPIETARIO
DOC GDB TXT ASCII Grid KML RDF
XLS DWG CSV GeoJSON DXF XML
PPT SHP JSON GML ODF
Ejemplo 2
Si no fue posible utilizar una extensioacuten de formato no propietario publique sus datos en una
variedad de formatos que le permita al usuario acceder a los datos desde diferentes
aplicaciones informaacuteticas
Ejemplo 3
Para publicar sus datos conozca diferentes tipos de Web Services que viajan en la red utilizando extensiones XML
SOAP httpswwww3orgTRsoap
REST httprestelksteinorg
WMS httpwwwopengeospatialorgstandardswms
WFS httpwwwopengeospatialorgstandardswfs
WCS httpwwwopengeospatialorgstandardswcs
19 Buenas praacutecticas para la publicacioacuten de datos
6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos publicados
Un diccionario estaacute definido como un repertorio en forma de libro o en soporte electroacutenico en el
que se recogen seguacuten un orden determinado las palabras o expresiones de una o maacutes lenguas
o de una materia concreta acompantildeadas de su definicioacuten equivalencia o explicacioacuten15
especiacuteficamente en un diccionario de datos se encuentran los conceptos de los datos y sus
propiedades (atributos dominios asociaciones y operaciones) acompantildeados de una definicioacuten
en donde se identifica el propoacutesito alcance y campo de aplicacioacuten del dato publicado
Lograr que los usuarios de mis datos entiendan la informacioacuten que estaacute publicada le permitiraacute
decidir si satisfacen o no su necesidad y le facilitaraacute la decisioacuten para explotar lo datos
Para maacutes informacioacuten consulte el Instructivo Diccionario de Datos
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que se eviten ambiguumledades en la interpretacioacuten de mis datos
Que mis datos publicados esteacuten unificados y consistentes
Que los usuarios comprendan mejor y dispongan de claridad sobre los conceptos de
mis datos
iexclRecomendaciones
Publique como miacutenimo un diccionario de datos que contenga la caracterizacioacuten del
conjunto de datos producidos por su entidad
Cree el diccionario de datos teniendo en cuenta como miacutenimo la siguiente informacioacuten
Nombre del atributo Nombre que identifica de manera clara un atributo
Definicioacuten Descripcioacuten del atributo
Tipo de dato Tipo de valor del atributo
Unidad de medida Expresa la unidad de medida del atributo
Dominio Determina si el atributo tiene asociado un dominio
15 httpdleraeesw=diccionario
20 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
Para el conjunto de datos ldquoEstablecimientos Educativos en Bogotaacuterdquo publicariacuteamos un
diccionario de datos similar al siguiente
Nombre del atributo Definicioacuten Tipo de dato
Unidad de Medida
Dominio
Coacutedigo del establecimiento
Coacutedigo DANE asignado al Institucioacuten Educativa Decimal
Nombre del establecimiento
Nombre de la Institucioacuten Educativa Cadena de Caracteres
Aacuterea construida del establecimiento
Aacuterea construida de la Institucioacuten Educativa Decimal Metros
cuadrados
Sector
Clasificacioacuten asignada seguacuten la naturaleza juriacutedica la cual define las principales caracteriacutesticas que desde lo juriacutedico - administrativo y tiene que ver con el origen de su creacioacuten
Entero
EESector
No podriacuteamos olvidar detallar el dominio asociado
Atributo Nombre del Dominio Coacutedigo Definicioacuten
EESector
Oficial 1
Es una institucioacuten donde su naturaleza de servicio puacuteblico cultural y su funcioacuten social le es inherente cumpliendo con las disposiciones legales y estatutarias que las rigen donde sus rentas se conservan y se aplican debidamente
Privado 2
Es una institucioacuten constituida como persona juriacutedica de utilidad comuacuten donde sus rentas se conservan y se aplican debidamente y que en todo lo esencial se cumple con la voluntad de sus fundadores
21 Buenas praacutecticas para la publicacioacuten de datos
7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos
Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para
acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que
conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como
cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o
software
En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos
publicados se proporcionen recursos o documentos adicionales que puedan ser consultados
yo descargados traveacutes de enlaces o links de otro sitio Web
Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los
procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los
documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad
entre otros
iquestQueacute logro
Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos
Que los usuarios comprendan mejor mis datos
Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios
iexclRecomendaciones
Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el
horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del
dato
No olvide vincular o registrar esta informacioacuten en el metadato
16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp
22 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos
Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318
Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57
Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30
Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217
Ejemplo 2
La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en
httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos
o Gestioacuten de los humedales
o Poliacutetica de Humedales del Distrito Capital
o Normatividad
o Planes de Manejo Ambiental
o Comiteacute distrital de humedales documentos de consulta normatividad
23 Buenas praacutecticas para la publicacioacuten de datos
8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza
La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten
juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado
Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para
satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas
y especificaciones establecidas
Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades
de estos sin embargo en este aparte citaremos los elementos principales que usted o su
entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad
Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de
los datos espaciales
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que los usuarios hablen bien de mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean maacutes compartidos
Que mis datos sean maacutes confiables
Recomendacioacuten 1
Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten
descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten
corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Suba 200 Tunjuelito 500
Ameacutericas 100
850
Tunjuelito 500
18 httpdleraeesid=6nVpk8P|6nXVL1Z
Campo duplicado
Campo inconsistente
Campo vaciacuteo
24 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 2
Identifique y transforme si es necesario los datos que hayan sido registrados en un formato
diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida
del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de
formatordquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Tunjuelito 5008 Tunjuelito 500
Fontiboacuten 40 Fontiboacuten 430
Tunjuelito 500 Tunjuelito 500
Recomendacioacuten 3
Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos
se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de
clasificacioacutenrdquo
Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad
Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10
Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20
Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40
Recomendacioacuten 4
Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos
correspondan a valores conocidos como verdaderos El elemento de calidad asociado se
denomina ldquoexactitud de atributos cuantitativosrdquo
Localidad Mes Temperatura Localidad Mes Temperatura
Chapinero Enero 7degC Chapinero Enero 7degC
Suba Agosto -15degC Suba Agosto 15degC
Tunjuelito Abril 60degC Tunjuelito Abril 16degC
Clasificacioacuten inconsistente
Formato inconsistente
Valor inconsistente
25 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 5
Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por
ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que
las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad
asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo
Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro
00 20580101 00 20180101
01 20180102 01 20180102
126 20510403 126 20180103
20 20180104 20 20180104
Recomendacioacuten 6
Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes
de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se
denomina ldquoconsistencia temporalrdquo
Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio
Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231
Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231
Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112
Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112
Recomendacioacuten 7
Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta
corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud
posicionalrdquo
Eventos Deportivos Lugar Eventos Deportivos Lugar
Evento 1 AK 30 25 90 Evento 1 AK 30 25 90
Evento 2 AC 63 215 20 Evento 2 Parque La Florida
Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar
Fecha
inconsistente
Fechas no secuenciales
Lugar inexistente
26 Buenas praacutecticas para la publicacioacuten de datos
9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten
El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de
alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una
institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las
variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a
cabo los traacutemites de una entidad etc
Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un
espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados
Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten
asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un
establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario
identificar la localizacioacuten del dato publicado
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean puedan compartir en maacutes plataformas
Que los usuarios puedan visualizar mis datos en un mapa
iexclRecomendaciones
Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o
lugares geograacuteficos
Ejemplo 1
Incluya direcciones que permitan localizar espacialmente sus datos
Programa Direccioacuten
Registro de atencioacuten a la ciudadaniacutea CL 138 108 16
Centro de autocuidado KR 18 D 77 A 11 SUR
Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46
Centro de autocuidado KR 18 D 73 A 33 SUR
19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico
27 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 2
Utilice coordenadas para indicar la ubicacioacuten de sus datos
EPS Coordenada X Coordenada Y
EPS Convida 9087496334 1051342164
Capital Salud EPS 986321006 954875808
EPS Famisanar 9742508812 8837031501
Aliansalud EPS 9716943356 9659706891
Salud Total EPS 9215624975 9625189518
Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro
de su metadato el Sistema de referencia empleado
MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686
MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116
MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458
Ejemplo 3
Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute
Usuario Vacunado Lugar de Vacunacioacuten
Usuario 1 BOSQUE IZQUIERDO
Usuario 2 LAGUNITAS URBANO
Usuario 3 LA CAPUCHINA
Usuario 4 SAN JOSE SUR
Usuario 5 VENECIA
28 Buenas praacutecticas para la publicacioacuten de datos
10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado
Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el
dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los
usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la
citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el
formato de este
En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero
de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de
su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la
informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado
y reconocido faacutecilmente entre los demaacutes datos
Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de
identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por
cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta
gestioacuten y reutilizacioacuten de sus datos
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean compartidos en maacutes plataformas
Que mis datos puedan vincularse a otros datos en el entorno Web
Que mis datos sean encontrados usados y citados inequiacutevocamente
Garantizar y monitorear la reutilizacioacuten de mis datos
Reducir del uso erroacuteneo de mis datos
iexclRecomendaciones
Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar
Utilice siempre el identificador asignado para publicar sus datos
29 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos
httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la
creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la
asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten
de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito
garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar
descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando
asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten
geograacutefica
Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems
publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace
referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades
territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el
planeamiento del suelo urbano de expansioacuten y ruralrdquo
30 Buenas praacutecticas para la publicacioacuten de datos
OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS
Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten
Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado
Nivel Baacutesico
En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)
Nivel Intermedio
Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)
Nivel Avanzado
Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)
31 Buenas praacutecticas para la publicacioacuten de datos
REFERENCIAS
Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best
Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp
Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices
for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp
Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington
Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec
Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI
Recommendation URL httpdublincoreorgdocumentsdcmi-terms
Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C
Recommendation URL httpswwww3orgTRvocab-dcat
ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de
2014 International Standard
ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers
noviembre de 2009 International Standard
ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013
International Standard
Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best
Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp
T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax
Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986
World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg
W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second
Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-
overview
W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado
el 12 de septiembre de 2018
9 Buenas praacutecticas para la publicacioacuten de datos
2 Proporcionar una licencia en donde se especifiquen las limitaciones yo restricciones de acceso y uso de los datos
Una licencia entendida como las condiciones legales bajo las cuales estaacute disponible la obra2 es
un instrumento mediante el cual el propietario del dato autoriza o no a los usuarios para que
accedan a su contenido y tambieacuten lo faculta para su utilizacioacuten Existen diferentes tipos de
licencia para la distribucioacuten y explotacioacuten de obras y cuyo propoacutesito es regular las condiciones
de acceso y uso de los datos
Dependiendo el acceso autorizado a los datos las licencias pueden clasificarse en
Privativas o restrictivas Aquellas licencias conocidas como cerradas o no libres donde la mayoriacutea de las veces solo el autor puede usar la obra o en caso contrario se definen condiciones especiacuteficas que se deben cumplir para hacer uso de la informacioacuten
Semilibres Aquellas licencias que requieren autorizaciones para que los usuarios utilicen copien distribuyan o modifiquen su contenido
Libres o abiertas Aquellas licencias que en teacuterminos generales permiten usar distribuir y compartir los datos con muy pocas restricciones
Cuando un dato se publica acompantildeado de su licencia el usuario conoce las condiciones de
acceso uso y distribucioacuten de los datos que estaacute consumiendo de esta forma se garantiza que
los datos se distribuyan seguacuten los intereses de la entidad que los produce y se minimizan los
usos indebidos de los datos por parte de los usuarios
Ahora bien definir la licencia adecuada para cada dato dependeraacute de las condiciones que
establezca la entidad productora de este Revise los ejemplos y defina la licencia maacutes adecuada
para sus datos
Para maacutes informacioacuten consulte el Instructivo para la definicioacuten de licencias de datos
iquestQueacute logro
Que el usuario evaluacutee si puede o no usar mis datos
Que el usuario conozca las condiciones de acceso uso y manejo sobre los datos
disponibles
Dar claridad y potenciar el uso de los datos disponibles
Que el usuario de los reconocimientos respectivos a la entidad productora de los datos
Que se genere valor agregado sobre los datos disponibles en caso de asignar una
licencia abierta
2 Recuperado de httpsopendefinitionorgod21es
10 Buenas praacutecticas para la publicacioacuten de datos
iexclRecomendaciones
Identifique la licencia que mejor se acomode a su modelo de negocio Recuerde que
mediante la Ley 1712 de 2014 se reguloacute el derecho de acceso a la informacioacuten puacuteblica
y se incluyeron los principios de facilitacioacuten gratuidad y divulgacioacuten proactiva de la
informacioacuten
Disponga una licencia para su conjunto de datos a traveacutes de un enlace una copia
incorporada o dentro del metadato
Prefiera el uso de licencias abiertas de este modo sus datos seraacuten utilizados en una
mayor cantidad de productos servicios y mercados
Ejemplo 1
Mundialmente conocidas las licencias Creative Commons3 tienen como objetivo fortalecer a los
creadores para que sean quienes definan los teacuterminos en que sus obras pueden ser usadas queacute
derechos desean entregar y en queacute condiciones lo haraacuten A continuacioacuten encontraraacute los
enlaces de acceso para conocer las condiciones de cada una de las licencias disponibles
CC0 10 httpscreativecommonsorgpublicdomainzero10deedes
CC BY 40 httpscreativecommonsorglicensesby40
CC BY-SA 40 httpscreativecommonsorglicensesby-sa40
CC BY-ND 40 httpscreativecommonsorglicensesby-nd40
CC BY-NC 40 httpscreativecommonsorglicensesby-nc40
CC BY-NC-SA 40
httpscreativecommonsorglicensesby-nc-sa40
Ejemplo 2
Tambieacuten existen las licencias abiertas para datos Open Data Commons4 proporcionadas por la
mundialmente conocida red Open Knowledge Foundation Network ndash OKFN5 puede consultar
las condiciones ingresando a los siguientes enlaces
ODbL 10 httpsopendatacommonsorglicensesodblsummary
PDDL 10 httpsopendatacommonsorglicensespddlsummary
ODC-BY 10 httpsopendatacommonsorglicensesbysummary
3 httpcreativecommonsorg 4 httpopendatacommonsorg 5 httpsokfnorg
11 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 3
El Mapa de referencia para Bogotaacute estaacute publicado en
httpswwwidecagovcoesserviciosmapa-de-referencia bajo las condiciones descritas en la
ldquoLICENCIA ABIERTA O CONDICIONES DE USO PARA DATOS ABIERTOS DE LA INFRAESTRUCTURA
INTEGRADA DE DATOS ESPACIALES PARA EL DISTRITO CAPITAL (IDECA)rdquo
httpswwwidecagovcoeslicenciaabierta
12 Buenas praacutecticas para la publicacioacuten de datos
3 Utilizar vocabularios estandarizados y reutilizables en la estructuracioacuten y publicacioacuten de los datos
Un vocabulario define los conceptos y las relaciones que se utilizan para describir y representar
un aacuterea de intereacutes6 Cuando se publican datos en la Web los vocabularios permiten integrar
datos cuando existen ambiguumledades en los teacuterminos utilizados en los diferentes conjuntos de
datos En la praacutectica un vocabulario es un conjunto de palabras que permiten a dos usuarios
comunicarse entre siacute La efectividad de dicha comunicacioacuten radica en que el significado de una
palabra para el usuario emisor sea el mismo que para el usuario receptor independientemente
de si utilizaron el mismo teacutermino
Cuando se habla de interoperabilidad de datos lo que se espera es que tanto los usuarios
como las aplicaciones informaacuteticas entiendan y comprendan la mayor cantidad de informacioacuten
que estaacuten consumiendo Para conseguir esto las comunidades de datos han identificado
vocablos palabras o teacuterminos de uso comuacuten los cuales cuentan con significados apropiados y
que actualmente se encuentran integrados y estructurados en diferentes estaacutendares
internacionales
Se recomienda utilizar vocabularios de este tipo para estandarizar los datos contenidos en la
informacioacuten publicada
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios Que se reduzca la ambiguumledad en la interpretacioacuten de mis datos Que mis datos sean interoperables Que mis datos sean procesados en entornos nacionales e internacionales Que mis datos puedan ser compartidos e intercambiados entre sistemas Que mis datos sean maacutes confiables
iexclRecomendaciones
Consulte normas locales o vocabularios internacionales para la estructuracioacuten7 de sus
datos
Apropie los vocabularios consultados y adapte sus datos a estos en los casos en que sea
posible
Incluya vocabularios ya definidos y reconocidos internacionalmente cuando vaya a
producir nuevos datos
6 httpswwww3orgstandardssemanticwebontology 7 Estructurar significa ajustar los datos a un esquema fijo
13 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
A continuacioacuten se presentan algunos vocabularios internacionales que puede consultar y
apropiar para optimizar el intercambio de sus datos
Data Catalog Vocabulary (DCAT) httpswwww3orgTRvocab-dcatclass-catalog
FOAF Vocabulary Specification httpxmlnscomfoaf01
ISOTC 211 Geographic informationGeomatics Terminology
httpwwwisotc211orgTerminologyhtm
The RDF Data Cube Vocabulary httpswwww3orgTR2014REC-vocab-data-cube-20140116
ODRL Vocabulary amp Expression 22
httpswwww3orgTR2018REC-odrl-vocab-20180215
HTTP Vocabulary in RDF 10 httpswwww3orgTR2017NOTE-HTTP-in-RDF10-20170202
vCard Ontology - for describing People and Organizations
httpswwww3orgTRvcard-rdf
Ejemplo 2
En el contexto Nacional el Ministerio de Tecnologiacuteas de la Informacioacuten y las Comunicaciones ha
establecido el Lenguaje Comuacuten de Intercambio de como un instrumento de consulta que
contiene la definicioacuten de los elementos de datos conceptualizados por las entidades del
estado La consulta la puede realizar en httplenguajeminticgovco
14 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 3
La especificacioacuten vCard disponible en httpswwww3orgTRvcard-rdf promueve un
vocabulario especiacutefico para describir personas y organizaciones
Uno de los vocablos que describe esta especificacioacuten es la ldquodireccioacuten de entregardquo llamado
dentro del vocabulario como ADR y definido como ldquola direccioacuten del objeto representado en
partes estructuradasrdquo
Ahora bien este vocabulario especifica los componentes de la direccioacuten de entrega para el
objeto asiacute el nombre del paiacutes la localidad el coacutedigo postal la regioacuten y la direccioacuten dada por
viacuteas (calles y carreras en el caso colombiano) Esto quiere decir que cualquiera de los
componentes descritos puede usarse como direccioacuten de entrega vaacutelida ya que son equivalentes
entre siacute
Aunque en el vocabulario la direccioacuten de entrega se llame ADR el usuario de la informacioacuten
entenderaacute que un nombre de paiacutes o un coacutedigo postal pueden interpretarse como ADR
15 Buenas praacutecticas para la publicacioacuten de datos
4 Anonimizar los datos de caraacutecter personal informacioacuten estadiacutestica informacioacuten indirectamente identificable e informacioacuten sensible o confidencial
Anonimizar es el proceso que impide la identificacioacuten de las unidades de estudio que son fuente
para los registros individuales de un conjunto8 de datos o maacutes claro es la aplicacioacuten de teacutecnicas
que permitan expresar un dato relativo a personas eliminando la referencia a su identidad9
Baacutesicamente lo que se busca es reducir los riesgos en el uso y procesamiento de datos
personales evitar la extraccioacuten de registros que identifican a una persona reducir la
combinacioacuten de dos o maacutes registros en una o varias bases de datos para identificar a una
persona y minimizar la deduccioacuten de datos personales partir de uno o varios datos publicados
iquestQueacute informacioacuten debo prioritariamente anonimizar
Datos personales Informacioacuten numeacuterica alfabeacutetica graacutefica fotograacutefica acuacutestica o
cualquier otro tipo susceptible de recogida registro tratamiento y transmisioacuten
concerniente a personas fiacutesicas identificadas o identificables (tales como nombre
apellidos estado civil sexo edad domicilio identificacioacuten personal nuacutemero de
teleacutefono etc)10
Informacioacuten sensible Informacioacuten considerada como estrictamente confidencial
Informacioacuten y caracteriacutesticas referentes a la edad procedencia salud raza religioacuten
ideologiacutea afiliacioacuten finanzas etc se consideran de caraacutecter sensible y requieren de
una proteccioacuten especial11
iquestQueacute logro
Garantizar que mis datos publicados cuentan con medidas de proteccioacuten de datos
personales
Eliminar de manera efectiva el riesgo de re-identificacioacuten
Evitar que el procesamiento de mis datos tenga consecuencias negativas para alguna
persona
Disponer muchos maacutes datos sin invadir la informacioacuten personal
iexclRecomendaciones
Implemente actividades de proteccioacuten de la privacidad de los datos personales antes
de publicarlos
Elimine cualquier identificador directo de la persona (nombre documento de
identidad etc)
8 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 9 httpdleraeesid=2jjMiRi 10 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 11 Ibidem
16 Buenas praacutecticas para la publicacioacuten de datos
Reemplace los identificadores directos por coacutedigos de referencia pseudoacutenimos
(algoritmos AES12 o un hash cifrado HMAC13) coacutedigos arbitrarios o aleatorios
Si reemplazando el identificador directo auacuten es faacutecil identificar a la persona elimine el
dato
Clasifique yo categorice los datos
Redondee los datos numeacutericos hacia arriba o hacia abajo
Evaluacutee antes durante y despueacutes de publicados los datos si la anonimizacioacuten de sus
datos es suficiente y evaluacutee regularmente los riesgos existentes
Para maacutes informacioacuten consulte los Lineamientos para la Anonimizacioacuten de micro datos
Ejemplo 1
Antes de publicar sus datos retire el identificador directo de la persona En este caso
reemplace en nuacutemero de documento que identifica al usuario y reemplaacutecelo por un
consecutivo
Usuario Beneficio Usuario Beneficio
80123456 Subsidio de vivienda Usuario 1 Subsidio de vivienda
51123456 Subsidio de alimentacioacuten Usuario 2 Subsidio de alimentacioacuten
19123456 Subsidio al adulto mayor Usuario 3 Subsidio al adulto mayor
53123456 Subsidio de desempleo Usuario 4 Subsidio de desempleo
Ejemplo 2
Clasifique o categorice sus datos En este ejemplo asigne rangos a la edad de manera tal que el
titular del registro no sea identificable por este dato
Usuario Edad Usuario Rango de edad
Usuario 1 11 antildeos Usuario 1 Entre 10 y 15 antildeos
Usuario 2 22 antildeos Usuario 2 Entre 20 y 25 antildeos
Usuario 3 36 antildeos Usuario 3 Entre 35 y 40 antildeos
Usuario 4 63 antildeos Usuario 4 Entre 60 y 65 antildeos
12 Advanced Encryption Standard puede consultar como ha sido implementado este algoritmo en httpsrevistasudistritaleducoojsindexphpTecnuraarticleview72368892 13 Hash-based Message Authentication Code puede consultar como se crea este cifrado en httpsdocsoraclecomcdE19253-01819-7804wanboottasks2-51indexhtml
17 Buenas praacutecticas para la publicacioacuten de datos
5 Publicar los datos en formatos estaacutendar reutilizables y legibles por aplicaciones informaacuteticas
Un formato puede ser definido como la estructura de un disco dividido en campos y pistas
seguacuten un determinado sistema operativo lo que permite almacenar en eacutel informacioacuten14
baacutesicamente es la forma en que se codifican los datos en un archivo informaacutetico
Actualmente conocemos formatos comunes de almacenamiento como el doc una extensioacuten
de Word que almacena texto y cuyo propietario es la compantildeiacutea Microsoft Pero iquestqueacute pasa si un
usuario quiere abrir un documento doc en un procesador de texto diferente a Word
difiacutecilmente va a poder conocer el contenido de dicho documento sin tener esta licencia
Lo que queremos lograr con la implementacioacuten de esta praacutectica es que todos los usuarios que
encuentren mis datos puedan accederlos sin necesidad de contar con un software o aplicacioacuten
informaacutetica especiacutefica
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos puedan ser extraiacutedos transformados y procesados por aplicaciones
informaacuteticas
Que mis datos puedan ser compartidos e intercambiados entre sistemas
Disminuir los costos y los tiempos en el uso y la transformacioacuten de mis datos
iexclRecomendaciones
Prefiera publicar su conjunto de datos en formatos abiertos o no propietario ya que
estos facilitan el uso re-uso y distribucioacuten de estos Se busca que un mayor nuacutemero de
aplicaciones informaacuteticas pueda extraer leer y transformar los datos generando mayor
uso y re-uso por los usuarios
Disponga sus datos en muacuteltiples formatos con el fin de incrementar el acceso a los
mismos Se busca que el mayor nuacutemero de usuarios pueda utilizar los datos sin tener
que transformarlos primero en su formato preferido
Utilice Web Services para mejorar el intercambio e interoperabilidad de los datos
publicados
14 httpdleraeessrvsearchm=30ampw=formato
18 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
A continuacioacuten encontraraacute extensiones de formato propietario y no propietario prefiera para
la publicacioacuten de sus datos las extensiones de la derecha
FORMATO PROPIETARIO FORMATO NO PROPIETARIO
DOC GDB TXT ASCII Grid KML RDF
XLS DWG CSV GeoJSON DXF XML
PPT SHP JSON GML ODF
Ejemplo 2
Si no fue posible utilizar una extensioacuten de formato no propietario publique sus datos en una
variedad de formatos que le permita al usuario acceder a los datos desde diferentes
aplicaciones informaacuteticas
Ejemplo 3
Para publicar sus datos conozca diferentes tipos de Web Services que viajan en la red utilizando extensiones XML
SOAP httpswwww3orgTRsoap
REST httprestelksteinorg
WMS httpwwwopengeospatialorgstandardswms
WFS httpwwwopengeospatialorgstandardswfs
WCS httpwwwopengeospatialorgstandardswcs
19 Buenas praacutecticas para la publicacioacuten de datos
6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos publicados
Un diccionario estaacute definido como un repertorio en forma de libro o en soporte electroacutenico en el
que se recogen seguacuten un orden determinado las palabras o expresiones de una o maacutes lenguas
o de una materia concreta acompantildeadas de su definicioacuten equivalencia o explicacioacuten15
especiacuteficamente en un diccionario de datos se encuentran los conceptos de los datos y sus
propiedades (atributos dominios asociaciones y operaciones) acompantildeados de una definicioacuten
en donde se identifica el propoacutesito alcance y campo de aplicacioacuten del dato publicado
Lograr que los usuarios de mis datos entiendan la informacioacuten que estaacute publicada le permitiraacute
decidir si satisfacen o no su necesidad y le facilitaraacute la decisioacuten para explotar lo datos
Para maacutes informacioacuten consulte el Instructivo Diccionario de Datos
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que se eviten ambiguumledades en la interpretacioacuten de mis datos
Que mis datos publicados esteacuten unificados y consistentes
Que los usuarios comprendan mejor y dispongan de claridad sobre los conceptos de
mis datos
iexclRecomendaciones
Publique como miacutenimo un diccionario de datos que contenga la caracterizacioacuten del
conjunto de datos producidos por su entidad
Cree el diccionario de datos teniendo en cuenta como miacutenimo la siguiente informacioacuten
Nombre del atributo Nombre que identifica de manera clara un atributo
Definicioacuten Descripcioacuten del atributo
Tipo de dato Tipo de valor del atributo
Unidad de medida Expresa la unidad de medida del atributo
Dominio Determina si el atributo tiene asociado un dominio
15 httpdleraeesw=diccionario
20 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
Para el conjunto de datos ldquoEstablecimientos Educativos en Bogotaacuterdquo publicariacuteamos un
diccionario de datos similar al siguiente
Nombre del atributo Definicioacuten Tipo de dato
Unidad de Medida
Dominio
Coacutedigo del establecimiento
Coacutedigo DANE asignado al Institucioacuten Educativa Decimal
Nombre del establecimiento
Nombre de la Institucioacuten Educativa Cadena de Caracteres
Aacuterea construida del establecimiento
Aacuterea construida de la Institucioacuten Educativa Decimal Metros
cuadrados
Sector
Clasificacioacuten asignada seguacuten la naturaleza juriacutedica la cual define las principales caracteriacutesticas que desde lo juriacutedico - administrativo y tiene que ver con el origen de su creacioacuten
Entero
EESector
No podriacuteamos olvidar detallar el dominio asociado
Atributo Nombre del Dominio Coacutedigo Definicioacuten
EESector
Oficial 1
Es una institucioacuten donde su naturaleza de servicio puacuteblico cultural y su funcioacuten social le es inherente cumpliendo con las disposiciones legales y estatutarias que las rigen donde sus rentas se conservan y se aplican debidamente
Privado 2
Es una institucioacuten constituida como persona juriacutedica de utilidad comuacuten donde sus rentas se conservan y se aplican debidamente y que en todo lo esencial se cumple con la voluntad de sus fundadores
21 Buenas praacutecticas para la publicacioacuten de datos
7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos
Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para
acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que
conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como
cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o
software
En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos
publicados se proporcionen recursos o documentos adicionales que puedan ser consultados
yo descargados traveacutes de enlaces o links de otro sitio Web
Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los
procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los
documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad
entre otros
iquestQueacute logro
Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos
Que los usuarios comprendan mejor mis datos
Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios
iexclRecomendaciones
Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el
horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del
dato
No olvide vincular o registrar esta informacioacuten en el metadato
16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp
22 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos
Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318
Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57
Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30
Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217
Ejemplo 2
La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en
httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos
o Gestioacuten de los humedales
o Poliacutetica de Humedales del Distrito Capital
o Normatividad
o Planes de Manejo Ambiental
o Comiteacute distrital de humedales documentos de consulta normatividad
23 Buenas praacutecticas para la publicacioacuten de datos
8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza
La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten
juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado
Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para
satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas
y especificaciones establecidas
Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades
de estos sin embargo en este aparte citaremos los elementos principales que usted o su
entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad
Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de
los datos espaciales
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que los usuarios hablen bien de mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean maacutes compartidos
Que mis datos sean maacutes confiables
Recomendacioacuten 1
Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten
descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten
corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Suba 200 Tunjuelito 500
Ameacutericas 100
850
Tunjuelito 500
18 httpdleraeesid=6nVpk8P|6nXVL1Z
Campo duplicado
Campo inconsistente
Campo vaciacuteo
24 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 2
Identifique y transforme si es necesario los datos que hayan sido registrados en un formato
diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida
del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de
formatordquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Tunjuelito 5008 Tunjuelito 500
Fontiboacuten 40 Fontiboacuten 430
Tunjuelito 500 Tunjuelito 500
Recomendacioacuten 3
Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos
se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de
clasificacioacutenrdquo
Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad
Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10
Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20
Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40
Recomendacioacuten 4
Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos
correspondan a valores conocidos como verdaderos El elemento de calidad asociado se
denomina ldquoexactitud de atributos cuantitativosrdquo
Localidad Mes Temperatura Localidad Mes Temperatura
Chapinero Enero 7degC Chapinero Enero 7degC
Suba Agosto -15degC Suba Agosto 15degC
Tunjuelito Abril 60degC Tunjuelito Abril 16degC
Clasificacioacuten inconsistente
Formato inconsistente
Valor inconsistente
25 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 5
Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por
ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que
las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad
asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo
Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro
00 20580101 00 20180101
01 20180102 01 20180102
126 20510403 126 20180103
20 20180104 20 20180104
Recomendacioacuten 6
Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes
de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se
denomina ldquoconsistencia temporalrdquo
Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio
Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231
Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231
Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112
Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112
Recomendacioacuten 7
Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta
corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud
posicionalrdquo
Eventos Deportivos Lugar Eventos Deportivos Lugar
Evento 1 AK 30 25 90 Evento 1 AK 30 25 90
Evento 2 AC 63 215 20 Evento 2 Parque La Florida
Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar
Fecha
inconsistente
Fechas no secuenciales
Lugar inexistente
26 Buenas praacutecticas para la publicacioacuten de datos
9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten
El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de
alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una
institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las
variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a
cabo los traacutemites de una entidad etc
Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un
espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados
Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten
asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un
establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario
identificar la localizacioacuten del dato publicado
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean puedan compartir en maacutes plataformas
Que los usuarios puedan visualizar mis datos en un mapa
iexclRecomendaciones
Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o
lugares geograacuteficos
Ejemplo 1
Incluya direcciones que permitan localizar espacialmente sus datos
Programa Direccioacuten
Registro de atencioacuten a la ciudadaniacutea CL 138 108 16
Centro de autocuidado KR 18 D 77 A 11 SUR
Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46
Centro de autocuidado KR 18 D 73 A 33 SUR
19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico
27 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 2
Utilice coordenadas para indicar la ubicacioacuten de sus datos
EPS Coordenada X Coordenada Y
EPS Convida 9087496334 1051342164
Capital Salud EPS 986321006 954875808
EPS Famisanar 9742508812 8837031501
Aliansalud EPS 9716943356 9659706891
Salud Total EPS 9215624975 9625189518
Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro
de su metadato el Sistema de referencia empleado
MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686
MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116
MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458
Ejemplo 3
Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute
Usuario Vacunado Lugar de Vacunacioacuten
Usuario 1 BOSQUE IZQUIERDO
Usuario 2 LAGUNITAS URBANO
Usuario 3 LA CAPUCHINA
Usuario 4 SAN JOSE SUR
Usuario 5 VENECIA
28 Buenas praacutecticas para la publicacioacuten de datos
10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado
Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el
dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los
usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la
citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el
formato de este
En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero
de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de
su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la
informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado
y reconocido faacutecilmente entre los demaacutes datos
Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de
identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por
cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta
gestioacuten y reutilizacioacuten de sus datos
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean compartidos en maacutes plataformas
Que mis datos puedan vincularse a otros datos en el entorno Web
Que mis datos sean encontrados usados y citados inequiacutevocamente
Garantizar y monitorear la reutilizacioacuten de mis datos
Reducir del uso erroacuteneo de mis datos
iexclRecomendaciones
Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar
Utilice siempre el identificador asignado para publicar sus datos
29 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos
httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la
creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la
asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten
de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito
garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar
descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando
asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten
geograacutefica
Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems
publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace
referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades
territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el
planeamiento del suelo urbano de expansioacuten y ruralrdquo
30 Buenas praacutecticas para la publicacioacuten de datos
OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS
Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten
Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado
Nivel Baacutesico
En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)
Nivel Intermedio
Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)
Nivel Avanzado
Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)
31 Buenas praacutecticas para la publicacioacuten de datos
REFERENCIAS
Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best
Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp
Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices
for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp
Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington
Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec
Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI
Recommendation URL httpdublincoreorgdocumentsdcmi-terms
Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C
Recommendation URL httpswwww3orgTRvocab-dcat
ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de
2014 International Standard
ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers
noviembre de 2009 International Standard
ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013
International Standard
Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best
Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp
T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax
Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986
World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg
W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second
Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-
overview
W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado
el 12 de septiembre de 2018
10 Buenas praacutecticas para la publicacioacuten de datos
iexclRecomendaciones
Identifique la licencia que mejor se acomode a su modelo de negocio Recuerde que
mediante la Ley 1712 de 2014 se reguloacute el derecho de acceso a la informacioacuten puacuteblica
y se incluyeron los principios de facilitacioacuten gratuidad y divulgacioacuten proactiva de la
informacioacuten
Disponga una licencia para su conjunto de datos a traveacutes de un enlace una copia
incorporada o dentro del metadato
Prefiera el uso de licencias abiertas de este modo sus datos seraacuten utilizados en una
mayor cantidad de productos servicios y mercados
Ejemplo 1
Mundialmente conocidas las licencias Creative Commons3 tienen como objetivo fortalecer a los
creadores para que sean quienes definan los teacuterminos en que sus obras pueden ser usadas queacute
derechos desean entregar y en queacute condiciones lo haraacuten A continuacioacuten encontraraacute los
enlaces de acceso para conocer las condiciones de cada una de las licencias disponibles
CC0 10 httpscreativecommonsorgpublicdomainzero10deedes
CC BY 40 httpscreativecommonsorglicensesby40
CC BY-SA 40 httpscreativecommonsorglicensesby-sa40
CC BY-ND 40 httpscreativecommonsorglicensesby-nd40
CC BY-NC 40 httpscreativecommonsorglicensesby-nc40
CC BY-NC-SA 40
httpscreativecommonsorglicensesby-nc-sa40
Ejemplo 2
Tambieacuten existen las licencias abiertas para datos Open Data Commons4 proporcionadas por la
mundialmente conocida red Open Knowledge Foundation Network ndash OKFN5 puede consultar
las condiciones ingresando a los siguientes enlaces
ODbL 10 httpsopendatacommonsorglicensesodblsummary
PDDL 10 httpsopendatacommonsorglicensespddlsummary
ODC-BY 10 httpsopendatacommonsorglicensesbysummary
3 httpcreativecommonsorg 4 httpopendatacommonsorg 5 httpsokfnorg
11 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 3
El Mapa de referencia para Bogotaacute estaacute publicado en
httpswwwidecagovcoesserviciosmapa-de-referencia bajo las condiciones descritas en la
ldquoLICENCIA ABIERTA O CONDICIONES DE USO PARA DATOS ABIERTOS DE LA INFRAESTRUCTURA
INTEGRADA DE DATOS ESPACIALES PARA EL DISTRITO CAPITAL (IDECA)rdquo
httpswwwidecagovcoeslicenciaabierta
12 Buenas praacutecticas para la publicacioacuten de datos
3 Utilizar vocabularios estandarizados y reutilizables en la estructuracioacuten y publicacioacuten de los datos
Un vocabulario define los conceptos y las relaciones que se utilizan para describir y representar
un aacuterea de intereacutes6 Cuando se publican datos en la Web los vocabularios permiten integrar
datos cuando existen ambiguumledades en los teacuterminos utilizados en los diferentes conjuntos de
datos En la praacutectica un vocabulario es un conjunto de palabras que permiten a dos usuarios
comunicarse entre siacute La efectividad de dicha comunicacioacuten radica en que el significado de una
palabra para el usuario emisor sea el mismo que para el usuario receptor independientemente
de si utilizaron el mismo teacutermino
Cuando se habla de interoperabilidad de datos lo que se espera es que tanto los usuarios
como las aplicaciones informaacuteticas entiendan y comprendan la mayor cantidad de informacioacuten
que estaacuten consumiendo Para conseguir esto las comunidades de datos han identificado
vocablos palabras o teacuterminos de uso comuacuten los cuales cuentan con significados apropiados y
que actualmente se encuentran integrados y estructurados en diferentes estaacutendares
internacionales
Se recomienda utilizar vocabularios de este tipo para estandarizar los datos contenidos en la
informacioacuten publicada
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios Que se reduzca la ambiguumledad en la interpretacioacuten de mis datos Que mis datos sean interoperables Que mis datos sean procesados en entornos nacionales e internacionales Que mis datos puedan ser compartidos e intercambiados entre sistemas Que mis datos sean maacutes confiables
iexclRecomendaciones
Consulte normas locales o vocabularios internacionales para la estructuracioacuten7 de sus
datos
Apropie los vocabularios consultados y adapte sus datos a estos en los casos en que sea
posible
Incluya vocabularios ya definidos y reconocidos internacionalmente cuando vaya a
producir nuevos datos
6 httpswwww3orgstandardssemanticwebontology 7 Estructurar significa ajustar los datos a un esquema fijo
13 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
A continuacioacuten se presentan algunos vocabularios internacionales que puede consultar y
apropiar para optimizar el intercambio de sus datos
Data Catalog Vocabulary (DCAT) httpswwww3orgTRvocab-dcatclass-catalog
FOAF Vocabulary Specification httpxmlnscomfoaf01
ISOTC 211 Geographic informationGeomatics Terminology
httpwwwisotc211orgTerminologyhtm
The RDF Data Cube Vocabulary httpswwww3orgTR2014REC-vocab-data-cube-20140116
ODRL Vocabulary amp Expression 22
httpswwww3orgTR2018REC-odrl-vocab-20180215
HTTP Vocabulary in RDF 10 httpswwww3orgTR2017NOTE-HTTP-in-RDF10-20170202
vCard Ontology - for describing People and Organizations
httpswwww3orgTRvcard-rdf
Ejemplo 2
En el contexto Nacional el Ministerio de Tecnologiacuteas de la Informacioacuten y las Comunicaciones ha
establecido el Lenguaje Comuacuten de Intercambio de como un instrumento de consulta que
contiene la definicioacuten de los elementos de datos conceptualizados por las entidades del
estado La consulta la puede realizar en httplenguajeminticgovco
14 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 3
La especificacioacuten vCard disponible en httpswwww3orgTRvcard-rdf promueve un
vocabulario especiacutefico para describir personas y organizaciones
Uno de los vocablos que describe esta especificacioacuten es la ldquodireccioacuten de entregardquo llamado
dentro del vocabulario como ADR y definido como ldquola direccioacuten del objeto representado en
partes estructuradasrdquo
Ahora bien este vocabulario especifica los componentes de la direccioacuten de entrega para el
objeto asiacute el nombre del paiacutes la localidad el coacutedigo postal la regioacuten y la direccioacuten dada por
viacuteas (calles y carreras en el caso colombiano) Esto quiere decir que cualquiera de los
componentes descritos puede usarse como direccioacuten de entrega vaacutelida ya que son equivalentes
entre siacute
Aunque en el vocabulario la direccioacuten de entrega se llame ADR el usuario de la informacioacuten
entenderaacute que un nombre de paiacutes o un coacutedigo postal pueden interpretarse como ADR
15 Buenas praacutecticas para la publicacioacuten de datos
4 Anonimizar los datos de caraacutecter personal informacioacuten estadiacutestica informacioacuten indirectamente identificable e informacioacuten sensible o confidencial
Anonimizar es el proceso que impide la identificacioacuten de las unidades de estudio que son fuente
para los registros individuales de un conjunto8 de datos o maacutes claro es la aplicacioacuten de teacutecnicas
que permitan expresar un dato relativo a personas eliminando la referencia a su identidad9
Baacutesicamente lo que se busca es reducir los riesgos en el uso y procesamiento de datos
personales evitar la extraccioacuten de registros que identifican a una persona reducir la
combinacioacuten de dos o maacutes registros en una o varias bases de datos para identificar a una
persona y minimizar la deduccioacuten de datos personales partir de uno o varios datos publicados
iquestQueacute informacioacuten debo prioritariamente anonimizar
Datos personales Informacioacuten numeacuterica alfabeacutetica graacutefica fotograacutefica acuacutestica o
cualquier otro tipo susceptible de recogida registro tratamiento y transmisioacuten
concerniente a personas fiacutesicas identificadas o identificables (tales como nombre
apellidos estado civil sexo edad domicilio identificacioacuten personal nuacutemero de
teleacutefono etc)10
Informacioacuten sensible Informacioacuten considerada como estrictamente confidencial
Informacioacuten y caracteriacutesticas referentes a la edad procedencia salud raza religioacuten
ideologiacutea afiliacioacuten finanzas etc se consideran de caraacutecter sensible y requieren de
una proteccioacuten especial11
iquestQueacute logro
Garantizar que mis datos publicados cuentan con medidas de proteccioacuten de datos
personales
Eliminar de manera efectiva el riesgo de re-identificacioacuten
Evitar que el procesamiento de mis datos tenga consecuencias negativas para alguna
persona
Disponer muchos maacutes datos sin invadir la informacioacuten personal
iexclRecomendaciones
Implemente actividades de proteccioacuten de la privacidad de los datos personales antes
de publicarlos
Elimine cualquier identificador directo de la persona (nombre documento de
identidad etc)
8 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 9 httpdleraeesid=2jjMiRi 10 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 11 Ibidem
16 Buenas praacutecticas para la publicacioacuten de datos
Reemplace los identificadores directos por coacutedigos de referencia pseudoacutenimos
(algoritmos AES12 o un hash cifrado HMAC13) coacutedigos arbitrarios o aleatorios
Si reemplazando el identificador directo auacuten es faacutecil identificar a la persona elimine el
dato
Clasifique yo categorice los datos
Redondee los datos numeacutericos hacia arriba o hacia abajo
Evaluacutee antes durante y despueacutes de publicados los datos si la anonimizacioacuten de sus
datos es suficiente y evaluacutee regularmente los riesgos existentes
Para maacutes informacioacuten consulte los Lineamientos para la Anonimizacioacuten de micro datos
Ejemplo 1
Antes de publicar sus datos retire el identificador directo de la persona En este caso
reemplace en nuacutemero de documento que identifica al usuario y reemplaacutecelo por un
consecutivo
Usuario Beneficio Usuario Beneficio
80123456 Subsidio de vivienda Usuario 1 Subsidio de vivienda
51123456 Subsidio de alimentacioacuten Usuario 2 Subsidio de alimentacioacuten
19123456 Subsidio al adulto mayor Usuario 3 Subsidio al adulto mayor
53123456 Subsidio de desempleo Usuario 4 Subsidio de desempleo
Ejemplo 2
Clasifique o categorice sus datos En este ejemplo asigne rangos a la edad de manera tal que el
titular del registro no sea identificable por este dato
Usuario Edad Usuario Rango de edad
Usuario 1 11 antildeos Usuario 1 Entre 10 y 15 antildeos
Usuario 2 22 antildeos Usuario 2 Entre 20 y 25 antildeos
Usuario 3 36 antildeos Usuario 3 Entre 35 y 40 antildeos
Usuario 4 63 antildeos Usuario 4 Entre 60 y 65 antildeos
12 Advanced Encryption Standard puede consultar como ha sido implementado este algoritmo en httpsrevistasudistritaleducoojsindexphpTecnuraarticleview72368892 13 Hash-based Message Authentication Code puede consultar como se crea este cifrado en httpsdocsoraclecomcdE19253-01819-7804wanboottasks2-51indexhtml
17 Buenas praacutecticas para la publicacioacuten de datos
5 Publicar los datos en formatos estaacutendar reutilizables y legibles por aplicaciones informaacuteticas
Un formato puede ser definido como la estructura de un disco dividido en campos y pistas
seguacuten un determinado sistema operativo lo que permite almacenar en eacutel informacioacuten14
baacutesicamente es la forma en que se codifican los datos en un archivo informaacutetico
Actualmente conocemos formatos comunes de almacenamiento como el doc una extensioacuten
de Word que almacena texto y cuyo propietario es la compantildeiacutea Microsoft Pero iquestqueacute pasa si un
usuario quiere abrir un documento doc en un procesador de texto diferente a Word
difiacutecilmente va a poder conocer el contenido de dicho documento sin tener esta licencia
Lo que queremos lograr con la implementacioacuten de esta praacutectica es que todos los usuarios que
encuentren mis datos puedan accederlos sin necesidad de contar con un software o aplicacioacuten
informaacutetica especiacutefica
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos puedan ser extraiacutedos transformados y procesados por aplicaciones
informaacuteticas
Que mis datos puedan ser compartidos e intercambiados entre sistemas
Disminuir los costos y los tiempos en el uso y la transformacioacuten de mis datos
iexclRecomendaciones
Prefiera publicar su conjunto de datos en formatos abiertos o no propietario ya que
estos facilitan el uso re-uso y distribucioacuten de estos Se busca que un mayor nuacutemero de
aplicaciones informaacuteticas pueda extraer leer y transformar los datos generando mayor
uso y re-uso por los usuarios
Disponga sus datos en muacuteltiples formatos con el fin de incrementar el acceso a los
mismos Se busca que el mayor nuacutemero de usuarios pueda utilizar los datos sin tener
que transformarlos primero en su formato preferido
Utilice Web Services para mejorar el intercambio e interoperabilidad de los datos
publicados
14 httpdleraeessrvsearchm=30ampw=formato
18 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
A continuacioacuten encontraraacute extensiones de formato propietario y no propietario prefiera para
la publicacioacuten de sus datos las extensiones de la derecha
FORMATO PROPIETARIO FORMATO NO PROPIETARIO
DOC GDB TXT ASCII Grid KML RDF
XLS DWG CSV GeoJSON DXF XML
PPT SHP JSON GML ODF
Ejemplo 2
Si no fue posible utilizar una extensioacuten de formato no propietario publique sus datos en una
variedad de formatos que le permita al usuario acceder a los datos desde diferentes
aplicaciones informaacuteticas
Ejemplo 3
Para publicar sus datos conozca diferentes tipos de Web Services que viajan en la red utilizando extensiones XML
SOAP httpswwww3orgTRsoap
REST httprestelksteinorg
WMS httpwwwopengeospatialorgstandardswms
WFS httpwwwopengeospatialorgstandardswfs
WCS httpwwwopengeospatialorgstandardswcs
19 Buenas praacutecticas para la publicacioacuten de datos
6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos publicados
Un diccionario estaacute definido como un repertorio en forma de libro o en soporte electroacutenico en el
que se recogen seguacuten un orden determinado las palabras o expresiones de una o maacutes lenguas
o de una materia concreta acompantildeadas de su definicioacuten equivalencia o explicacioacuten15
especiacuteficamente en un diccionario de datos se encuentran los conceptos de los datos y sus
propiedades (atributos dominios asociaciones y operaciones) acompantildeados de una definicioacuten
en donde se identifica el propoacutesito alcance y campo de aplicacioacuten del dato publicado
Lograr que los usuarios de mis datos entiendan la informacioacuten que estaacute publicada le permitiraacute
decidir si satisfacen o no su necesidad y le facilitaraacute la decisioacuten para explotar lo datos
Para maacutes informacioacuten consulte el Instructivo Diccionario de Datos
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que se eviten ambiguumledades en la interpretacioacuten de mis datos
Que mis datos publicados esteacuten unificados y consistentes
Que los usuarios comprendan mejor y dispongan de claridad sobre los conceptos de
mis datos
iexclRecomendaciones
Publique como miacutenimo un diccionario de datos que contenga la caracterizacioacuten del
conjunto de datos producidos por su entidad
Cree el diccionario de datos teniendo en cuenta como miacutenimo la siguiente informacioacuten
Nombre del atributo Nombre que identifica de manera clara un atributo
Definicioacuten Descripcioacuten del atributo
Tipo de dato Tipo de valor del atributo
Unidad de medida Expresa la unidad de medida del atributo
Dominio Determina si el atributo tiene asociado un dominio
15 httpdleraeesw=diccionario
20 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
Para el conjunto de datos ldquoEstablecimientos Educativos en Bogotaacuterdquo publicariacuteamos un
diccionario de datos similar al siguiente
Nombre del atributo Definicioacuten Tipo de dato
Unidad de Medida
Dominio
Coacutedigo del establecimiento
Coacutedigo DANE asignado al Institucioacuten Educativa Decimal
Nombre del establecimiento
Nombre de la Institucioacuten Educativa Cadena de Caracteres
Aacuterea construida del establecimiento
Aacuterea construida de la Institucioacuten Educativa Decimal Metros
cuadrados
Sector
Clasificacioacuten asignada seguacuten la naturaleza juriacutedica la cual define las principales caracteriacutesticas que desde lo juriacutedico - administrativo y tiene que ver con el origen de su creacioacuten
Entero
EESector
No podriacuteamos olvidar detallar el dominio asociado
Atributo Nombre del Dominio Coacutedigo Definicioacuten
EESector
Oficial 1
Es una institucioacuten donde su naturaleza de servicio puacuteblico cultural y su funcioacuten social le es inherente cumpliendo con las disposiciones legales y estatutarias que las rigen donde sus rentas se conservan y se aplican debidamente
Privado 2
Es una institucioacuten constituida como persona juriacutedica de utilidad comuacuten donde sus rentas se conservan y se aplican debidamente y que en todo lo esencial se cumple con la voluntad de sus fundadores
21 Buenas praacutecticas para la publicacioacuten de datos
7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos
Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para
acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que
conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como
cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o
software
En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos
publicados se proporcionen recursos o documentos adicionales que puedan ser consultados
yo descargados traveacutes de enlaces o links de otro sitio Web
Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los
procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los
documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad
entre otros
iquestQueacute logro
Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos
Que los usuarios comprendan mejor mis datos
Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios
iexclRecomendaciones
Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el
horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del
dato
No olvide vincular o registrar esta informacioacuten en el metadato
16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp
22 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos
Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318
Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57
Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30
Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217
Ejemplo 2
La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en
httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos
o Gestioacuten de los humedales
o Poliacutetica de Humedales del Distrito Capital
o Normatividad
o Planes de Manejo Ambiental
o Comiteacute distrital de humedales documentos de consulta normatividad
23 Buenas praacutecticas para la publicacioacuten de datos
8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza
La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten
juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado
Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para
satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas
y especificaciones establecidas
Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades
de estos sin embargo en este aparte citaremos los elementos principales que usted o su
entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad
Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de
los datos espaciales
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que los usuarios hablen bien de mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean maacutes compartidos
Que mis datos sean maacutes confiables
Recomendacioacuten 1
Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten
descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten
corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Suba 200 Tunjuelito 500
Ameacutericas 100
850
Tunjuelito 500
18 httpdleraeesid=6nVpk8P|6nXVL1Z
Campo duplicado
Campo inconsistente
Campo vaciacuteo
24 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 2
Identifique y transforme si es necesario los datos que hayan sido registrados en un formato
diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida
del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de
formatordquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Tunjuelito 5008 Tunjuelito 500
Fontiboacuten 40 Fontiboacuten 430
Tunjuelito 500 Tunjuelito 500
Recomendacioacuten 3
Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos
se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de
clasificacioacutenrdquo
Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad
Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10
Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20
Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40
Recomendacioacuten 4
Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos
correspondan a valores conocidos como verdaderos El elemento de calidad asociado se
denomina ldquoexactitud de atributos cuantitativosrdquo
Localidad Mes Temperatura Localidad Mes Temperatura
Chapinero Enero 7degC Chapinero Enero 7degC
Suba Agosto -15degC Suba Agosto 15degC
Tunjuelito Abril 60degC Tunjuelito Abril 16degC
Clasificacioacuten inconsistente
Formato inconsistente
Valor inconsistente
25 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 5
Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por
ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que
las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad
asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo
Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro
00 20580101 00 20180101
01 20180102 01 20180102
126 20510403 126 20180103
20 20180104 20 20180104
Recomendacioacuten 6
Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes
de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se
denomina ldquoconsistencia temporalrdquo
Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio
Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231
Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231
Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112
Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112
Recomendacioacuten 7
Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta
corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud
posicionalrdquo
Eventos Deportivos Lugar Eventos Deportivos Lugar
Evento 1 AK 30 25 90 Evento 1 AK 30 25 90
Evento 2 AC 63 215 20 Evento 2 Parque La Florida
Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar
Fecha
inconsistente
Fechas no secuenciales
Lugar inexistente
26 Buenas praacutecticas para la publicacioacuten de datos
9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten
El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de
alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una
institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las
variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a
cabo los traacutemites de una entidad etc
Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un
espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados
Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten
asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un
establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario
identificar la localizacioacuten del dato publicado
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean puedan compartir en maacutes plataformas
Que los usuarios puedan visualizar mis datos en un mapa
iexclRecomendaciones
Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o
lugares geograacuteficos
Ejemplo 1
Incluya direcciones que permitan localizar espacialmente sus datos
Programa Direccioacuten
Registro de atencioacuten a la ciudadaniacutea CL 138 108 16
Centro de autocuidado KR 18 D 77 A 11 SUR
Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46
Centro de autocuidado KR 18 D 73 A 33 SUR
19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico
27 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 2
Utilice coordenadas para indicar la ubicacioacuten de sus datos
EPS Coordenada X Coordenada Y
EPS Convida 9087496334 1051342164
Capital Salud EPS 986321006 954875808
EPS Famisanar 9742508812 8837031501
Aliansalud EPS 9716943356 9659706891
Salud Total EPS 9215624975 9625189518
Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro
de su metadato el Sistema de referencia empleado
MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686
MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116
MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458
Ejemplo 3
Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute
Usuario Vacunado Lugar de Vacunacioacuten
Usuario 1 BOSQUE IZQUIERDO
Usuario 2 LAGUNITAS URBANO
Usuario 3 LA CAPUCHINA
Usuario 4 SAN JOSE SUR
Usuario 5 VENECIA
28 Buenas praacutecticas para la publicacioacuten de datos
10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado
Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el
dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los
usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la
citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el
formato de este
En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero
de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de
su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la
informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado
y reconocido faacutecilmente entre los demaacutes datos
Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de
identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por
cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta
gestioacuten y reutilizacioacuten de sus datos
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean compartidos en maacutes plataformas
Que mis datos puedan vincularse a otros datos en el entorno Web
Que mis datos sean encontrados usados y citados inequiacutevocamente
Garantizar y monitorear la reutilizacioacuten de mis datos
Reducir del uso erroacuteneo de mis datos
iexclRecomendaciones
Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar
Utilice siempre el identificador asignado para publicar sus datos
29 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos
httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la
creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la
asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten
de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito
garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar
descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando
asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten
geograacutefica
Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems
publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace
referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades
territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el
planeamiento del suelo urbano de expansioacuten y ruralrdquo
30 Buenas praacutecticas para la publicacioacuten de datos
OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS
Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten
Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado
Nivel Baacutesico
En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)
Nivel Intermedio
Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)
Nivel Avanzado
Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)
31 Buenas praacutecticas para la publicacioacuten de datos
REFERENCIAS
Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best
Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp
Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices
for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp
Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington
Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec
Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI
Recommendation URL httpdublincoreorgdocumentsdcmi-terms
Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C
Recommendation URL httpswwww3orgTRvocab-dcat
ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de
2014 International Standard
ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers
noviembre de 2009 International Standard
ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013
International Standard
Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best
Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp
T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax
Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986
World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg
W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second
Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-
overview
W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado
el 12 de septiembre de 2018
11 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 3
El Mapa de referencia para Bogotaacute estaacute publicado en
httpswwwidecagovcoesserviciosmapa-de-referencia bajo las condiciones descritas en la
ldquoLICENCIA ABIERTA O CONDICIONES DE USO PARA DATOS ABIERTOS DE LA INFRAESTRUCTURA
INTEGRADA DE DATOS ESPACIALES PARA EL DISTRITO CAPITAL (IDECA)rdquo
httpswwwidecagovcoeslicenciaabierta
12 Buenas praacutecticas para la publicacioacuten de datos
3 Utilizar vocabularios estandarizados y reutilizables en la estructuracioacuten y publicacioacuten de los datos
Un vocabulario define los conceptos y las relaciones que se utilizan para describir y representar
un aacuterea de intereacutes6 Cuando se publican datos en la Web los vocabularios permiten integrar
datos cuando existen ambiguumledades en los teacuterminos utilizados en los diferentes conjuntos de
datos En la praacutectica un vocabulario es un conjunto de palabras que permiten a dos usuarios
comunicarse entre siacute La efectividad de dicha comunicacioacuten radica en que el significado de una
palabra para el usuario emisor sea el mismo que para el usuario receptor independientemente
de si utilizaron el mismo teacutermino
Cuando se habla de interoperabilidad de datos lo que se espera es que tanto los usuarios
como las aplicaciones informaacuteticas entiendan y comprendan la mayor cantidad de informacioacuten
que estaacuten consumiendo Para conseguir esto las comunidades de datos han identificado
vocablos palabras o teacuterminos de uso comuacuten los cuales cuentan con significados apropiados y
que actualmente se encuentran integrados y estructurados en diferentes estaacutendares
internacionales
Se recomienda utilizar vocabularios de este tipo para estandarizar los datos contenidos en la
informacioacuten publicada
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios Que se reduzca la ambiguumledad en la interpretacioacuten de mis datos Que mis datos sean interoperables Que mis datos sean procesados en entornos nacionales e internacionales Que mis datos puedan ser compartidos e intercambiados entre sistemas Que mis datos sean maacutes confiables
iexclRecomendaciones
Consulte normas locales o vocabularios internacionales para la estructuracioacuten7 de sus
datos
Apropie los vocabularios consultados y adapte sus datos a estos en los casos en que sea
posible
Incluya vocabularios ya definidos y reconocidos internacionalmente cuando vaya a
producir nuevos datos
6 httpswwww3orgstandardssemanticwebontology 7 Estructurar significa ajustar los datos a un esquema fijo
13 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
A continuacioacuten se presentan algunos vocabularios internacionales que puede consultar y
apropiar para optimizar el intercambio de sus datos
Data Catalog Vocabulary (DCAT) httpswwww3orgTRvocab-dcatclass-catalog
FOAF Vocabulary Specification httpxmlnscomfoaf01
ISOTC 211 Geographic informationGeomatics Terminology
httpwwwisotc211orgTerminologyhtm
The RDF Data Cube Vocabulary httpswwww3orgTR2014REC-vocab-data-cube-20140116
ODRL Vocabulary amp Expression 22
httpswwww3orgTR2018REC-odrl-vocab-20180215
HTTP Vocabulary in RDF 10 httpswwww3orgTR2017NOTE-HTTP-in-RDF10-20170202
vCard Ontology - for describing People and Organizations
httpswwww3orgTRvcard-rdf
Ejemplo 2
En el contexto Nacional el Ministerio de Tecnologiacuteas de la Informacioacuten y las Comunicaciones ha
establecido el Lenguaje Comuacuten de Intercambio de como un instrumento de consulta que
contiene la definicioacuten de los elementos de datos conceptualizados por las entidades del
estado La consulta la puede realizar en httplenguajeminticgovco
14 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 3
La especificacioacuten vCard disponible en httpswwww3orgTRvcard-rdf promueve un
vocabulario especiacutefico para describir personas y organizaciones
Uno de los vocablos que describe esta especificacioacuten es la ldquodireccioacuten de entregardquo llamado
dentro del vocabulario como ADR y definido como ldquola direccioacuten del objeto representado en
partes estructuradasrdquo
Ahora bien este vocabulario especifica los componentes de la direccioacuten de entrega para el
objeto asiacute el nombre del paiacutes la localidad el coacutedigo postal la regioacuten y la direccioacuten dada por
viacuteas (calles y carreras en el caso colombiano) Esto quiere decir que cualquiera de los
componentes descritos puede usarse como direccioacuten de entrega vaacutelida ya que son equivalentes
entre siacute
Aunque en el vocabulario la direccioacuten de entrega se llame ADR el usuario de la informacioacuten
entenderaacute que un nombre de paiacutes o un coacutedigo postal pueden interpretarse como ADR
15 Buenas praacutecticas para la publicacioacuten de datos
4 Anonimizar los datos de caraacutecter personal informacioacuten estadiacutestica informacioacuten indirectamente identificable e informacioacuten sensible o confidencial
Anonimizar es el proceso que impide la identificacioacuten de las unidades de estudio que son fuente
para los registros individuales de un conjunto8 de datos o maacutes claro es la aplicacioacuten de teacutecnicas
que permitan expresar un dato relativo a personas eliminando la referencia a su identidad9
Baacutesicamente lo que se busca es reducir los riesgos en el uso y procesamiento de datos
personales evitar la extraccioacuten de registros que identifican a una persona reducir la
combinacioacuten de dos o maacutes registros en una o varias bases de datos para identificar a una
persona y minimizar la deduccioacuten de datos personales partir de uno o varios datos publicados
iquestQueacute informacioacuten debo prioritariamente anonimizar
Datos personales Informacioacuten numeacuterica alfabeacutetica graacutefica fotograacutefica acuacutestica o
cualquier otro tipo susceptible de recogida registro tratamiento y transmisioacuten
concerniente a personas fiacutesicas identificadas o identificables (tales como nombre
apellidos estado civil sexo edad domicilio identificacioacuten personal nuacutemero de
teleacutefono etc)10
Informacioacuten sensible Informacioacuten considerada como estrictamente confidencial
Informacioacuten y caracteriacutesticas referentes a la edad procedencia salud raza religioacuten
ideologiacutea afiliacioacuten finanzas etc se consideran de caraacutecter sensible y requieren de
una proteccioacuten especial11
iquestQueacute logro
Garantizar que mis datos publicados cuentan con medidas de proteccioacuten de datos
personales
Eliminar de manera efectiva el riesgo de re-identificacioacuten
Evitar que el procesamiento de mis datos tenga consecuencias negativas para alguna
persona
Disponer muchos maacutes datos sin invadir la informacioacuten personal
iexclRecomendaciones
Implemente actividades de proteccioacuten de la privacidad de los datos personales antes
de publicarlos
Elimine cualquier identificador directo de la persona (nombre documento de
identidad etc)
8 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 9 httpdleraeesid=2jjMiRi 10 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 11 Ibidem
16 Buenas praacutecticas para la publicacioacuten de datos
Reemplace los identificadores directos por coacutedigos de referencia pseudoacutenimos
(algoritmos AES12 o un hash cifrado HMAC13) coacutedigos arbitrarios o aleatorios
Si reemplazando el identificador directo auacuten es faacutecil identificar a la persona elimine el
dato
Clasifique yo categorice los datos
Redondee los datos numeacutericos hacia arriba o hacia abajo
Evaluacutee antes durante y despueacutes de publicados los datos si la anonimizacioacuten de sus
datos es suficiente y evaluacutee regularmente los riesgos existentes
Para maacutes informacioacuten consulte los Lineamientos para la Anonimizacioacuten de micro datos
Ejemplo 1
Antes de publicar sus datos retire el identificador directo de la persona En este caso
reemplace en nuacutemero de documento que identifica al usuario y reemplaacutecelo por un
consecutivo
Usuario Beneficio Usuario Beneficio
80123456 Subsidio de vivienda Usuario 1 Subsidio de vivienda
51123456 Subsidio de alimentacioacuten Usuario 2 Subsidio de alimentacioacuten
19123456 Subsidio al adulto mayor Usuario 3 Subsidio al adulto mayor
53123456 Subsidio de desempleo Usuario 4 Subsidio de desempleo
Ejemplo 2
Clasifique o categorice sus datos En este ejemplo asigne rangos a la edad de manera tal que el
titular del registro no sea identificable por este dato
Usuario Edad Usuario Rango de edad
Usuario 1 11 antildeos Usuario 1 Entre 10 y 15 antildeos
Usuario 2 22 antildeos Usuario 2 Entre 20 y 25 antildeos
Usuario 3 36 antildeos Usuario 3 Entre 35 y 40 antildeos
Usuario 4 63 antildeos Usuario 4 Entre 60 y 65 antildeos
12 Advanced Encryption Standard puede consultar como ha sido implementado este algoritmo en httpsrevistasudistritaleducoojsindexphpTecnuraarticleview72368892 13 Hash-based Message Authentication Code puede consultar como se crea este cifrado en httpsdocsoraclecomcdE19253-01819-7804wanboottasks2-51indexhtml
17 Buenas praacutecticas para la publicacioacuten de datos
5 Publicar los datos en formatos estaacutendar reutilizables y legibles por aplicaciones informaacuteticas
Un formato puede ser definido como la estructura de un disco dividido en campos y pistas
seguacuten un determinado sistema operativo lo que permite almacenar en eacutel informacioacuten14
baacutesicamente es la forma en que se codifican los datos en un archivo informaacutetico
Actualmente conocemos formatos comunes de almacenamiento como el doc una extensioacuten
de Word que almacena texto y cuyo propietario es la compantildeiacutea Microsoft Pero iquestqueacute pasa si un
usuario quiere abrir un documento doc en un procesador de texto diferente a Word
difiacutecilmente va a poder conocer el contenido de dicho documento sin tener esta licencia
Lo que queremos lograr con la implementacioacuten de esta praacutectica es que todos los usuarios que
encuentren mis datos puedan accederlos sin necesidad de contar con un software o aplicacioacuten
informaacutetica especiacutefica
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos puedan ser extraiacutedos transformados y procesados por aplicaciones
informaacuteticas
Que mis datos puedan ser compartidos e intercambiados entre sistemas
Disminuir los costos y los tiempos en el uso y la transformacioacuten de mis datos
iexclRecomendaciones
Prefiera publicar su conjunto de datos en formatos abiertos o no propietario ya que
estos facilitan el uso re-uso y distribucioacuten de estos Se busca que un mayor nuacutemero de
aplicaciones informaacuteticas pueda extraer leer y transformar los datos generando mayor
uso y re-uso por los usuarios
Disponga sus datos en muacuteltiples formatos con el fin de incrementar el acceso a los
mismos Se busca que el mayor nuacutemero de usuarios pueda utilizar los datos sin tener
que transformarlos primero en su formato preferido
Utilice Web Services para mejorar el intercambio e interoperabilidad de los datos
publicados
14 httpdleraeessrvsearchm=30ampw=formato
18 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
A continuacioacuten encontraraacute extensiones de formato propietario y no propietario prefiera para
la publicacioacuten de sus datos las extensiones de la derecha
FORMATO PROPIETARIO FORMATO NO PROPIETARIO
DOC GDB TXT ASCII Grid KML RDF
XLS DWG CSV GeoJSON DXF XML
PPT SHP JSON GML ODF
Ejemplo 2
Si no fue posible utilizar una extensioacuten de formato no propietario publique sus datos en una
variedad de formatos que le permita al usuario acceder a los datos desde diferentes
aplicaciones informaacuteticas
Ejemplo 3
Para publicar sus datos conozca diferentes tipos de Web Services que viajan en la red utilizando extensiones XML
SOAP httpswwww3orgTRsoap
REST httprestelksteinorg
WMS httpwwwopengeospatialorgstandardswms
WFS httpwwwopengeospatialorgstandardswfs
WCS httpwwwopengeospatialorgstandardswcs
19 Buenas praacutecticas para la publicacioacuten de datos
6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos publicados
Un diccionario estaacute definido como un repertorio en forma de libro o en soporte electroacutenico en el
que se recogen seguacuten un orden determinado las palabras o expresiones de una o maacutes lenguas
o de una materia concreta acompantildeadas de su definicioacuten equivalencia o explicacioacuten15
especiacuteficamente en un diccionario de datos se encuentran los conceptos de los datos y sus
propiedades (atributos dominios asociaciones y operaciones) acompantildeados de una definicioacuten
en donde se identifica el propoacutesito alcance y campo de aplicacioacuten del dato publicado
Lograr que los usuarios de mis datos entiendan la informacioacuten que estaacute publicada le permitiraacute
decidir si satisfacen o no su necesidad y le facilitaraacute la decisioacuten para explotar lo datos
Para maacutes informacioacuten consulte el Instructivo Diccionario de Datos
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que se eviten ambiguumledades en la interpretacioacuten de mis datos
Que mis datos publicados esteacuten unificados y consistentes
Que los usuarios comprendan mejor y dispongan de claridad sobre los conceptos de
mis datos
iexclRecomendaciones
Publique como miacutenimo un diccionario de datos que contenga la caracterizacioacuten del
conjunto de datos producidos por su entidad
Cree el diccionario de datos teniendo en cuenta como miacutenimo la siguiente informacioacuten
Nombre del atributo Nombre que identifica de manera clara un atributo
Definicioacuten Descripcioacuten del atributo
Tipo de dato Tipo de valor del atributo
Unidad de medida Expresa la unidad de medida del atributo
Dominio Determina si el atributo tiene asociado un dominio
15 httpdleraeesw=diccionario
20 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
Para el conjunto de datos ldquoEstablecimientos Educativos en Bogotaacuterdquo publicariacuteamos un
diccionario de datos similar al siguiente
Nombre del atributo Definicioacuten Tipo de dato
Unidad de Medida
Dominio
Coacutedigo del establecimiento
Coacutedigo DANE asignado al Institucioacuten Educativa Decimal
Nombre del establecimiento
Nombre de la Institucioacuten Educativa Cadena de Caracteres
Aacuterea construida del establecimiento
Aacuterea construida de la Institucioacuten Educativa Decimal Metros
cuadrados
Sector
Clasificacioacuten asignada seguacuten la naturaleza juriacutedica la cual define las principales caracteriacutesticas que desde lo juriacutedico - administrativo y tiene que ver con el origen de su creacioacuten
Entero
EESector
No podriacuteamos olvidar detallar el dominio asociado
Atributo Nombre del Dominio Coacutedigo Definicioacuten
EESector
Oficial 1
Es una institucioacuten donde su naturaleza de servicio puacuteblico cultural y su funcioacuten social le es inherente cumpliendo con las disposiciones legales y estatutarias que las rigen donde sus rentas se conservan y se aplican debidamente
Privado 2
Es una institucioacuten constituida como persona juriacutedica de utilidad comuacuten donde sus rentas se conservan y se aplican debidamente y que en todo lo esencial se cumple con la voluntad de sus fundadores
21 Buenas praacutecticas para la publicacioacuten de datos
7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos
Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para
acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que
conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como
cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o
software
En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos
publicados se proporcionen recursos o documentos adicionales que puedan ser consultados
yo descargados traveacutes de enlaces o links de otro sitio Web
Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los
procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los
documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad
entre otros
iquestQueacute logro
Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos
Que los usuarios comprendan mejor mis datos
Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios
iexclRecomendaciones
Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el
horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del
dato
No olvide vincular o registrar esta informacioacuten en el metadato
16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp
22 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos
Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318
Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57
Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30
Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217
Ejemplo 2
La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en
httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos
o Gestioacuten de los humedales
o Poliacutetica de Humedales del Distrito Capital
o Normatividad
o Planes de Manejo Ambiental
o Comiteacute distrital de humedales documentos de consulta normatividad
23 Buenas praacutecticas para la publicacioacuten de datos
8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza
La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten
juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado
Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para
satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas
y especificaciones establecidas
Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades
de estos sin embargo en este aparte citaremos los elementos principales que usted o su
entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad
Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de
los datos espaciales
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que los usuarios hablen bien de mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean maacutes compartidos
Que mis datos sean maacutes confiables
Recomendacioacuten 1
Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten
descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten
corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Suba 200 Tunjuelito 500
Ameacutericas 100
850
Tunjuelito 500
18 httpdleraeesid=6nVpk8P|6nXVL1Z
Campo duplicado
Campo inconsistente
Campo vaciacuteo
24 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 2
Identifique y transforme si es necesario los datos que hayan sido registrados en un formato
diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida
del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de
formatordquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Tunjuelito 5008 Tunjuelito 500
Fontiboacuten 40 Fontiboacuten 430
Tunjuelito 500 Tunjuelito 500
Recomendacioacuten 3
Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos
se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de
clasificacioacutenrdquo
Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad
Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10
Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20
Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40
Recomendacioacuten 4
Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos
correspondan a valores conocidos como verdaderos El elemento de calidad asociado se
denomina ldquoexactitud de atributos cuantitativosrdquo
Localidad Mes Temperatura Localidad Mes Temperatura
Chapinero Enero 7degC Chapinero Enero 7degC
Suba Agosto -15degC Suba Agosto 15degC
Tunjuelito Abril 60degC Tunjuelito Abril 16degC
Clasificacioacuten inconsistente
Formato inconsistente
Valor inconsistente
25 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 5
Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por
ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que
las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad
asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo
Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro
00 20580101 00 20180101
01 20180102 01 20180102
126 20510403 126 20180103
20 20180104 20 20180104
Recomendacioacuten 6
Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes
de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se
denomina ldquoconsistencia temporalrdquo
Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio
Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231
Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231
Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112
Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112
Recomendacioacuten 7
Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta
corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud
posicionalrdquo
Eventos Deportivos Lugar Eventos Deportivos Lugar
Evento 1 AK 30 25 90 Evento 1 AK 30 25 90
Evento 2 AC 63 215 20 Evento 2 Parque La Florida
Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar
Fecha
inconsistente
Fechas no secuenciales
Lugar inexistente
26 Buenas praacutecticas para la publicacioacuten de datos
9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten
El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de
alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una
institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las
variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a
cabo los traacutemites de una entidad etc
Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un
espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados
Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten
asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un
establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario
identificar la localizacioacuten del dato publicado
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean puedan compartir en maacutes plataformas
Que los usuarios puedan visualizar mis datos en un mapa
iexclRecomendaciones
Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o
lugares geograacuteficos
Ejemplo 1
Incluya direcciones que permitan localizar espacialmente sus datos
Programa Direccioacuten
Registro de atencioacuten a la ciudadaniacutea CL 138 108 16
Centro de autocuidado KR 18 D 77 A 11 SUR
Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46
Centro de autocuidado KR 18 D 73 A 33 SUR
19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico
27 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 2
Utilice coordenadas para indicar la ubicacioacuten de sus datos
EPS Coordenada X Coordenada Y
EPS Convida 9087496334 1051342164
Capital Salud EPS 986321006 954875808
EPS Famisanar 9742508812 8837031501
Aliansalud EPS 9716943356 9659706891
Salud Total EPS 9215624975 9625189518
Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro
de su metadato el Sistema de referencia empleado
MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686
MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116
MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458
Ejemplo 3
Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute
Usuario Vacunado Lugar de Vacunacioacuten
Usuario 1 BOSQUE IZQUIERDO
Usuario 2 LAGUNITAS URBANO
Usuario 3 LA CAPUCHINA
Usuario 4 SAN JOSE SUR
Usuario 5 VENECIA
28 Buenas praacutecticas para la publicacioacuten de datos
10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado
Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el
dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los
usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la
citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el
formato de este
En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero
de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de
su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la
informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado
y reconocido faacutecilmente entre los demaacutes datos
Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de
identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por
cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta
gestioacuten y reutilizacioacuten de sus datos
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean compartidos en maacutes plataformas
Que mis datos puedan vincularse a otros datos en el entorno Web
Que mis datos sean encontrados usados y citados inequiacutevocamente
Garantizar y monitorear la reutilizacioacuten de mis datos
Reducir del uso erroacuteneo de mis datos
iexclRecomendaciones
Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar
Utilice siempre el identificador asignado para publicar sus datos
29 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos
httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la
creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la
asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten
de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito
garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar
descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando
asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten
geograacutefica
Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems
publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace
referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades
territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el
planeamiento del suelo urbano de expansioacuten y ruralrdquo
30 Buenas praacutecticas para la publicacioacuten de datos
OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS
Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten
Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado
Nivel Baacutesico
En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)
Nivel Intermedio
Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)
Nivel Avanzado
Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)
31 Buenas praacutecticas para la publicacioacuten de datos
REFERENCIAS
Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best
Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp
Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices
for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp
Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington
Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec
Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI
Recommendation URL httpdublincoreorgdocumentsdcmi-terms
Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C
Recommendation URL httpswwww3orgTRvocab-dcat
ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de
2014 International Standard
ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers
noviembre de 2009 International Standard
ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013
International Standard
Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best
Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp
T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax
Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986
World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg
W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second
Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-
overview
W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado
el 12 de septiembre de 2018
12 Buenas praacutecticas para la publicacioacuten de datos
3 Utilizar vocabularios estandarizados y reutilizables en la estructuracioacuten y publicacioacuten de los datos
Un vocabulario define los conceptos y las relaciones que se utilizan para describir y representar
un aacuterea de intereacutes6 Cuando se publican datos en la Web los vocabularios permiten integrar
datos cuando existen ambiguumledades en los teacuterminos utilizados en los diferentes conjuntos de
datos En la praacutectica un vocabulario es un conjunto de palabras que permiten a dos usuarios
comunicarse entre siacute La efectividad de dicha comunicacioacuten radica en que el significado de una
palabra para el usuario emisor sea el mismo que para el usuario receptor independientemente
de si utilizaron el mismo teacutermino
Cuando se habla de interoperabilidad de datos lo que se espera es que tanto los usuarios
como las aplicaciones informaacuteticas entiendan y comprendan la mayor cantidad de informacioacuten
que estaacuten consumiendo Para conseguir esto las comunidades de datos han identificado
vocablos palabras o teacuterminos de uso comuacuten los cuales cuentan con significados apropiados y
que actualmente se encuentran integrados y estructurados en diferentes estaacutendares
internacionales
Se recomienda utilizar vocabularios de este tipo para estandarizar los datos contenidos en la
informacioacuten publicada
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios Que se reduzca la ambiguumledad en la interpretacioacuten de mis datos Que mis datos sean interoperables Que mis datos sean procesados en entornos nacionales e internacionales Que mis datos puedan ser compartidos e intercambiados entre sistemas Que mis datos sean maacutes confiables
iexclRecomendaciones
Consulte normas locales o vocabularios internacionales para la estructuracioacuten7 de sus
datos
Apropie los vocabularios consultados y adapte sus datos a estos en los casos en que sea
posible
Incluya vocabularios ya definidos y reconocidos internacionalmente cuando vaya a
producir nuevos datos
6 httpswwww3orgstandardssemanticwebontology 7 Estructurar significa ajustar los datos a un esquema fijo
13 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
A continuacioacuten se presentan algunos vocabularios internacionales que puede consultar y
apropiar para optimizar el intercambio de sus datos
Data Catalog Vocabulary (DCAT) httpswwww3orgTRvocab-dcatclass-catalog
FOAF Vocabulary Specification httpxmlnscomfoaf01
ISOTC 211 Geographic informationGeomatics Terminology
httpwwwisotc211orgTerminologyhtm
The RDF Data Cube Vocabulary httpswwww3orgTR2014REC-vocab-data-cube-20140116
ODRL Vocabulary amp Expression 22
httpswwww3orgTR2018REC-odrl-vocab-20180215
HTTP Vocabulary in RDF 10 httpswwww3orgTR2017NOTE-HTTP-in-RDF10-20170202
vCard Ontology - for describing People and Organizations
httpswwww3orgTRvcard-rdf
Ejemplo 2
En el contexto Nacional el Ministerio de Tecnologiacuteas de la Informacioacuten y las Comunicaciones ha
establecido el Lenguaje Comuacuten de Intercambio de como un instrumento de consulta que
contiene la definicioacuten de los elementos de datos conceptualizados por las entidades del
estado La consulta la puede realizar en httplenguajeminticgovco
14 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 3
La especificacioacuten vCard disponible en httpswwww3orgTRvcard-rdf promueve un
vocabulario especiacutefico para describir personas y organizaciones
Uno de los vocablos que describe esta especificacioacuten es la ldquodireccioacuten de entregardquo llamado
dentro del vocabulario como ADR y definido como ldquola direccioacuten del objeto representado en
partes estructuradasrdquo
Ahora bien este vocabulario especifica los componentes de la direccioacuten de entrega para el
objeto asiacute el nombre del paiacutes la localidad el coacutedigo postal la regioacuten y la direccioacuten dada por
viacuteas (calles y carreras en el caso colombiano) Esto quiere decir que cualquiera de los
componentes descritos puede usarse como direccioacuten de entrega vaacutelida ya que son equivalentes
entre siacute
Aunque en el vocabulario la direccioacuten de entrega se llame ADR el usuario de la informacioacuten
entenderaacute que un nombre de paiacutes o un coacutedigo postal pueden interpretarse como ADR
15 Buenas praacutecticas para la publicacioacuten de datos
4 Anonimizar los datos de caraacutecter personal informacioacuten estadiacutestica informacioacuten indirectamente identificable e informacioacuten sensible o confidencial
Anonimizar es el proceso que impide la identificacioacuten de las unidades de estudio que son fuente
para los registros individuales de un conjunto8 de datos o maacutes claro es la aplicacioacuten de teacutecnicas
que permitan expresar un dato relativo a personas eliminando la referencia a su identidad9
Baacutesicamente lo que se busca es reducir los riesgos en el uso y procesamiento de datos
personales evitar la extraccioacuten de registros que identifican a una persona reducir la
combinacioacuten de dos o maacutes registros en una o varias bases de datos para identificar a una
persona y minimizar la deduccioacuten de datos personales partir de uno o varios datos publicados
iquestQueacute informacioacuten debo prioritariamente anonimizar
Datos personales Informacioacuten numeacuterica alfabeacutetica graacutefica fotograacutefica acuacutestica o
cualquier otro tipo susceptible de recogida registro tratamiento y transmisioacuten
concerniente a personas fiacutesicas identificadas o identificables (tales como nombre
apellidos estado civil sexo edad domicilio identificacioacuten personal nuacutemero de
teleacutefono etc)10
Informacioacuten sensible Informacioacuten considerada como estrictamente confidencial
Informacioacuten y caracteriacutesticas referentes a la edad procedencia salud raza religioacuten
ideologiacutea afiliacioacuten finanzas etc se consideran de caraacutecter sensible y requieren de
una proteccioacuten especial11
iquestQueacute logro
Garantizar que mis datos publicados cuentan con medidas de proteccioacuten de datos
personales
Eliminar de manera efectiva el riesgo de re-identificacioacuten
Evitar que el procesamiento de mis datos tenga consecuencias negativas para alguna
persona
Disponer muchos maacutes datos sin invadir la informacioacuten personal
iexclRecomendaciones
Implemente actividades de proteccioacuten de la privacidad de los datos personales antes
de publicarlos
Elimine cualquier identificador directo de la persona (nombre documento de
identidad etc)
8 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 9 httpdleraeesid=2jjMiRi 10 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 11 Ibidem
16 Buenas praacutecticas para la publicacioacuten de datos
Reemplace los identificadores directos por coacutedigos de referencia pseudoacutenimos
(algoritmos AES12 o un hash cifrado HMAC13) coacutedigos arbitrarios o aleatorios
Si reemplazando el identificador directo auacuten es faacutecil identificar a la persona elimine el
dato
Clasifique yo categorice los datos
Redondee los datos numeacutericos hacia arriba o hacia abajo
Evaluacutee antes durante y despueacutes de publicados los datos si la anonimizacioacuten de sus
datos es suficiente y evaluacutee regularmente los riesgos existentes
Para maacutes informacioacuten consulte los Lineamientos para la Anonimizacioacuten de micro datos
Ejemplo 1
Antes de publicar sus datos retire el identificador directo de la persona En este caso
reemplace en nuacutemero de documento que identifica al usuario y reemplaacutecelo por un
consecutivo
Usuario Beneficio Usuario Beneficio
80123456 Subsidio de vivienda Usuario 1 Subsidio de vivienda
51123456 Subsidio de alimentacioacuten Usuario 2 Subsidio de alimentacioacuten
19123456 Subsidio al adulto mayor Usuario 3 Subsidio al adulto mayor
53123456 Subsidio de desempleo Usuario 4 Subsidio de desempleo
Ejemplo 2
Clasifique o categorice sus datos En este ejemplo asigne rangos a la edad de manera tal que el
titular del registro no sea identificable por este dato
Usuario Edad Usuario Rango de edad
Usuario 1 11 antildeos Usuario 1 Entre 10 y 15 antildeos
Usuario 2 22 antildeos Usuario 2 Entre 20 y 25 antildeos
Usuario 3 36 antildeos Usuario 3 Entre 35 y 40 antildeos
Usuario 4 63 antildeos Usuario 4 Entre 60 y 65 antildeos
12 Advanced Encryption Standard puede consultar como ha sido implementado este algoritmo en httpsrevistasudistritaleducoojsindexphpTecnuraarticleview72368892 13 Hash-based Message Authentication Code puede consultar como se crea este cifrado en httpsdocsoraclecomcdE19253-01819-7804wanboottasks2-51indexhtml
17 Buenas praacutecticas para la publicacioacuten de datos
5 Publicar los datos en formatos estaacutendar reutilizables y legibles por aplicaciones informaacuteticas
Un formato puede ser definido como la estructura de un disco dividido en campos y pistas
seguacuten un determinado sistema operativo lo que permite almacenar en eacutel informacioacuten14
baacutesicamente es la forma en que se codifican los datos en un archivo informaacutetico
Actualmente conocemos formatos comunes de almacenamiento como el doc una extensioacuten
de Word que almacena texto y cuyo propietario es la compantildeiacutea Microsoft Pero iquestqueacute pasa si un
usuario quiere abrir un documento doc en un procesador de texto diferente a Word
difiacutecilmente va a poder conocer el contenido de dicho documento sin tener esta licencia
Lo que queremos lograr con la implementacioacuten de esta praacutectica es que todos los usuarios que
encuentren mis datos puedan accederlos sin necesidad de contar con un software o aplicacioacuten
informaacutetica especiacutefica
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos puedan ser extraiacutedos transformados y procesados por aplicaciones
informaacuteticas
Que mis datos puedan ser compartidos e intercambiados entre sistemas
Disminuir los costos y los tiempos en el uso y la transformacioacuten de mis datos
iexclRecomendaciones
Prefiera publicar su conjunto de datos en formatos abiertos o no propietario ya que
estos facilitan el uso re-uso y distribucioacuten de estos Se busca que un mayor nuacutemero de
aplicaciones informaacuteticas pueda extraer leer y transformar los datos generando mayor
uso y re-uso por los usuarios
Disponga sus datos en muacuteltiples formatos con el fin de incrementar el acceso a los
mismos Se busca que el mayor nuacutemero de usuarios pueda utilizar los datos sin tener
que transformarlos primero en su formato preferido
Utilice Web Services para mejorar el intercambio e interoperabilidad de los datos
publicados
14 httpdleraeessrvsearchm=30ampw=formato
18 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
A continuacioacuten encontraraacute extensiones de formato propietario y no propietario prefiera para
la publicacioacuten de sus datos las extensiones de la derecha
FORMATO PROPIETARIO FORMATO NO PROPIETARIO
DOC GDB TXT ASCII Grid KML RDF
XLS DWG CSV GeoJSON DXF XML
PPT SHP JSON GML ODF
Ejemplo 2
Si no fue posible utilizar una extensioacuten de formato no propietario publique sus datos en una
variedad de formatos que le permita al usuario acceder a los datos desde diferentes
aplicaciones informaacuteticas
Ejemplo 3
Para publicar sus datos conozca diferentes tipos de Web Services que viajan en la red utilizando extensiones XML
SOAP httpswwww3orgTRsoap
REST httprestelksteinorg
WMS httpwwwopengeospatialorgstandardswms
WFS httpwwwopengeospatialorgstandardswfs
WCS httpwwwopengeospatialorgstandardswcs
19 Buenas praacutecticas para la publicacioacuten de datos
6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos publicados
Un diccionario estaacute definido como un repertorio en forma de libro o en soporte electroacutenico en el
que se recogen seguacuten un orden determinado las palabras o expresiones de una o maacutes lenguas
o de una materia concreta acompantildeadas de su definicioacuten equivalencia o explicacioacuten15
especiacuteficamente en un diccionario de datos se encuentran los conceptos de los datos y sus
propiedades (atributos dominios asociaciones y operaciones) acompantildeados de una definicioacuten
en donde se identifica el propoacutesito alcance y campo de aplicacioacuten del dato publicado
Lograr que los usuarios de mis datos entiendan la informacioacuten que estaacute publicada le permitiraacute
decidir si satisfacen o no su necesidad y le facilitaraacute la decisioacuten para explotar lo datos
Para maacutes informacioacuten consulte el Instructivo Diccionario de Datos
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que se eviten ambiguumledades en la interpretacioacuten de mis datos
Que mis datos publicados esteacuten unificados y consistentes
Que los usuarios comprendan mejor y dispongan de claridad sobre los conceptos de
mis datos
iexclRecomendaciones
Publique como miacutenimo un diccionario de datos que contenga la caracterizacioacuten del
conjunto de datos producidos por su entidad
Cree el diccionario de datos teniendo en cuenta como miacutenimo la siguiente informacioacuten
Nombre del atributo Nombre que identifica de manera clara un atributo
Definicioacuten Descripcioacuten del atributo
Tipo de dato Tipo de valor del atributo
Unidad de medida Expresa la unidad de medida del atributo
Dominio Determina si el atributo tiene asociado un dominio
15 httpdleraeesw=diccionario
20 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
Para el conjunto de datos ldquoEstablecimientos Educativos en Bogotaacuterdquo publicariacuteamos un
diccionario de datos similar al siguiente
Nombre del atributo Definicioacuten Tipo de dato
Unidad de Medida
Dominio
Coacutedigo del establecimiento
Coacutedigo DANE asignado al Institucioacuten Educativa Decimal
Nombre del establecimiento
Nombre de la Institucioacuten Educativa Cadena de Caracteres
Aacuterea construida del establecimiento
Aacuterea construida de la Institucioacuten Educativa Decimal Metros
cuadrados
Sector
Clasificacioacuten asignada seguacuten la naturaleza juriacutedica la cual define las principales caracteriacutesticas que desde lo juriacutedico - administrativo y tiene que ver con el origen de su creacioacuten
Entero
EESector
No podriacuteamos olvidar detallar el dominio asociado
Atributo Nombre del Dominio Coacutedigo Definicioacuten
EESector
Oficial 1
Es una institucioacuten donde su naturaleza de servicio puacuteblico cultural y su funcioacuten social le es inherente cumpliendo con las disposiciones legales y estatutarias que las rigen donde sus rentas se conservan y se aplican debidamente
Privado 2
Es una institucioacuten constituida como persona juriacutedica de utilidad comuacuten donde sus rentas se conservan y se aplican debidamente y que en todo lo esencial se cumple con la voluntad de sus fundadores
21 Buenas praacutecticas para la publicacioacuten de datos
7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos
Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para
acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que
conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como
cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o
software
En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos
publicados se proporcionen recursos o documentos adicionales que puedan ser consultados
yo descargados traveacutes de enlaces o links de otro sitio Web
Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los
procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los
documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad
entre otros
iquestQueacute logro
Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos
Que los usuarios comprendan mejor mis datos
Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios
iexclRecomendaciones
Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el
horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del
dato
No olvide vincular o registrar esta informacioacuten en el metadato
16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp
22 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos
Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318
Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57
Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30
Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217
Ejemplo 2
La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en
httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos
o Gestioacuten de los humedales
o Poliacutetica de Humedales del Distrito Capital
o Normatividad
o Planes de Manejo Ambiental
o Comiteacute distrital de humedales documentos de consulta normatividad
23 Buenas praacutecticas para la publicacioacuten de datos
8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza
La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten
juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado
Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para
satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas
y especificaciones establecidas
Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades
de estos sin embargo en este aparte citaremos los elementos principales que usted o su
entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad
Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de
los datos espaciales
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que los usuarios hablen bien de mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean maacutes compartidos
Que mis datos sean maacutes confiables
Recomendacioacuten 1
Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten
descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten
corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Suba 200 Tunjuelito 500
Ameacutericas 100
850
Tunjuelito 500
18 httpdleraeesid=6nVpk8P|6nXVL1Z
Campo duplicado
Campo inconsistente
Campo vaciacuteo
24 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 2
Identifique y transforme si es necesario los datos que hayan sido registrados en un formato
diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida
del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de
formatordquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Tunjuelito 5008 Tunjuelito 500
Fontiboacuten 40 Fontiboacuten 430
Tunjuelito 500 Tunjuelito 500
Recomendacioacuten 3
Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos
se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de
clasificacioacutenrdquo
Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad
Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10
Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20
Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40
Recomendacioacuten 4
Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos
correspondan a valores conocidos como verdaderos El elemento de calidad asociado se
denomina ldquoexactitud de atributos cuantitativosrdquo
Localidad Mes Temperatura Localidad Mes Temperatura
Chapinero Enero 7degC Chapinero Enero 7degC
Suba Agosto -15degC Suba Agosto 15degC
Tunjuelito Abril 60degC Tunjuelito Abril 16degC
Clasificacioacuten inconsistente
Formato inconsistente
Valor inconsistente
25 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 5
Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por
ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que
las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad
asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo
Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro
00 20580101 00 20180101
01 20180102 01 20180102
126 20510403 126 20180103
20 20180104 20 20180104
Recomendacioacuten 6
Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes
de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se
denomina ldquoconsistencia temporalrdquo
Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio
Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231
Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231
Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112
Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112
Recomendacioacuten 7
Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta
corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud
posicionalrdquo
Eventos Deportivos Lugar Eventos Deportivos Lugar
Evento 1 AK 30 25 90 Evento 1 AK 30 25 90
Evento 2 AC 63 215 20 Evento 2 Parque La Florida
Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar
Fecha
inconsistente
Fechas no secuenciales
Lugar inexistente
26 Buenas praacutecticas para la publicacioacuten de datos
9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten
El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de
alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una
institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las
variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a
cabo los traacutemites de una entidad etc
Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un
espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados
Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten
asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un
establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario
identificar la localizacioacuten del dato publicado
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean puedan compartir en maacutes plataformas
Que los usuarios puedan visualizar mis datos en un mapa
iexclRecomendaciones
Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o
lugares geograacuteficos
Ejemplo 1
Incluya direcciones que permitan localizar espacialmente sus datos
Programa Direccioacuten
Registro de atencioacuten a la ciudadaniacutea CL 138 108 16
Centro de autocuidado KR 18 D 77 A 11 SUR
Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46
Centro de autocuidado KR 18 D 73 A 33 SUR
19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico
27 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 2
Utilice coordenadas para indicar la ubicacioacuten de sus datos
EPS Coordenada X Coordenada Y
EPS Convida 9087496334 1051342164
Capital Salud EPS 986321006 954875808
EPS Famisanar 9742508812 8837031501
Aliansalud EPS 9716943356 9659706891
Salud Total EPS 9215624975 9625189518
Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro
de su metadato el Sistema de referencia empleado
MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686
MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116
MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458
Ejemplo 3
Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute
Usuario Vacunado Lugar de Vacunacioacuten
Usuario 1 BOSQUE IZQUIERDO
Usuario 2 LAGUNITAS URBANO
Usuario 3 LA CAPUCHINA
Usuario 4 SAN JOSE SUR
Usuario 5 VENECIA
28 Buenas praacutecticas para la publicacioacuten de datos
10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado
Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el
dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los
usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la
citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el
formato de este
En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero
de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de
su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la
informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado
y reconocido faacutecilmente entre los demaacutes datos
Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de
identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por
cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta
gestioacuten y reutilizacioacuten de sus datos
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean compartidos en maacutes plataformas
Que mis datos puedan vincularse a otros datos en el entorno Web
Que mis datos sean encontrados usados y citados inequiacutevocamente
Garantizar y monitorear la reutilizacioacuten de mis datos
Reducir del uso erroacuteneo de mis datos
iexclRecomendaciones
Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar
Utilice siempre el identificador asignado para publicar sus datos
29 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos
httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la
creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la
asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten
de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito
garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar
descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando
asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten
geograacutefica
Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems
publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace
referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades
territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el
planeamiento del suelo urbano de expansioacuten y ruralrdquo
30 Buenas praacutecticas para la publicacioacuten de datos
OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS
Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten
Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado
Nivel Baacutesico
En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)
Nivel Intermedio
Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)
Nivel Avanzado
Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)
31 Buenas praacutecticas para la publicacioacuten de datos
REFERENCIAS
Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best
Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp
Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices
for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp
Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington
Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec
Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI
Recommendation URL httpdublincoreorgdocumentsdcmi-terms
Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C
Recommendation URL httpswwww3orgTRvocab-dcat
ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de
2014 International Standard
ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers
noviembre de 2009 International Standard
ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013
International Standard
Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best
Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp
T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax
Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986
World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg
W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second
Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-
overview
W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado
el 12 de septiembre de 2018
13 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
A continuacioacuten se presentan algunos vocabularios internacionales que puede consultar y
apropiar para optimizar el intercambio de sus datos
Data Catalog Vocabulary (DCAT) httpswwww3orgTRvocab-dcatclass-catalog
FOAF Vocabulary Specification httpxmlnscomfoaf01
ISOTC 211 Geographic informationGeomatics Terminology
httpwwwisotc211orgTerminologyhtm
The RDF Data Cube Vocabulary httpswwww3orgTR2014REC-vocab-data-cube-20140116
ODRL Vocabulary amp Expression 22
httpswwww3orgTR2018REC-odrl-vocab-20180215
HTTP Vocabulary in RDF 10 httpswwww3orgTR2017NOTE-HTTP-in-RDF10-20170202
vCard Ontology - for describing People and Organizations
httpswwww3orgTRvcard-rdf
Ejemplo 2
En el contexto Nacional el Ministerio de Tecnologiacuteas de la Informacioacuten y las Comunicaciones ha
establecido el Lenguaje Comuacuten de Intercambio de como un instrumento de consulta que
contiene la definicioacuten de los elementos de datos conceptualizados por las entidades del
estado La consulta la puede realizar en httplenguajeminticgovco
14 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 3
La especificacioacuten vCard disponible en httpswwww3orgTRvcard-rdf promueve un
vocabulario especiacutefico para describir personas y organizaciones
Uno de los vocablos que describe esta especificacioacuten es la ldquodireccioacuten de entregardquo llamado
dentro del vocabulario como ADR y definido como ldquola direccioacuten del objeto representado en
partes estructuradasrdquo
Ahora bien este vocabulario especifica los componentes de la direccioacuten de entrega para el
objeto asiacute el nombre del paiacutes la localidad el coacutedigo postal la regioacuten y la direccioacuten dada por
viacuteas (calles y carreras en el caso colombiano) Esto quiere decir que cualquiera de los
componentes descritos puede usarse como direccioacuten de entrega vaacutelida ya que son equivalentes
entre siacute
Aunque en el vocabulario la direccioacuten de entrega se llame ADR el usuario de la informacioacuten
entenderaacute que un nombre de paiacutes o un coacutedigo postal pueden interpretarse como ADR
15 Buenas praacutecticas para la publicacioacuten de datos
4 Anonimizar los datos de caraacutecter personal informacioacuten estadiacutestica informacioacuten indirectamente identificable e informacioacuten sensible o confidencial
Anonimizar es el proceso que impide la identificacioacuten de las unidades de estudio que son fuente
para los registros individuales de un conjunto8 de datos o maacutes claro es la aplicacioacuten de teacutecnicas
que permitan expresar un dato relativo a personas eliminando la referencia a su identidad9
Baacutesicamente lo que se busca es reducir los riesgos en el uso y procesamiento de datos
personales evitar la extraccioacuten de registros que identifican a una persona reducir la
combinacioacuten de dos o maacutes registros en una o varias bases de datos para identificar a una
persona y minimizar la deduccioacuten de datos personales partir de uno o varios datos publicados
iquestQueacute informacioacuten debo prioritariamente anonimizar
Datos personales Informacioacuten numeacuterica alfabeacutetica graacutefica fotograacutefica acuacutestica o
cualquier otro tipo susceptible de recogida registro tratamiento y transmisioacuten
concerniente a personas fiacutesicas identificadas o identificables (tales como nombre
apellidos estado civil sexo edad domicilio identificacioacuten personal nuacutemero de
teleacutefono etc)10
Informacioacuten sensible Informacioacuten considerada como estrictamente confidencial
Informacioacuten y caracteriacutesticas referentes a la edad procedencia salud raza religioacuten
ideologiacutea afiliacioacuten finanzas etc se consideran de caraacutecter sensible y requieren de
una proteccioacuten especial11
iquestQueacute logro
Garantizar que mis datos publicados cuentan con medidas de proteccioacuten de datos
personales
Eliminar de manera efectiva el riesgo de re-identificacioacuten
Evitar que el procesamiento de mis datos tenga consecuencias negativas para alguna
persona
Disponer muchos maacutes datos sin invadir la informacioacuten personal
iexclRecomendaciones
Implemente actividades de proteccioacuten de la privacidad de los datos personales antes
de publicarlos
Elimine cualquier identificador directo de la persona (nombre documento de
identidad etc)
8 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 9 httpdleraeesid=2jjMiRi 10 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 11 Ibidem
16 Buenas praacutecticas para la publicacioacuten de datos
Reemplace los identificadores directos por coacutedigos de referencia pseudoacutenimos
(algoritmos AES12 o un hash cifrado HMAC13) coacutedigos arbitrarios o aleatorios
Si reemplazando el identificador directo auacuten es faacutecil identificar a la persona elimine el
dato
Clasifique yo categorice los datos
Redondee los datos numeacutericos hacia arriba o hacia abajo
Evaluacutee antes durante y despueacutes de publicados los datos si la anonimizacioacuten de sus
datos es suficiente y evaluacutee regularmente los riesgos existentes
Para maacutes informacioacuten consulte los Lineamientos para la Anonimizacioacuten de micro datos
Ejemplo 1
Antes de publicar sus datos retire el identificador directo de la persona En este caso
reemplace en nuacutemero de documento que identifica al usuario y reemplaacutecelo por un
consecutivo
Usuario Beneficio Usuario Beneficio
80123456 Subsidio de vivienda Usuario 1 Subsidio de vivienda
51123456 Subsidio de alimentacioacuten Usuario 2 Subsidio de alimentacioacuten
19123456 Subsidio al adulto mayor Usuario 3 Subsidio al adulto mayor
53123456 Subsidio de desempleo Usuario 4 Subsidio de desempleo
Ejemplo 2
Clasifique o categorice sus datos En este ejemplo asigne rangos a la edad de manera tal que el
titular del registro no sea identificable por este dato
Usuario Edad Usuario Rango de edad
Usuario 1 11 antildeos Usuario 1 Entre 10 y 15 antildeos
Usuario 2 22 antildeos Usuario 2 Entre 20 y 25 antildeos
Usuario 3 36 antildeos Usuario 3 Entre 35 y 40 antildeos
Usuario 4 63 antildeos Usuario 4 Entre 60 y 65 antildeos
12 Advanced Encryption Standard puede consultar como ha sido implementado este algoritmo en httpsrevistasudistritaleducoojsindexphpTecnuraarticleview72368892 13 Hash-based Message Authentication Code puede consultar como se crea este cifrado en httpsdocsoraclecomcdE19253-01819-7804wanboottasks2-51indexhtml
17 Buenas praacutecticas para la publicacioacuten de datos
5 Publicar los datos en formatos estaacutendar reutilizables y legibles por aplicaciones informaacuteticas
Un formato puede ser definido como la estructura de un disco dividido en campos y pistas
seguacuten un determinado sistema operativo lo que permite almacenar en eacutel informacioacuten14
baacutesicamente es la forma en que se codifican los datos en un archivo informaacutetico
Actualmente conocemos formatos comunes de almacenamiento como el doc una extensioacuten
de Word que almacena texto y cuyo propietario es la compantildeiacutea Microsoft Pero iquestqueacute pasa si un
usuario quiere abrir un documento doc en un procesador de texto diferente a Word
difiacutecilmente va a poder conocer el contenido de dicho documento sin tener esta licencia
Lo que queremos lograr con la implementacioacuten de esta praacutectica es que todos los usuarios que
encuentren mis datos puedan accederlos sin necesidad de contar con un software o aplicacioacuten
informaacutetica especiacutefica
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos puedan ser extraiacutedos transformados y procesados por aplicaciones
informaacuteticas
Que mis datos puedan ser compartidos e intercambiados entre sistemas
Disminuir los costos y los tiempos en el uso y la transformacioacuten de mis datos
iexclRecomendaciones
Prefiera publicar su conjunto de datos en formatos abiertos o no propietario ya que
estos facilitan el uso re-uso y distribucioacuten de estos Se busca que un mayor nuacutemero de
aplicaciones informaacuteticas pueda extraer leer y transformar los datos generando mayor
uso y re-uso por los usuarios
Disponga sus datos en muacuteltiples formatos con el fin de incrementar el acceso a los
mismos Se busca que el mayor nuacutemero de usuarios pueda utilizar los datos sin tener
que transformarlos primero en su formato preferido
Utilice Web Services para mejorar el intercambio e interoperabilidad de los datos
publicados
14 httpdleraeessrvsearchm=30ampw=formato
18 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
A continuacioacuten encontraraacute extensiones de formato propietario y no propietario prefiera para
la publicacioacuten de sus datos las extensiones de la derecha
FORMATO PROPIETARIO FORMATO NO PROPIETARIO
DOC GDB TXT ASCII Grid KML RDF
XLS DWG CSV GeoJSON DXF XML
PPT SHP JSON GML ODF
Ejemplo 2
Si no fue posible utilizar una extensioacuten de formato no propietario publique sus datos en una
variedad de formatos que le permita al usuario acceder a los datos desde diferentes
aplicaciones informaacuteticas
Ejemplo 3
Para publicar sus datos conozca diferentes tipos de Web Services que viajan en la red utilizando extensiones XML
SOAP httpswwww3orgTRsoap
REST httprestelksteinorg
WMS httpwwwopengeospatialorgstandardswms
WFS httpwwwopengeospatialorgstandardswfs
WCS httpwwwopengeospatialorgstandardswcs
19 Buenas praacutecticas para la publicacioacuten de datos
6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos publicados
Un diccionario estaacute definido como un repertorio en forma de libro o en soporte electroacutenico en el
que se recogen seguacuten un orden determinado las palabras o expresiones de una o maacutes lenguas
o de una materia concreta acompantildeadas de su definicioacuten equivalencia o explicacioacuten15
especiacuteficamente en un diccionario de datos se encuentran los conceptos de los datos y sus
propiedades (atributos dominios asociaciones y operaciones) acompantildeados de una definicioacuten
en donde se identifica el propoacutesito alcance y campo de aplicacioacuten del dato publicado
Lograr que los usuarios de mis datos entiendan la informacioacuten que estaacute publicada le permitiraacute
decidir si satisfacen o no su necesidad y le facilitaraacute la decisioacuten para explotar lo datos
Para maacutes informacioacuten consulte el Instructivo Diccionario de Datos
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que se eviten ambiguumledades en la interpretacioacuten de mis datos
Que mis datos publicados esteacuten unificados y consistentes
Que los usuarios comprendan mejor y dispongan de claridad sobre los conceptos de
mis datos
iexclRecomendaciones
Publique como miacutenimo un diccionario de datos que contenga la caracterizacioacuten del
conjunto de datos producidos por su entidad
Cree el diccionario de datos teniendo en cuenta como miacutenimo la siguiente informacioacuten
Nombre del atributo Nombre que identifica de manera clara un atributo
Definicioacuten Descripcioacuten del atributo
Tipo de dato Tipo de valor del atributo
Unidad de medida Expresa la unidad de medida del atributo
Dominio Determina si el atributo tiene asociado un dominio
15 httpdleraeesw=diccionario
20 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
Para el conjunto de datos ldquoEstablecimientos Educativos en Bogotaacuterdquo publicariacuteamos un
diccionario de datos similar al siguiente
Nombre del atributo Definicioacuten Tipo de dato
Unidad de Medida
Dominio
Coacutedigo del establecimiento
Coacutedigo DANE asignado al Institucioacuten Educativa Decimal
Nombre del establecimiento
Nombre de la Institucioacuten Educativa Cadena de Caracteres
Aacuterea construida del establecimiento
Aacuterea construida de la Institucioacuten Educativa Decimal Metros
cuadrados
Sector
Clasificacioacuten asignada seguacuten la naturaleza juriacutedica la cual define las principales caracteriacutesticas que desde lo juriacutedico - administrativo y tiene que ver con el origen de su creacioacuten
Entero
EESector
No podriacuteamos olvidar detallar el dominio asociado
Atributo Nombre del Dominio Coacutedigo Definicioacuten
EESector
Oficial 1
Es una institucioacuten donde su naturaleza de servicio puacuteblico cultural y su funcioacuten social le es inherente cumpliendo con las disposiciones legales y estatutarias que las rigen donde sus rentas se conservan y se aplican debidamente
Privado 2
Es una institucioacuten constituida como persona juriacutedica de utilidad comuacuten donde sus rentas se conservan y se aplican debidamente y que en todo lo esencial se cumple con la voluntad de sus fundadores
21 Buenas praacutecticas para la publicacioacuten de datos
7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos
Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para
acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que
conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como
cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o
software
En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos
publicados se proporcionen recursos o documentos adicionales que puedan ser consultados
yo descargados traveacutes de enlaces o links de otro sitio Web
Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los
procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los
documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad
entre otros
iquestQueacute logro
Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos
Que los usuarios comprendan mejor mis datos
Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios
iexclRecomendaciones
Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el
horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del
dato
No olvide vincular o registrar esta informacioacuten en el metadato
16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp
22 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos
Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318
Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57
Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30
Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217
Ejemplo 2
La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en
httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos
o Gestioacuten de los humedales
o Poliacutetica de Humedales del Distrito Capital
o Normatividad
o Planes de Manejo Ambiental
o Comiteacute distrital de humedales documentos de consulta normatividad
23 Buenas praacutecticas para la publicacioacuten de datos
8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza
La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten
juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado
Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para
satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas
y especificaciones establecidas
Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades
de estos sin embargo en este aparte citaremos los elementos principales que usted o su
entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad
Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de
los datos espaciales
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que los usuarios hablen bien de mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean maacutes compartidos
Que mis datos sean maacutes confiables
Recomendacioacuten 1
Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten
descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten
corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Suba 200 Tunjuelito 500
Ameacutericas 100
850
Tunjuelito 500
18 httpdleraeesid=6nVpk8P|6nXVL1Z
Campo duplicado
Campo inconsistente
Campo vaciacuteo
24 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 2
Identifique y transforme si es necesario los datos que hayan sido registrados en un formato
diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida
del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de
formatordquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Tunjuelito 5008 Tunjuelito 500
Fontiboacuten 40 Fontiboacuten 430
Tunjuelito 500 Tunjuelito 500
Recomendacioacuten 3
Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos
se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de
clasificacioacutenrdquo
Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad
Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10
Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20
Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40
Recomendacioacuten 4
Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos
correspondan a valores conocidos como verdaderos El elemento de calidad asociado se
denomina ldquoexactitud de atributos cuantitativosrdquo
Localidad Mes Temperatura Localidad Mes Temperatura
Chapinero Enero 7degC Chapinero Enero 7degC
Suba Agosto -15degC Suba Agosto 15degC
Tunjuelito Abril 60degC Tunjuelito Abril 16degC
Clasificacioacuten inconsistente
Formato inconsistente
Valor inconsistente
25 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 5
Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por
ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que
las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad
asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo
Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro
00 20580101 00 20180101
01 20180102 01 20180102
126 20510403 126 20180103
20 20180104 20 20180104
Recomendacioacuten 6
Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes
de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se
denomina ldquoconsistencia temporalrdquo
Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio
Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231
Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231
Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112
Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112
Recomendacioacuten 7
Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta
corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud
posicionalrdquo
Eventos Deportivos Lugar Eventos Deportivos Lugar
Evento 1 AK 30 25 90 Evento 1 AK 30 25 90
Evento 2 AC 63 215 20 Evento 2 Parque La Florida
Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar
Fecha
inconsistente
Fechas no secuenciales
Lugar inexistente
26 Buenas praacutecticas para la publicacioacuten de datos
9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten
El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de
alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una
institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las
variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a
cabo los traacutemites de una entidad etc
Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un
espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados
Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten
asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un
establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario
identificar la localizacioacuten del dato publicado
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean puedan compartir en maacutes plataformas
Que los usuarios puedan visualizar mis datos en un mapa
iexclRecomendaciones
Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o
lugares geograacuteficos
Ejemplo 1
Incluya direcciones que permitan localizar espacialmente sus datos
Programa Direccioacuten
Registro de atencioacuten a la ciudadaniacutea CL 138 108 16
Centro de autocuidado KR 18 D 77 A 11 SUR
Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46
Centro de autocuidado KR 18 D 73 A 33 SUR
19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico
27 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 2
Utilice coordenadas para indicar la ubicacioacuten de sus datos
EPS Coordenada X Coordenada Y
EPS Convida 9087496334 1051342164
Capital Salud EPS 986321006 954875808
EPS Famisanar 9742508812 8837031501
Aliansalud EPS 9716943356 9659706891
Salud Total EPS 9215624975 9625189518
Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro
de su metadato el Sistema de referencia empleado
MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686
MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116
MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458
Ejemplo 3
Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute
Usuario Vacunado Lugar de Vacunacioacuten
Usuario 1 BOSQUE IZQUIERDO
Usuario 2 LAGUNITAS URBANO
Usuario 3 LA CAPUCHINA
Usuario 4 SAN JOSE SUR
Usuario 5 VENECIA
28 Buenas praacutecticas para la publicacioacuten de datos
10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado
Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el
dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los
usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la
citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el
formato de este
En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero
de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de
su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la
informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado
y reconocido faacutecilmente entre los demaacutes datos
Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de
identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por
cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta
gestioacuten y reutilizacioacuten de sus datos
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean compartidos en maacutes plataformas
Que mis datos puedan vincularse a otros datos en el entorno Web
Que mis datos sean encontrados usados y citados inequiacutevocamente
Garantizar y monitorear la reutilizacioacuten de mis datos
Reducir del uso erroacuteneo de mis datos
iexclRecomendaciones
Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar
Utilice siempre el identificador asignado para publicar sus datos
29 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos
httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la
creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la
asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten
de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito
garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar
descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando
asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten
geograacutefica
Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems
publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace
referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades
territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el
planeamiento del suelo urbano de expansioacuten y ruralrdquo
30 Buenas praacutecticas para la publicacioacuten de datos
OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS
Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten
Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado
Nivel Baacutesico
En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)
Nivel Intermedio
Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)
Nivel Avanzado
Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)
31 Buenas praacutecticas para la publicacioacuten de datos
REFERENCIAS
Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best
Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp
Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices
for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp
Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington
Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec
Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI
Recommendation URL httpdublincoreorgdocumentsdcmi-terms
Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C
Recommendation URL httpswwww3orgTRvocab-dcat
ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de
2014 International Standard
ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers
noviembre de 2009 International Standard
ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013
International Standard
Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best
Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp
T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax
Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986
World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg
W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second
Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-
overview
W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado
el 12 de septiembre de 2018
14 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 3
La especificacioacuten vCard disponible en httpswwww3orgTRvcard-rdf promueve un
vocabulario especiacutefico para describir personas y organizaciones
Uno de los vocablos que describe esta especificacioacuten es la ldquodireccioacuten de entregardquo llamado
dentro del vocabulario como ADR y definido como ldquola direccioacuten del objeto representado en
partes estructuradasrdquo
Ahora bien este vocabulario especifica los componentes de la direccioacuten de entrega para el
objeto asiacute el nombre del paiacutes la localidad el coacutedigo postal la regioacuten y la direccioacuten dada por
viacuteas (calles y carreras en el caso colombiano) Esto quiere decir que cualquiera de los
componentes descritos puede usarse como direccioacuten de entrega vaacutelida ya que son equivalentes
entre siacute
Aunque en el vocabulario la direccioacuten de entrega se llame ADR el usuario de la informacioacuten
entenderaacute que un nombre de paiacutes o un coacutedigo postal pueden interpretarse como ADR
15 Buenas praacutecticas para la publicacioacuten de datos
4 Anonimizar los datos de caraacutecter personal informacioacuten estadiacutestica informacioacuten indirectamente identificable e informacioacuten sensible o confidencial
Anonimizar es el proceso que impide la identificacioacuten de las unidades de estudio que son fuente
para los registros individuales de un conjunto8 de datos o maacutes claro es la aplicacioacuten de teacutecnicas
que permitan expresar un dato relativo a personas eliminando la referencia a su identidad9
Baacutesicamente lo que se busca es reducir los riesgos en el uso y procesamiento de datos
personales evitar la extraccioacuten de registros que identifican a una persona reducir la
combinacioacuten de dos o maacutes registros en una o varias bases de datos para identificar a una
persona y minimizar la deduccioacuten de datos personales partir de uno o varios datos publicados
iquestQueacute informacioacuten debo prioritariamente anonimizar
Datos personales Informacioacuten numeacuterica alfabeacutetica graacutefica fotograacutefica acuacutestica o
cualquier otro tipo susceptible de recogida registro tratamiento y transmisioacuten
concerniente a personas fiacutesicas identificadas o identificables (tales como nombre
apellidos estado civil sexo edad domicilio identificacioacuten personal nuacutemero de
teleacutefono etc)10
Informacioacuten sensible Informacioacuten considerada como estrictamente confidencial
Informacioacuten y caracteriacutesticas referentes a la edad procedencia salud raza religioacuten
ideologiacutea afiliacioacuten finanzas etc se consideran de caraacutecter sensible y requieren de
una proteccioacuten especial11
iquestQueacute logro
Garantizar que mis datos publicados cuentan con medidas de proteccioacuten de datos
personales
Eliminar de manera efectiva el riesgo de re-identificacioacuten
Evitar que el procesamiento de mis datos tenga consecuencias negativas para alguna
persona
Disponer muchos maacutes datos sin invadir la informacioacuten personal
iexclRecomendaciones
Implemente actividades de proteccioacuten de la privacidad de los datos personales antes
de publicarlos
Elimine cualquier identificador directo de la persona (nombre documento de
identidad etc)
8 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 9 httpdleraeesid=2jjMiRi 10 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 11 Ibidem
16 Buenas praacutecticas para la publicacioacuten de datos
Reemplace los identificadores directos por coacutedigos de referencia pseudoacutenimos
(algoritmos AES12 o un hash cifrado HMAC13) coacutedigos arbitrarios o aleatorios
Si reemplazando el identificador directo auacuten es faacutecil identificar a la persona elimine el
dato
Clasifique yo categorice los datos
Redondee los datos numeacutericos hacia arriba o hacia abajo
Evaluacutee antes durante y despueacutes de publicados los datos si la anonimizacioacuten de sus
datos es suficiente y evaluacutee regularmente los riesgos existentes
Para maacutes informacioacuten consulte los Lineamientos para la Anonimizacioacuten de micro datos
Ejemplo 1
Antes de publicar sus datos retire el identificador directo de la persona En este caso
reemplace en nuacutemero de documento que identifica al usuario y reemplaacutecelo por un
consecutivo
Usuario Beneficio Usuario Beneficio
80123456 Subsidio de vivienda Usuario 1 Subsidio de vivienda
51123456 Subsidio de alimentacioacuten Usuario 2 Subsidio de alimentacioacuten
19123456 Subsidio al adulto mayor Usuario 3 Subsidio al adulto mayor
53123456 Subsidio de desempleo Usuario 4 Subsidio de desempleo
Ejemplo 2
Clasifique o categorice sus datos En este ejemplo asigne rangos a la edad de manera tal que el
titular del registro no sea identificable por este dato
Usuario Edad Usuario Rango de edad
Usuario 1 11 antildeos Usuario 1 Entre 10 y 15 antildeos
Usuario 2 22 antildeos Usuario 2 Entre 20 y 25 antildeos
Usuario 3 36 antildeos Usuario 3 Entre 35 y 40 antildeos
Usuario 4 63 antildeos Usuario 4 Entre 60 y 65 antildeos
12 Advanced Encryption Standard puede consultar como ha sido implementado este algoritmo en httpsrevistasudistritaleducoojsindexphpTecnuraarticleview72368892 13 Hash-based Message Authentication Code puede consultar como se crea este cifrado en httpsdocsoraclecomcdE19253-01819-7804wanboottasks2-51indexhtml
17 Buenas praacutecticas para la publicacioacuten de datos
5 Publicar los datos en formatos estaacutendar reutilizables y legibles por aplicaciones informaacuteticas
Un formato puede ser definido como la estructura de un disco dividido en campos y pistas
seguacuten un determinado sistema operativo lo que permite almacenar en eacutel informacioacuten14
baacutesicamente es la forma en que se codifican los datos en un archivo informaacutetico
Actualmente conocemos formatos comunes de almacenamiento como el doc una extensioacuten
de Word que almacena texto y cuyo propietario es la compantildeiacutea Microsoft Pero iquestqueacute pasa si un
usuario quiere abrir un documento doc en un procesador de texto diferente a Word
difiacutecilmente va a poder conocer el contenido de dicho documento sin tener esta licencia
Lo que queremos lograr con la implementacioacuten de esta praacutectica es que todos los usuarios que
encuentren mis datos puedan accederlos sin necesidad de contar con un software o aplicacioacuten
informaacutetica especiacutefica
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos puedan ser extraiacutedos transformados y procesados por aplicaciones
informaacuteticas
Que mis datos puedan ser compartidos e intercambiados entre sistemas
Disminuir los costos y los tiempos en el uso y la transformacioacuten de mis datos
iexclRecomendaciones
Prefiera publicar su conjunto de datos en formatos abiertos o no propietario ya que
estos facilitan el uso re-uso y distribucioacuten de estos Se busca que un mayor nuacutemero de
aplicaciones informaacuteticas pueda extraer leer y transformar los datos generando mayor
uso y re-uso por los usuarios
Disponga sus datos en muacuteltiples formatos con el fin de incrementar el acceso a los
mismos Se busca que el mayor nuacutemero de usuarios pueda utilizar los datos sin tener
que transformarlos primero en su formato preferido
Utilice Web Services para mejorar el intercambio e interoperabilidad de los datos
publicados
14 httpdleraeessrvsearchm=30ampw=formato
18 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
A continuacioacuten encontraraacute extensiones de formato propietario y no propietario prefiera para
la publicacioacuten de sus datos las extensiones de la derecha
FORMATO PROPIETARIO FORMATO NO PROPIETARIO
DOC GDB TXT ASCII Grid KML RDF
XLS DWG CSV GeoJSON DXF XML
PPT SHP JSON GML ODF
Ejemplo 2
Si no fue posible utilizar una extensioacuten de formato no propietario publique sus datos en una
variedad de formatos que le permita al usuario acceder a los datos desde diferentes
aplicaciones informaacuteticas
Ejemplo 3
Para publicar sus datos conozca diferentes tipos de Web Services que viajan en la red utilizando extensiones XML
SOAP httpswwww3orgTRsoap
REST httprestelksteinorg
WMS httpwwwopengeospatialorgstandardswms
WFS httpwwwopengeospatialorgstandardswfs
WCS httpwwwopengeospatialorgstandardswcs
19 Buenas praacutecticas para la publicacioacuten de datos
6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos publicados
Un diccionario estaacute definido como un repertorio en forma de libro o en soporte electroacutenico en el
que se recogen seguacuten un orden determinado las palabras o expresiones de una o maacutes lenguas
o de una materia concreta acompantildeadas de su definicioacuten equivalencia o explicacioacuten15
especiacuteficamente en un diccionario de datos se encuentran los conceptos de los datos y sus
propiedades (atributos dominios asociaciones y operaciones) acompantildeados de una definicioacuten
en donde se identifica el propoacutesito alcance y campo de aplicacioacuten del dato publicado
Lograr que los usuarios de mis datos entiendan la informacioacuten que estaacute publicada le permitiraacute
decidir si satisfacen o no su necesidad y le facilitaraacute la decisioacuten para explotar lo datos
Para maacutes informacioacuten consulte el Instructivo Diccionario de Datos
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que se eviten ambiguumledades en la interpretacioacuten de mis datos
Que mis datos publicados esteacuten unificados y consistentes
Que los usuarios comprendan mejor y dispongan de claridad sobre los conceptos de
mis datos
iexclRecomendaciones
Publique como miacutenimo un diccionario de datos que contenga la caracterizacioacuten del
conjunto de datos producidos por su entidad
Cree el diccionario de datos teniendo en cuenta como miacutenimo la siguiente informacioacuten
Nombre del atributo Nombre que identifica de manera clara un atributo
Definicioacuten Descripcioacuten del atributo
Tipo de dato Tipo de valor del atributo
Unidad de medida Expresa la unidad de medida del atributo
Dominio Determina si el atributo tiene asociado un dominio
15 httpdleraeesw=diccionario
20 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
Para el conjunto de datos ldquoEstablecimientos Educativos en Bogotaacuterdquo publicariacuteamos un
diccionario de datos similar al siguiente
Nombre del atributo Definicioacuten Tipo de dato
Unidad de Medida
Dominio
Coacutedigo del establecimiento
Coacutedigo DANE asignado al Institucioacuten Educativa Decimal
Nombre del establecimiento
Nombre de la Institucioacuten Educativa Cadena de Caracteres
Aacuterea construida del establecimiento
Aacuterea construida de la Institucioacuten Educativa Decimal Metros
cuadrados
Sector
Clasificacioacuten asignada seguacuten la naturaleza juriacutedica la cual define las principales caracteriacutesticas que desde lo juriacutedico - administrativo y tiene que ver con el origen de su creacioacuten
Entero
EESector
No podriacuteamos olvidar detallar el dominio asociado
Atributo Nombre del Dominio Coacutedigo Definicioacuten
EESector
Oficial 1
Es una institucioacuten donde su naturaleza de servicio puacuteblico cultural y su funcioacuten social le es inherente cumpliendo con las disposiciones legales y estatutarias que las rigen donde sus rentas se conservan y se aplican debidamente
Privado 2
Es una institucioacuten constituida como persona juriacutedica de utilidad comuacuten donde sus rentas se conservan y se aplican debidamente y que en todo lo esencial se cumple con la voluntad de sus fundadores
21 Buenas praacutecticas para la publicacioacuten de datos
7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos
Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para
acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que
conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como
cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o
software
En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos
publicados se proporcionen recursos o documentos adicionales que puedan ser consultados
yo descargados traveacutes de enlaces o links de otro sitio Web
Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los
procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los
documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad
entre otros
iquestQueacute logro
Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos
Que los usuarios comprendan mejor mis datos
Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios
iexclRecomendaciones
Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el
horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del
dato
No olvide vincular o registrar esta informacioacuten en el metadato
16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp
22 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos
Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318
Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57
Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30
Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217
Ejemplo 2
La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en
httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos
o Gestioacuten de los humedales
o Poliacutetica de Humedales del Distrito Capital
o Normatividad
o Planes de Manejo Ambiental
o Comiteacute distrital de humedales documentos de consulta normatividad
23 Buenas praacutecticas para la publicacioacuten de datos
8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza
La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten
juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado
Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para
satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas
y especificaciones establecidas
Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades
de estos sin embargo en este aparte citaremos los elementos principales que usted o su
entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad
Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de
los datos espaciales
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que los usuarios hablen bien de mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean maacutes compartidos
Que mis datos sean maacutes confiables
Recomendacioacuten 1
Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten
descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten
corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Suba 200 Tunjuelito 500
Ameacutericas 100
850
Tunjuelito 500
18 httpdleraeesid=6nVpk8P|6nXVL1Z
Campo duplicado
Campo inconsistente
Campo vaciacuteo
24 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 2
Identifique y transforme si es necesario los datos que hayan sido registrados en un formato
diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida
del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de
formatordquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Tunjuelito 5008 Tunjuelito 500
Fontiboacuten 40 Fontiboacuten 430
Tunjuelito 500 Tunjuelito 500
Recomendacioacuten 3
Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos
se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de
clasificacioacutenrdquo
Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad
Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10
Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20
Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40
Recomendacioacuten 4
Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos
correspondan a valores conocidos como verdaderos El elemento de calidad asociado se
denomina ldquoexactitud de atributos cuantitativosrdquo
Localidad Mes Temperatura Localidad Mes Temperatura
Chapinero Enero 7degC Chapinero Enero 7degC
Suba Agosto -15degC Suba Agosto 15degC
Tunjuelito Abril 60degC Tunjuelito Abril 16degC
Clasificacioacuten inconsistente
Formato inconsistente
Valor inconsistente
25 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 5
Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por
ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que
las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad
asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo
Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro
00 20580101 00 20180101
01 20180102 01 20180102
126 20510403 126 20180103
20 20180104 20 20180104
Recomendacioacuten 6
Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes
de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se
denomina ldquoconsistencia temporalrdquo
Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio
Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231
Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231
Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112
Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112
Recomendacioacuten 7
Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta
corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud
posicionalrdquo
Eventos Deportivos Lugar Eventos Deportivos Lugar
Evento 1 AK 30 25 90 Evento 1 AK 30 25 90
Evento 2 AC 63 215 20 Evento 2 Parque La Florida
Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar
Fecha
inconsistente
Fechas no secuenciales
Lugar inexistente
26 Buenas praacutecticas para la publicacioacuten de datos
9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten
El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de
alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una
institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las
variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a
cabo los traacutemites de una entidad etc
Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un
espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados
Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten
asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un
establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario
identificar la localizacioacuten del dato publicado
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean puedan compartir en maacutes plataformas
Que los usuarios puedan visualizar mis datos en un mapa
iexclRecomendaciones
Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o
lugares geograacuteficos
Ejemplo 1
Incluya direcciones que permitan localizar espacialmente sus datos
Programa Direccioacuten
Registro de atencioacuten a la ciudadaniacutea CL 138 108 16
Centro de autocuidado KR 18 D 77 A 11 SUR
Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46
Centro de autocuidado KR 18 D 73 A 33 SUR
19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico
27 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 2
Utilice coordenadas para indicar la ubicacioacuten de sus datos
EPS Coordenada X Coordenada Y
EPS Convida 9087496334 1051342164
Capital Salud EPS 986321006 954875808
EPS Famisanar 9742508812 8837031501
Aliansalud EPS 9716943356 9659706891
Salud Total EPS 9215624975 9625189518
Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro
de su metadato el Sistema de referencia empleado
MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686
MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116
MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458
Ejemplo 3
Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute
Usuario Vacunado Lugar de Vacunacioacuten
Usuario 1 BOSQUE IZQUIERDO
Usuario 2 LAGUNITAS URBANO
Usuario 3 LA CAPUCHINA
Usuario 4 SAN JOSE SUR
Usuario 5 VENECIA
28 Buenas praacutecticas para la publicacioacuten de datos
10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado
Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el
dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los
usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la
citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el
formato de este
En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero
de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de
su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la
informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado
y reconocido faacutecilmente entre los demaacutes datos
Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de
identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por
cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta
gestioacuten y reutilizacioacuten de sus datos
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean compartidos en maacutes plataformas
Que mis datos puedan vincularse a otros datos en el entorno Web
Que mis datos sean encontrados usados y citados inequiacutevocamente
Garantizar y monitorear la reutilizacioacuten de mis datos
Reducir del uso erroacuteneo de mis datos
iexclRecomendaciones
Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar
Utilice siempre el identificador asignado para publicar sus datos
29 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos
httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la
creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la
asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten
de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito
garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar
descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando
asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten
geograacutefica
Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems
publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace
referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades
territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el
planeamiento del suelo urbano de expansioacuten y ruralrdquo
30 Buenas praacutecticas para la publicacioacuten de datos
OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS
Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten
Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado
Nivel Baacutesico
En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)
Nivel Intermedio
Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)
Nivel Avanzado
Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)
31 Buenas praacutecticas para la publicacioacuten de datos
REFERENCIAS
Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best
Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp
Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices
for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp
Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington
Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec
Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI
Recommendation URL httpdublincoreorgdocumentsdcmi-terms
Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C
Recommendation URL httpswwww3orgTRvocab-dcat
ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de
2014 International Standard
ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers
noviembre de 2009 International Standard
ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013
International Standard
Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best
Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp
T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax
Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986
World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg
W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second
Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-
overview
W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado
el 12 de septiembre de 2018
15 Buenas praacutecticas para la publicacioacuten de datos
4 Anonimizar los datos de caraacutecter personal informacioacuten estadiacutestica informacioacuten indirectamente identificable e informacioacuten sensible o confidencial
Anonimizar es el proceso que impide la identificacioacuten de las unidades de estudio que son fuente
para los registros individuales de un conjunto8 de datos o maacutes claro es la aplicacioacuten de teacutecnicas
que permitan expresar un dato relativo a personas eliminando la referencia a su identidad9
Baacutesicamente lo que se busca es reducir los riesgos en el uso y procesamiento de datos
personales evitar la extraccioacuten de registros que identifican a una persona reducir la
combinacioacuten de dos o maacutes registros en una o varias bases de datos para identificar a una
persona y minimizar la deduccioacuten de datos personales partir de uno o varios datos publicados
iquestQueacute informacioacuten debo prioritariamente anonimizar
Datos personales Informacioacuten numeacuterica alfabeacutetica graacutefica fotograacutefica acuacutestica o
cualquier otro tipo susceptible de recogida registro tratamiento y transmisioacuten
concerniente a personas fiacutesicas identificadas o identificables (tales como nombre
apellidos estado civil sexo edad domicilio identificacioacuten personal nuacutemero de
teleacutefono etc)10
Informacioacuten sensible Informacioacuten considerada como estrictamente confidencial
Informacioacuten y caracteriacutesticas referentes a la edad procedencia salud raza religioacuten
ideologiacutea afiliacioacuten finanzas etc se consideran de caraacutecter sensible y requieren de
una proteccioacuten especial11
iquestQueacute logro
Garantizar que mis datos publicados cuentan con medidas de proteccioacuten de datos
personales
Eliminar de manera efectiva el riesgo de re-identificacioacuten
Evitar que el procesamiento de mis datos tenga consecuencias negativas para alguna
persona
Disponer muchos maacutes datos sin invadir la informacioacuten personal
iexclRecomendaciones
Implemente actividades de proteccioacuten de la privacidad de los datos personales antes
de publicarlos
Elimine cualquier identificador directo de la persona (nombre documento de
identidad etc)
8 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 9 httpdleraeesid=2jjMiRi 10 httpswwwdanegovcofilessenlineamientosDSO_020_LIN_08pdf 11 Ibidem
16 Buenas praacutecticas para la publicacioacuten de datos
Reemplace los identificadores directos por coacutedigos de referencia pseudoacutenimos
(algoritmos AES12 o un hash cifrado HMAC13) coacutedigos arbitrarios o aleatorios
Si reemplazando el identificador directo auacuten es faacutecil identificar a la persona elimine el
dato
Clasifique yo categorice los datos
Redondee los datos numeacutericos hacia arriba o hacia abajo
Evaluacutee antes durante y despueacutes de publicados los datos si la anonimizacioacuten de sus
datos es suficiente y evaluacutee regularmente los riesgos existentes
Para maacutes informacioacuten consulte los Lineamientos para la Anonimizacioacuten de micro datos
Ejemplo 1
Antes de publicar sus datos retire el identificador directo de la persona En este caso
reemplace en nuacutemero de documento que identifica al usuario y reemplaacutecelo por un
consecutivo
Usuario Beneficio Usuario Beneficio
80123456 Subsidio de vivienda Usuario 1 Subsidio de vivienda
51123456 Subsidio de alimentacioacuten Usuario 2 Subsidio de alimentacioacuten
19123456 Subsidio al adulto mayor Usuario 3 Subsidio al adulto mayor
53123456 Subsidio de desempleo Usuario 4 Subsidio de desempleo
Ejemplo 2
Clasifique o categorice sus datos En este ejemplo asigne rangos a la edad de manera tal que el
titular del registro no sea identificable por este dato
Usuario Edad Usuario Rango de edad
Usuario 1 11 antildeos Usuario 1 Entre 10 y 15 antildeos
Usuario 2 22 antildeos Usuario 2 Entre 20 y 25 antildeos
Usuario 3 36 antildeos Usuario 3 Entre 35 y 40 antildeos
Usuario 4 63 antildeos Usuario 4 Entre 60 y 65 antildeos
12 Advanced Encryption Standard puede consultar como ha sido implementado este algoritmo en httpsrevistasudistritaleducoojsindexphpTecnuraarticleview72368892 13 Hash-based Message Authentication Code puede consultar como se crea este cifrado en httpsdocsoraclecomcdE19253-01819-7804wanboottasks2-51indexhtml
17 Buenas praacutecticas para la publicacioacuten de datos
5 Publicar los datos en formatos estaacutendar reutilizables y legibles por aplicaciones informaacuteticas
Un formato puede ser definido como la estructura de un disco dividido en campos y pistas
seguacuten un determinado sistema operativo lo que permite almacenar en eacutel informacioacuten14
baacutesicamente es la forma en que se codifican los datos en un archivo informaacutetico
Actualmente conocemos formatos comunes de almacenamiento como el doc una extensioacuten
de Word que almacena texto y cuyo propietario es la compantildeiacutea Microsoft Pero iquestqueacute pasa si un
usuario quiere abrir un documento doc en un procesador de texto diferente a Word
difiacutecilmente va a poder conocer el contenido de dicho documento sin tener esta licencia
Lo que queremos lograr con la implementacioacuten de esta praacutectica es que todos los usuarios que
encuentren mis datos puedan accederlos sin necesidad de contar con un software o aplicacioacuten
informaacutetica especiacutefica
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos puedan ser extraiacutedos transformados y procesados por aplicaciones
informaacuteticas
Que mis datos puedan ser compartidos e intercambiados entre sistemas
Disminuir los costos y los tiempos en el uso y la transformacioacuten de mis datos
iexclRecomendaciones
Prefiera publicar su conjunto de datos en formatos abiertos o no propietario ya que
estos facilitan el uso re-uso y distribucioacuten de estos Se busca que un mayor nuacutemero de
aplicaciones informaacuteticas pueda extraer leer y transformar los datos generando mayor
uso y re-uso por los usuarios
Disponga sus datos en muacuteltiples formatos con el fin de incrementar el acceso a los
mismos Se busca que el mayor nuacutemero de usuarios pueda utilizar los datos sin tener
que transformarlos primero en su formato preferido
Utilice Web Services para mejorar el intercambio e interoperabilidad de los datos
publicados
14 httpdleraeessrvsearchm=30ampw=formato
18 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
A continuacioacuten encontraraacute extensiones de formato propietario y no propietario prefiera para
la publicacioacuten de sus datos las extensiones de la derecha
FORMATO PROPIETARIO FORMATO NO PROPIETARIO
DOC GDB TXT ASCII Grid KML RDF
XLS DWG CSV GeoJSON DXF XML
PPT SHP JSON GML ODF
Ejemplo 2
Si no fue posible utilizar una extensioacuten de formato no propietario publique sus datos en una
variedad de formatos que le permita al usuario acceder a los datos desde diferentes
aplicaciones informaacuteticas
Ejemplo 3
Para publicar sus datos conozca diferentes tipos de Web Services que viajan en la red utilizando extensiones XML
SOAP httpswwww3orgTRsoap
REST httprestelksteinorg
WMS httpwwwopengeospatialorgstandardswms
WFS httpwwwopengeospatialorgstandardswfs
WCS httpwwwopengeospatialorgstandardswcs
19 Buenas praacutecticas para la publicacioacuten de datos
6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos publicados
Un diccionario estaacute definido como un repertorio en forma de libro o en soporte electroacutenico en el
que se recogen seguacuten un orden determinado las palabras o expresiones de una o maacutes lenguas
o de una materia concreta acompantildeadas de su definicioacuten equivalencia o explicacioacuten15
especiacuteficamente en un diccionario de datos se encuentran los conceptos de los datos y sus
propiedades (atributos dominios asociaciones y operaciones) acompantildeados de una definicioacuten
en donde se identifica el propoacutesito alcance y campo de aplicacioacuten del dato publicado
Lograr que los usuarios de mis datos entiendan la informacioacuten que estaacute publicada le permitiraacute
decidir si satisfacen o no su necesidad y le facilitaraacute la decisioacuten para explotar lo datos
Para maacutes informacioacuten consulte el Instructivo Diccionario de Datos
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que se eviten ambiguumledades en la interpretacioacuten de mis datos
Que mis datos publicados esteacuten unificados y consistentes
Que los usuarios comprendan mejor y dispongan de claridad sobre los conceptos de
mis datos
iexclRecomendaciones
Publique como miacutenimo un diccionario de datos que contenga la caracterizacioacuten del
conjunto de datos producidos por su entidad
Cree el diccionario de datos teniendo en cuenta como miacutenimo la siguiente informacioacuten
Nombre del atributo Nombre que identifica de manera clara un atributo
Definicioacuten Descripcioacuten del atributo
Tipo de dato Tipo de valor del atributo
Unidad de medida Expresa la unidad de medida del atributo
Dominio Determina si el atributo tiene asociado un dominio
15 httpdleraeesw=diccionario
20 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
Para el conjunto de datos ldquoEstablecimientos Educativos en Bogotaacuterdquo publicariacuteamos un
diccionario de datos similar al siguiente
Nombre del atributo Definicioacuten Tipo de dato
Unidad de Medida
Dominio
Coacutedigo del establecimiento
Coacutedigo DANE asignado al Institucioacuten Educativa Decimal
Nombre del establecimiento
Nombre de la Institucioacuten Educativa Cadena de Caracteres
Aacuterea construida del establecimiento
Aacuterea construida de la Institucioacuten Educativa Decimal Metros
cuadrados
Sector
Clasificacioacuten asignada seguacuten la naturaleza juriacutedica la cual define las principales caracteriacutesticas que desde lo juriacutedico - administrativo y tiene que ver con el origen de su creacioacuten
Entero
EESector
No podriacuteamos olvidar detallar el dominio asociado
Atributo Nombre del Dominio Coacutedigo Definicioacuten
EESector
Oficial 1
Es una institucioacuten donde su naturaleza de servicio puacuteblico cultural y su funcioacuten social le es inherente cumpliendo con las disposiciones legales y estatutarias que las rigen donde sus rentas se conservan y se aplican debidamente
Privado 2
Es una institucioacuten constituida como persona juriacutedica de utilidad comuacuten donde sus rentas se conservan y se aplican debidamente y que en todo lo esencial se cumple con la voluntad de sus fundadores
21 Buenas praacutecticas para la publicacioacuten de datos
7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos
Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para
acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que
conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como
cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o
software
En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos
publicados se proporcionen recursos o documentos adicionales que puedan ser consultados
yo descargados traveacutes de enlaces o links de otro sitio Web
Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los
procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los
documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad
entre otros
iquestQueacute logro
Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos
Que los usuarios comprendan mejor mis datos
Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios
iexclRecomendaciones
Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el
horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del
dato
No olvide vincular o registrar esta informacioacuten en el metadato
16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp
22 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos
Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318
Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57
Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30
Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217
Ejemplo 2
La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en
httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos
o Gestioacuten de los humedales
o Poliacutetica de Humedales del Distrito Capital
o Normatividad
o Planes de Manejo Ambiental
o Comiteacute distrital de humedales documentos de consulta normatividad
23 Buenas praacutecticas para la publicacioacuten de datos
8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza
La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten
juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado
Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para
satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas
y especificaciones establecidas
Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades
de estos sin embargo en este aparte citaremos los elementos principales que usted o su
entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad
Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de
los datos espaciales
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que los usuarios hablen bien de mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean maacutes compartidos
Que mis datos sean maacutes confiables
Recomendacioacuten 1
Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten
descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten
corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Suba 200 Tunjuelito 500
Ameacutericas 100
850
Tunjuelito 500
18 httpdleraeesid=6nVpk8P|6nXVL1Z
Campo duplicado
Campo inconsistente
Campo vaciacuteo
24 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 2
Identifique y transforme si es necesario los datos que hayan sido registrados en un formato
diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida
del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de
formatordquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Tunjuelito 5008 Tunjuelito 500
Fontiboacuten 40 Fontiboacuten 430
Tunjuelito 500 Tunjuelito 500
Recomendacioacuten 3
Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos
se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de
clasificacioacutenrdquo
Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad
Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10
Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20
Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40
Recomendacioacuten 4
Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos
correspondan a valores conocidos como verdaderos El elemento de calidad asociado se
denomina ldquoexactitud de atributos cuantitativosrdquo
Localidad Mes Temperatura Localidad Mes Temperatura
Chapinero Enero 7degC Chapinero Enero 7degC
Suba Agosto -15degC Suba Agosto 15degC
Tunjuelito Abril 60degC Tunjuelito Abril 16degC
Clasificacioacuten inconsistente
Formato inconsistente
Valor inconsistente
25 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 5
Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por
ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que
las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad
asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo
Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro
00 20580101 00 20180101
01 20180102 01 20180102
126 20510403 126 20180103
20 20180104 20 20180104
Recomendacioacuten 6
Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes
de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se
denomina ldquoconsistencia temporalrdquo
Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio
Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231
Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231
Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112
Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112
Recomendacioacuten 7
Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta
corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud
posicionalrdquo
Eventos Deportivos Lugar Eventos Deportivos Lugar
Evento 1 AK 30 25 90 Evento 1 AK 30 25 90
Evento 2 AC 63 215 20 Evento 2 Parque La Florida
Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar
Fecha
inconsistente
Fechas no secuenciales
Lugar inexistente
26 Buenas praacutecticas para la publicacioacuten de datos
9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten
El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de
alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una
institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las
variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a
cabo los traacutemites de una entidad etc
Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un
espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados
Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten
asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un
establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario
identificar la localizacioacuten del dato publicado
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean puedan compartir en maacutes plataformas
Que los usuarios puedan visualizar mis datos en un mapa
iexclRecomendaciones
Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o
lugares geograacuteficos
Ejemplo 1
Incluya direcciones que permitan localizar espacialmente sus datos
Programa Direccioacuten
Registro de atencioacuten a la ciudadaniacutea CL 138 108 16
Centro de autocuidado KR 18 D 77 A 11 SUR
Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46
Centro de autocuidado KR 18 D 73 A 33 SUR
19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico
27 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 2
Utilice coordenadas para indicar la ubicacioacuten de sus datos
EPS Coordenada X Coordenada Y
EPS Convida 9087496334 1051342164
Capital Salud EPS 986321006 954875808
EPS Famisanar 9742508812 8837031501
Aliansalud EPS 9716943356 9659706891
Salud Total EPS 9215624975 9625189518
Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro
de su metadato el Sistema de referencia empleado
MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686
MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116
MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458
Ejemplo 3
Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute
Usuario Vacunado Lugar de Vacunacioacuten
Usuario 1 BOSQUE IZQUIERDO
Usuario 2 LAGUNITAS URBANO
Usuario 3 LA CAPUCHINA
Usuario 4 SAN JOSE SUR
Usuario 5 VENECIA
28 Buenas praacutecticas para la publicacioacuten de datos
10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado
Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el
dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los
usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la
citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el
formato de este
En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero
de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de
su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la
informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado
y reconocido faacutecilmente entre los demaacutes datos
Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de
identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por
cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta
gestioacuten y reutilizacioacuten de sus datos
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean compartidos en maacutes plataformas
Que mis datos puedan vincularse a otros datos en el entorno Web
Que mis datos sean encontrados usados y citados inequiacutevocamente
Garantizar y monitorear la reutilizacioacuten de mis datos
Reducir del uso erroacuteneo de mis datos
iexclRecomendaciones
Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar
Utilice siempre el identificador asignado para publicar sus datos
29 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos
httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la
creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la
asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten
de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito
garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar
descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando
asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten
geograacutefica
Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems
publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace
referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades
territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el
planeamiento del suelo urbano de expansioacuten y ruralrdquo
30 Buenas praacutecticas para la publicacioacuten de datos
OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS
Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten
Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado
Nivel Baacutesico
En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)
Nivel Intermedio
Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)
Nivel Avanzado
Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)
31 Buenas praacutecticas para la publicacioacuten de datos
REFERENCIAS
Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best
Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp
Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices
for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp
Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington
Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec
Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI
Recommendation URL httpdublincoreorgdocumentsdcmi-terms
Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C
Recommendation URL httpswwww3orgTRvocab-dcat
ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de
2014 International Standard
ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers
noviembre de 2009 International Standard
ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013
International Standard
Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best
Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp
T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax
Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986
World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg
W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second
Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-
overview
W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado
el 12 de septiembre de 2018
16 Buenas praacutecticas para la publicacioacuten de datos
Reemplace los identificadores directos por coacutedigos de referencia pseudoacutenimos
(algoritmos AES12 o un hash cifrado HMAC13) coacutedigos arbitrarios o aleatorios
Si reemplazando el identificador directo auacuten es faacutecil identificar a la persona elimine el
dato
Clasifique yo categorice los datos
Redondee los datos numeacutericos hacia arriba o hacia abajo
Evaluacutee antes durante y despueacutes de publicados los datos si la anonimizacioacuten de sus
datos es suficiente y evaluacutee regularmente los riesgos existentes
Para maacutes informacioacuten consulte los Lineamientos para la Anonimizacioacuten de micro datos
Ejemplo 1
Antes de publicar sus datos retire el identificador directo de la persona En este caso
reemplace en nuacutemero de documento que identifica al usuario y reemplaacutecelo por un
consecutivo
Usuario Beneficio Usuario Beneficio
80123456 Subsidio de vivienda Usuario 1 Subsidio de vivienda
51123456 Subsidio de alimentacioacuten Usuario 2 Subsidio de alimentacioacuten
19123456 Subsidio al adulto mayor Usuario 3 Subsidio al adulto mayor
53123456 Subsidio de desempleo Usuario 4 Subsidio de desempleo
Ejemplo 2
Clasifique o categorice sus datos En este ejemplo asigne rangos a la edad de manera tal que el
titular del registro no sea identificable por este dato
Usuario Edad Usuario Rango de edad
Usuario 1 11 antildeos Usuario 1 Entre 10 y 15 antildeos
Usuario 2 22 antildeos Usuario 2 Entre 20 y 25 antildeos
Usuario 3 36 antildeos Usuario 3 Entre 35 y 40 antildeos
Usuario 4 63 antildeos Usuario 4 Entre 60 y 65 antildeos
12 Advanced Encryption Standard puede consultar como ha sido implementado este algoritmo en httpsrevistasudistritaleducoojsindexphpTecnuraarticleview72368892 13 Hash-based Message Authentication Code puede consultar como se crea este cifrado en httpsdocsoraclecomcdE19253-01819-7804wanboottasks2-51indexhtml
17 Buenas praacutecticas para la publicacioacuten de datos
5 Publicar los datos en formatos estaacutendar reutilizables y legibles por aplicaciones informaacuteticas
Un formato puede ser definido como la estructura de un disco dividido en campos y pistas
seguacuten un determinado sistema operativo lo que permite almacenar en eacutel informacioacuten14
baacutesicamente es la forma en que se codifican los datos en un archivo informaacutetico
Actualmente conocemos formatos comunes de almacenamiento como el doc una extensioacuten
de Word que almacena texto y cuyo propietario es la compantildeiacutea Microsoft Pero iquestqueacute pasa si un
usuario quiere abrir un documento doc en un procesador de texto diferente a Word
difiacutecilmente va a poder conocer el contenido de dicho documento sin tener esta licencia
Lo que queremos lograr con la implementacioacuten de esta praacutectica es que todos los usuarios que
encuentren mis datos puedan accederlos sin necesidad de contar con un software o aplicacioacuten
informaacutetica especiacutefica
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos puedan ser extraiacutedos transformados y procesados por aplicaciones
informaacuteticas
Que mis datos puedan ser compartidos e intercambiados entre sistemas
Disminuir los costos y los tiempos en el uso y la transformacioacuten de mis datos
iexclRecomendaciones
Prefiera publicar su conjunto de datos en formatos abiertos o no propietario ya que
estos facilitan el uso re-uso y distribucioacuten de estos Se busca que un mayor nuacutemero de
aplicaciones informaacuteticas pueda extraer leer y transformar los datos generando mayor
uso y re-uso por los usuarios
Disponga sus datos en muacuteltiples formatos con el fin de incrementar el acceso a los
mismos Se busca que el mayor nuacutemero de usuarios pueda utilizar los datos sin tener
que transformarlos primero en su formato preferido
Utilice Web Services para mejorar el intercambio e interoperabilidad de los datos
publicados
14 httpdleraeessrvsearchm=30ampw=formato
18 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
A continuacioacuten encontraraacute extensiones de formato propietario y no propietario prefiera para
la publicacioacuten de sus datos las extensiones de la derecha
FORMATO PROPIETARIO FORMATO NO PROPIETARIO
DOC GDB TXT ASCII Grid KML RDF
XLS DWG CSV GeoJSON DXF XML
PPT SHP JSON GML ODF
Ejemplo 2
Si no fue posible utilizar una extensioacuten de formato no propietario publique sus datos en una
variedad de formatos que le permita al usuario acceder a los datos desde diferentes
aplicaciones informaacuteticas
Ejemplo 3
Para publicar sus datos conozca diferentes tipos de Web Services que viajan en la red utilizando extensiones XML
SOAP httpswwww3orgTRsoap
REST httprestelksteinorg
WMS httpwwwopengeospatialorgstandardswms
WFS httpwwwopengeospatialorgstandardswfs
WCS httpwwwopengeospatialorgstandardswcs
19 Buenas praacutecticas para la publicacioacuten de datos
6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos publicados
Un diccionario estaacute definido como un repertorio en forma de libro o en soporte electroacutenico en el
que se recogen seguacuten un orden determinado las palabras o expresiones de una o maacutes lenguas
o de una materia concreta acompantildeadas de su definicioacuten equivalencia o explicacioacuten15
especiacuteficamente en un diccionario de datos se encuentran los conceptos de los datos y sus
propiedades (atributos dominios asociaciones y operaciones) acompantildeados de una definicioacuten
en donde se identifica el propoacutesito alcance y campo de aplicacioacuten del dato publicado
Lograr que los usuarios de mis datos entiendan la informacioacuten que estaacute publicada le permitiraacute
decidir si satisfacen o no su necesidad y le facilitaraacute la decisioacuten para explotar lo datos
Para maacutes informacioacuten consulte el Instructivo Diccionario de Datos
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que se eviten ambiguumledades en la interpretacioacuten de mis datos
Que mis datos publicados esteacuten unificados y consistentes
Que los usuarios comprendan mejor y dispongan de claridad sobre los conceptos de
mis datos
iexclRecomendaciones
Publique como miacutenimo un diccionario de datos que contenga la caracterizacioacuten del
conjunto de datos producidos por su entidad
Cree el diccionario de datos teniendo en cuenta como miacutenimo la siguiente informacioacuten
Nombre del atributo Nombre que identifica de manera clara un atributo
Definicioacuten Descripcioacuten del atributo
Tipo de dato Tipo de valor del atributo
Unidad de medida Expresa la unidad de medida del atributo
Dominio Determina si el atributo tiene asociado un dominio
15 httpdleraeesw=diccionario
20 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
Para el conjunto de datos ldquoEstablecimientos Educativos en Bogotaacuterdquo publicariacuteamos un
diccionario de datos similar al siguiente
Nombre del atributo Definicioacuten Tipo de dato
Unidad de Medida
Dominio
Coacutedigo del establecimiento
Coacutedigo DANE asignado al Institucioacuten Educativa Decimal
Nombre del establecimiento
Nombre de la Institucioacuten Educativa Cadena de Caracteres
Aacuterea construida del establecimiento
Aacuterea construida de la Institucioacuten Educativa Decimal Metros
cuadrados
Sector
Clasificacioacuten asignada seguacuten la naturaleza juriacutedica la cual define las principales caracteriacutesticas que desde lo juriacutedico - administrativo y tiene que ver con el origen de su creacioacuten
Entero
EESector
No podriacuteamos olvidar detallar el dominio asociado
Atributo Nombre del Dominio Coacutedigo Definicioacuten
EESector
Oficial 1
Es una institucioacuten donde su naturaleza de servicio puacuteblico cultural y su funcioacuten social le es inherente cumpliendo con las disposiciones legales y estatutarias que las rigen donde sus rentas se conservan y se aplican debidamente
Privado 2
Es una institucioacuten constituida como persona juriacutedica de utilidad comuacuten donde sus rentas se conservan y se aplican debidamente y que en todo lo esencial se cumple con la voluntad de sus fundadores
21 Buenas praacutecticas para la publicacioacuten de datos
7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos
Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para
acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que
conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como
cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o
software
En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos
publicados se proporcionen recursos o documentos adicionales que puedan ser consultados
yo descargados traveacutes de enlaces o links de otro sitio Web
Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los
procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los
documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad
entre otros
iquestQueacute logro
Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos
Que los usuarios comprendan mejor mis datos
Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios
iexclRecomendaciones
Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el
horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del
dato
No olvide vincular o registrar esta informacioacuten en el metadato
16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp
22 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos
Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318
Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57
Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30
Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217
Ejemplo 2
La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en
httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos
o Gestioacuten de los humedales
o Poliacutetica de Humedales del Distrito Capital
o Normatividad
o Planes de Manejo Ambiental
o Comiteacute distrital de humedales documentos de consulta normatividad
23 Buenas praacutecticas para la publicacioacuten de datos
8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza
La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten
juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado
Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para
satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas
y especificaciones establecidas
Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades
de estos sin embargo en este aparte citaremos los elementos principales que usted o su
entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad
Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de
los datos espaciales
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que los usuarios hablen bien de mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean maacutes compartidos
Que mis datos sean maacutes confiables
Recomendacioacuten 1
Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten
descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten
corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Suba 200 Tunjuelito 500
Ameacutericas 100
850
Tunjuelito 500
18 httpdleraeesid=6nVpk8P|6nXVL1Z
Campo duplicado
Campo inconsistente
Campo vaciacuteo
24 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 2
Identifique y transforme si es necesario los datos que hayan sido registrados en un formato
diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida
del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de
formatordquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Tunjuelito 5008 Tunjuelito 500
Fontiboacuten 40 Fontiboacuten 430
Tunjuelito 500 Tunjuelito 500
Recomendacioacuten 3
Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos
se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de
clasificacioacutenrdquo
Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad
Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10
Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20
Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40
Recomendacioacuten 4
Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos
correspondan a valores conocidos como verdaderos El elemento de calidad asociado se
denomina ldquoexactitud de atributos cuantitativosrdquo
Localidad Mes Temperatura Localidad Mes Temperatura
Chapinero Enero 7degC Chapinero Enero 7degC
Suba Agosto -15degC Suba Agosto 15degC
Tunjuelito Abril 60degC Tunjuelito Abril 16degC
Clasificacioacuten inconsistente
Formato inconsistente
Valor inconsistente
25 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 5
Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por
ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que
las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad
asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo
Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro
00 20580101 00 20180101
01 20180102 01 20180102
126 20510403 126 20180103
20 20180104 20 20180104
Recomendacioacuten 6
Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes
de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se
denomina ldquoconsistencia temporalrdquo
Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio
Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231
Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231
Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112
Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112
Recomendacioacuten 7
Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta
corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud
posicionalrdquo
Eventos Deportivos Lugar Eventos Deportivos Lugar
Evento 1 AK 30 25 90 Evento 1 AK 30 25 90
Evento 2 AC 63 215 20 Evento 2 Parque La Florida
Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar
Fecha
inconsistente
Fechas no secuenciales
Lugar inexistente
26 Buenas praacutecticas para la publicacioacuten de datos
9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten
El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de
alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una
institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las
variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a
cabo los traacutemites de una entidad etc
Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un
espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados
Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten
asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un
establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario
identificar la localizacioacuten del dato publicado
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean puedan compartir en maacutes plataformas
Que los usuarios puedan visualizar mis datos en un mapa
iexclRecomendaciones
Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o
lugares geograacuteficos
Ejemplo 1
Incluya direcciones que permitan localizar espacialmente sus datos
Programa Direccioacuten
Registro de atencioacuten a la ciudadaniacutea CL 138 108 16
Centro de autocuidado KR 18 D 77 A 11 SUR
Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46
Centro de autocuidado KR 18 D 73 A 33 SUR
19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico
27 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 2
Utilice coordenadas para indicar la ubicacioacuten de sus datos
EPS Coordenada X Coordenada Y
EPS Convida 9087496334 1051342164
Capital Salud EPS 986321006 954875808
EPS Famisanar 9742508812 8837031501
Aliansalud EPS 9716943356 9659706891
Salud Total EPS 9215624975 9625189518
Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro
de su metadato el Sistema de referencia empleado
MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686
MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116
MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458
Ejemplo 3
Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute
Usuario Vacunado Lugar de Vacunacioacuten
Usuario 1 BOSQUE IZQUIERDO
Usuario 2 LAGUNITAS URBANO
Usuario 3 LA CAPUCHINA
Usuario 4 SAN JOSE SUR
Usuario 5 VENECIA
28 Buenas praacutecticas para la publicacioacuten de datos
10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado
Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el
dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los
usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la
citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el
formato de este
En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero
de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de
su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la
informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado
y reconocido faacutecilmente entre los demaacutes datos
Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de
identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por
cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta
gestioacuten y reutilizacioacuten de sus datos
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean compartidos en maacutes plataformas
Que mis datos puedan vincularse a otros datos en el entorno Web
Que mis datos sean encontrados usados y citados inequiacutevocamente
Garantizar y monitorear la reutilizacioacuten de mis datos
Reducir del uso erroacuteneo de mis datos
iexclRecomendaciones
Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar
Utilice siempre el identificador asignado para publicar sus datos
29 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos
httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la
creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la
asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten
de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito
garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar
descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando
asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten
geograacutefica
Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems
publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace
referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades
territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el
planeamiento del suelo urbano de expansioacuten y ruralrdquo
30 Buenas praacutecticas para la publicacioacuten de datos
OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS
Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten
Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado
Nivel Baacutesico
En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)
Nivel Intermedio
Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)
Nivel Avanzado
Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)
31 Buenas praacutecticas para la publicacioacuten de datos
REFERENCIAS
Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best
Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp
Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices
for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp
Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington
Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec
Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI
Recommendation URL httpdublincoreorgdocumentsdcmi-terms
Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C
Recommendation URL httpswwww3orgTRvocab-dcat
ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de
2014 International Standard
ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers
noviembre de 2009 International Standard
ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013
International Standard
Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best
Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp
T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax
Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986
World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg
W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second
Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-
overview
W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado
el 12 de septiembre de 2018
17 Buenas praacutecticas para la publicacioacuten de datos
5 Publicar los datos en formatos estaacutendar reutilizables y legibles por aplicaciones informaacuteticas
Un formato puede ser definido como la estructura de un disco dividido en campos y pistas
seguacuten un determinado sistema operativo lo que permite almacenar en eacutel informacioacuten14
baacutesicamente es la forma en que se codifican los datos en un archivo informaacutetico
Actualmente conocemos formatos comunes de almacenamiento como el doc una extensioacuten
de Word que almacena texto y cuyo propietario es la compantildeiacutea Microsoft Pero iquestqueacute pasa si un
usuario quiere abrir un documento doc en un procesador de texto diferente a Word
difiacutecilmente va a poder conocer el contenido de dicho documento sin tener esta licencia
Lo que queremos lograr con la implementacioacuten de esta praacutectica es que todos los usuarios que
encuentren mis datos puedan accederlos sin necesidad de contar con un software o aplicacioacuten
informaacutetica especiacutefica
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos puedan ser extraiacutedos transformados y procesados por aplicaciones
informaacuteticas
Que mis datos puedan ser compartidos e intercambiados entre sistemas
Disminuir los costos y los tiempos en el uso y la transformacioacuten de mis datos
iexclRecomendaciones
Prefiera publicar su conjunto de datos en formatos abiertos o no propietario ya que
estos facilitan el uso re-uso y distribucioacuten de estos Se busca que un mayor nuacutemero de
aplicaciones informaacuteticas pueda extraer leer y transformar los datos generando mayor
uso y re-uso por los usuarios
Disponga sus datos en muacuteltiples formatos con el fin de incrementar el acceso a los
mismos Se busca que el mayor nuacutemero de usuarios pueda utilizar los datos sin tener
que transformarlos primero en su formato preferido
Utilice Web Services para mejorar el intercambio e interoperabilidad de los datos
publicados
14 httpdleraeessrvsearchm=30ampw=formato
18 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
A continuacioacuten encontraraacute extensiones de formato propietario y no propietario prefiera para
la publicacioacuten de sus datos las extensiones de la derecha
FORMATO PROPIETARIO FORMATO NO PROPIETARIO
DOC GDB TXT ASCII Grid KML RDF
XLS DWG CSV GeoJSON DXF XML
PPT SHP JSON GML ODF
Ejemplo 2
Si no fue posible utilizar una extensioacuten de formato no propietario publique sus datos en una
variedad de formatos que le permita al usuario acceder a los datos desde diferentes
aplicaciones informaacuteticas
Ejemplo 3
Para publicar sus datos conozca diferentes tipos de Web Services que viajan en la red utilizando extensiones XML
SOAP httpswwww3orgTRsoap
REST httprestelksteinorg
WMS httpwwwopengeospatialorgstandardswms
WFS httpwwwopengeospatialorgstandardswfs
WCS httpwwwopengeospatialorgstandardswcs
19 Buenas praacutecticas para la publicacioacuten de datos
6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos publicados
Un diccionario estaacute definido como un repertorio en forma de libro o en soporte electroacutenico en el
que se recogen seguacuten un orden determinado las palabras o expresiones de una o maacutes lenguas
o de una materia concreta acompantildeadas de su definicioacuten equivalencia o explicacioacuten15
especiacuteficamente en un diccionario de datos se encuentran los conceptos de los datos y sus
propiedades (atributos dominios asociaciones y operaciones) acompantildeados de una definicioacuten
en donde se identifica el propoacutesito alcance y campo de aplicacioacuten del dato publicado
Lograr que los usuarios de mis datos entiendan la informacioacuten que estaacute publicada le permitiraacute
decidir si satisfacen o no su necesidad y le facilitaraacute la decisioacuten para explotar lo datos
Para maacutes informacioacuten consulte el Instructivo Diccionario de Datos
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que se eviten ambiguumledades en la interpretacioacuten de mis datos
Que mis datos publicados esteacuten unificados y consistentes
Que los usuarios comprendan mejor y dispongan de claridad sobre los conceptos de
mis datos
iexclRecomendaciones
Publique como miacutenimo un diccionario de datos que contenga la caracterizacioacuten del
conjunto de datos producidos por su entidad
Cree el diccionario de datos teniendo en cuenta como miacutenimo la siguiente informacioacuten
Nombre del atributo Nombre que identifica de manera clara un atributo
Definicioacuten Descripcioacuten del atributo
Tipo de dato Tipo de valor del atributo
Unidad de medida Expresa la unidad de medida del atributo
Dominio Determina si el atributo tiene asociado un dominio
15 httpdleraeesw=diccionario
20 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
Para el conjunto de datos ldquoEstablecimientos Educativos en Bogotaacuterdquo publicariacuteamos un
diccionario de datos similar al siguiente
Nombre del atributo Definicioacuten Tipo de dato
Unidad de Medida
Dominio
Coacutedigo del establecimiento
Coacutedigo DANE asignado al Institucioacuten Educativa Decimal
Nombre del establecimiento
Nombre de la Institucioacuten Educativa Cadena de Caracteres
Aacuterea construida del establecimiento
Aacuterea construida de la Institucioacuten Educativa Decimal Metros
cuadrados
Sector
Clasificacioacuten asignada seguacuten la naturaleza juriacutedica la cual define las principales caracteriacutesticas que desde lo juriacutedico - administrativo y tiene que ver con el origen de su creacioacuten
Entero
EESector
No podriacuteamos olvidar detallar el dominio asociado
Atributo Nombre del Dominio Coacutedigo Definicioacuten
EESector
Oficial 1
Es una institucioacuten donde su naturaleza de servicio puacuteblico cultural y su funcioacuten social le es inherente cumpliendo con las disposiciones legales y estatutarias que las rigen donde sus rentas se conservan y se aplican debidamente
Privado 2
Es una institucioacuten constituida como persona juriacutedica de utilidad comuacuten donde sus rentas se conservan y se aplican debidamente y que en todo lo esencial se cumple con la voluntad de sus fundadores
21 Buenas praacutecticas para la publicacioacuten de datos
7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos
Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para
acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que
conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como
cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o
software
En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos
publicados se proporcionen recursos o documentos adicionales que puedan ser consultados
yo descargados traveacutes de enlaces o links de otro sitio Web
Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los
procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los
documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad
entre otros
iquestQueacute logro
Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos
Que los usuarios comprendan mejor mis datos
Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios
iexclRecomendaciones
Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el
horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del
dato
No olvide vincular o registrar esta informacioacuten en el metadato
16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp
22 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos
Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318
Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57
Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30
Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217
Ejemplo 2
La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en
httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos
o Gestioacuten de los humedales
o Poliacutetica de Humedales del Distrito Capital
o Normatividad
o Planes de Manejo Ambiental
o Comiteacute distrital de humedales documentos de consulta normatividad
23 Buenas praacutecticas para la publicacioacuten de datos
8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza
La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten
juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado
Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para
satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas
y especificaciones establecidas
Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades
de estos sin embargo en este aparte citaremos los elementos principales que usted o su
entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad
Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de
los datos espaciales
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que los usuarios hablen bien de mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean maacutes compartidos
Que mis datos sean maacutes confiables
Recomendacioacuten 1
Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten
descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten
corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Suba 200 Tunjuelito 500
Ameacutericas 100
850
Tunjuelito 500
18 httpdleraeesid=6nVpk8P|6nXVL1Z
Campo duplicado
Campo inconsistente
Campo vaciacuteo
24 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 2
Identifique y transforme si es necesario los datos que hayan sido registrados en un formato
diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida
del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de
formatordquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Tunjuelito 5008 Tunjuelito 500
Fontiboacuten 40 Fontiboacuten 430
Tunjuelito 500 Tunjuelito 500
Recomendacioacuten 3
Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos
se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de
clasificacioacutenrdquo
Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad
Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10
Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20
Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40
Recomendacioacuten 4
Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos
correspondan a valores conocidos como verdaderos El elemento de calidad asociado se
denomina ldquoexactitud de atributos cuantitativosrdquo
Localidad Mes Temperatura Localidad Mes Temperatura
Chapinero Enero 7degC Chapinero Enero 7degC
Suba Agosto -15degC Suba Agosto 15degC
Tunjuelito Abril 60degC Tunjuelito Abril 16degC
Clasificacioacuten inconsistente
Formato inconsistente
Valor inconsistente
25 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 5
Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por
ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que
las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad
asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo
Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro
00 20580101 00 20180101
01 20180102 01 20180102
126 20510403 126 20180103
20 20180104 20 20180104
Recomendacioacuten 6
Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes
de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se
denomina ldquoconsistencia temporalrdquo
Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio
Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231
Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231
Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112
Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112
Recomendacioacuten 7
Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta
corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud
posicionalrdquo
Eventos Deportivos Lugar Eventos Deportivos Lugar
Evento 1 AK 30 25 90 Evento 1 AK 30 25 90
Evento 2 AC 63 215 20 Evento 2 Parque La Florida
Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar
Fecha
inconsistente
Fechas no secuenciales
Lugar inexistente
26 Buenas praacutecticas para la publicacioacuten de datos
9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten
El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de
alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una
institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las
variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a
cabo los traacutemites de una entidad etc
Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un
espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados
Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten
asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un
establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario
identificar la localizacioacuten del dato publicado
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean puedan compartir en maacutes plataformas
Que los usuarios puedan visualizar mis datos en un mapa
iexclRecomendaciones
Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o
lugares geograacuteficos
Ejemplo 1
Incluya direcciones que permitan localizar espacialmente sus datos
Programa Direccioacuten
Registro de atencioacuten a la ciudadaniacutea CL 138 108 16
Centro de autocuidado KR 18 D 77 A 11 SUR
Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46
Centro de autocuidado KR 18 D 73 A 33 SUR
19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico
27 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 2
Utilice coordenadas para indicar la ubicacioacuten de sus datos
EPS Coordenada X Coordenada Y
EPS Convida 9087496334 1051342164
Capital Salud EPS 986321006 954875808
EPS Famisanar 9742508812 8837031501
Aliansalud EPS 9716943356 9659706891
Salud Total EPS 9215624975 9625189518
Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro
de su metadato el Sistema de referencia empleado
MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686
MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116
MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458
Ejemplo 3
Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute
Usuario Vacunado Lugar de Vacunacioacuten
Usuario 1 BOSQUE IZQUIERDO
Usuario 2 LAGUNITAS URBANO
Usuario 3 LA CAPUCHINA
Usuario 4 SAN JOSE SUR
Usuario 5 VENECIA
28 Buenas praacutecticas para la publicacioacuten de datos
10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado
Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el
dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los
usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la
citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el
formato de este
En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero
de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de
su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la
informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado
y reconocido faacutecilmente entre los demaacutes datos
Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de
identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por
cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta
gestioacuten y reutilizacioacuten de sus datos
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean compartidos en maacutes plataformas
Que mis datos puedan vincularse a otros datos en el entorno Web
Que mis datos sean encontrados usados y citados inequiacutevocamente
Garantizar y monitorear la reutilizacioacuten de mis datos
Reducir del uso erroacuteneo de mis datos
iexclRecomendaciones
Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar
Utilice siempre el identificador asignado para publicar sus datos
29 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos
httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la
creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la
asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten
de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito
garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar
descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando
asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten
geograacutefica
Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems
publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace
referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades
territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el
planeamiento del suelo urbano de expansioacuten y ruralrdquo
30 Buenas praacutecticas para la publicacioacuten de datos
OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS
Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten
Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado
Nivel Baacutesico
En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)
Nivel Intermedio
Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)
Nivel Avanzado
Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)
31 Buenas praacutecticas para la publicacioacuten de datos
REFERENCIAS
Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best
Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp
Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices
for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp
Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington
Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec
Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI
Recommendation URL httpdublincoreorgdocumentsdcmi-terms
Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C
Recommendation URL httpswwww3orgTRvocab-dcat
ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de
2014 International Standard
ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers
noviembre de 2009 International Standard
ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013
International Standard
Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best
Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp
T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax
Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986
World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg
W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second
Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-
overview
W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado
el 12 de septiembre de 2018
18 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
A continuacioacuten encontraraacute extensiones de formato propietario y no propietario prefiera para
la publicacioacuten de sus datos las extensiones de la derecha
FORMATO PROPIETARIO FORMATO NO PROPIETARIO
DOC GDB TXT ASCII Grid KML RDF
XLS DWG CSV GeoJSON DXF XML
PPT SHP JSON GML ODF
Ejemplo 2
Si no fue posible utilizar una extensioacuten de formato no propietario publique sus datos en una
variedad de formatos que le permita al usuario acceder a los datos desde diferentes
aplicaciones informaacuteticas
Ejemplo 3
Para publicar sus datos conozca diferentes tipos de Web Services que viajan en la red utilizando extensiones XML
SOAP httpswwww3orgTRsoap
REST httprestelksteinorg
WMS httpwwwopengeospatialorgstandardswms
WFS httpwwwopengeospatialorgstandardswfs
WCS httpwwwopengeospatialorgstandardswcs
19 Buenas praacutecticas para la publicacioacuten de datos
6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos publicados
Un diccionario estaacute definido como un repertorio en forma de libro o en soporte electroacutenico en el
que se recogen seguacuten un orden determinado las palabras o expresiones de una o maacutes lenguas
o de una materia concreta acompantildeadas de su definicioacuten equivalencia o explicacioacuten15
especiacuteficamente en un diccionario de datos se encuentran los conceptos de los datos y sus
propiedades (atributos dominios asociaciones y operaciones) acompantildeados de una definicioacuten
en donde se identifica el propoacutesito alcance y campo de aplicacioacuten del dato publicado
Lograr que los usuarios de mis datos entiendan la informacioacuten que estaacute publicada le permitiraacute
decidir si satisfacen o no su necesidad y le facilitaraacute la decisioacuten para explotar lo datos
Para maacutes informacioacuten consulte el Instructivo Diccionario de Datos
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que se eviten ambiguumledades en la interpretacioacuten de mis datos
Que mis datos publicados esteacuten unificados y consistentes
Que los usuarios comprendan mejor y dispongan de claridad sobre los conceptos de
mis datos
iexclRecomendaciones
Publique como miacutenimo un diccionario de datos que contenga la caracterizacioacuten del
conjunto de datos producidos por su entidad
Cree el diccionario de datos teniendo en cuenta como miacutenimo la siguiente informacioacuten
Nombre del atributo Nombre que identifica de manera clara un atributo
Definicioacuten Descripcioacuten del atributo
Tipo de dato Tipo de valor del atributo
Unidad de medida Expresa la unidad de medida del atributo
Dominio Determina si el atributo tiene asociado un dominio
15 httpdleraeesw=diccionario
20 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
Para el conjunto de datos ldquoEstablecimientos Educativos en Bogotaacuterdquo publicariacuteamos un
diccionario de datos similar al siguiente
Nombre del atributo Definicioacuten Tipo de dato
Unidad de Medida
Dominio
Coacutedigo del establecimiento
Coacutedigo DANE asignado al Institucioacuten Educativa Decimal
Nombre del establecimiento
Nombre de la Institucioacuten Educativa Cadena de Caracteres
Aacuterea construida del establecimiento
Aacuterea construida de la Institucioacuten Educativa Decimal Metros
cuadrados
Sector
Clasificacioacuten asignada seguacuten la naturaleza juriacutedica la cual define las principales caracteriacutesticas que desde lo juriacutedico - administrativo y tiene que ver con el origen de su creacioacuten
Entero
EESector
No podriacuteamos olvidar detallar el dominio asociado
Atributo Nombre del Dominio Coacutedigo Definicioacuten
EESector
Oficial 1
Es una institucioacuten donde su naturaleza de servicio puacuteblico cultural y su funcioacuten social le es inherente cumpliendo con las disposiciones legales y estatutarias que las rigen donde sus rentas se conservan y se aplican debidamente
Privado 2
Es una institucioacuten constituida como persona juriacutedica de utilidad comuacuten donde sus rentas se conservan y se aplican debidamente y que en todo lo esencial se cumple con la voluntad de sus fundadores
21 Buenas praacutecticas para la publicacioacuten de datos
7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos
Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para
acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que
conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como
cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o
software
En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos
publicados se proporcionen recursos o documentos adicionales que puedan ser consultados
yo descargados traveacutes de enlaces o links de otro sitio Web
Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los
procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los
documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad
entre otros
iquestQueacute logro
Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos
Que los usuarios comprendan mejor mis datos
Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios
iexclRecomendaciones
Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el
horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del
dato
No olvide vincular o registrar esta informacioacuten en el metadato
16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp
22 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos
Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318
Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57
Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30
Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217
Ejemplo 2
La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en
httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos
o Gestioacuten de los humedales
o Poliacutetica de Humedales del Distrito Capital
o Normatividad
o Planes de Manejo Ambiental
o Comiteacute distrital de humedales documentos de consulta normatividad
23 Buenas praacutecticas para la publicacioacuten de datos
8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza
La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten
juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado
Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para
satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas
y especificaciones establecidas
Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades
de estos sin embargo en este aparte citaremos los elementos principales que usted o su
entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad
Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de
los datos espaciales
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que los usuarios hablen bien de mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean maacutes compartidos
Que mis datos sean maacutes confiables
Recomendacioacuten 1
Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten
descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten
corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Suba 200 Tunjuelito 500
Ameacutericas 100
850
Tunjuelito 500
18 httpdleraeesid=6nVpk8P|6nXVL1Z
Campo duplicado
Campo inconsistente
Campo vaciacuteo
24 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 2
Identifique y transforme si es necesario los datos que hayan sido registrados en un formato
diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida
del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de
formatordquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Tunjuelito 5008 Tunjuelito 500
Fontiboacuten 40 Fontiboacuten 430
Tunjuelito 500 Tunjuelito 500
Recomendacioacuten 3
Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos
se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de
clasificacioacutenrdquo
Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad
Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10
Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20
Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40
Recomendacioacuten 4
Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos
correspondan a valores conocidos como verdaderos El elemento de calidad asociado se
denomina ldquoexactitud de atributos cuantitativosrdquo
Localidad Mes Temperatura Localidad Mes Temperatura
Chapinero Enero 7degC Chapinero Enero 7degC
Suba Agosto -15degC Suba Agosto 15degC
Tunjuelito Abril 60degC Tunjuelito Abril 16degC
Clasificacioacuten inconsistente
Formato inconsistente
Valor inconsistente
25 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 5
Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por
ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que
las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad
asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo
Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro
00 20580101 00 20180101
01 20180102 01 20180102
126 20510403 126 20180103
20 20180104 20 20180104
Recomendacioacuten 6
Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes
de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se
denomina ldquoconsistencia temporalrdquo
Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio
Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231
Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231
Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112
Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112
Recomendacioacuten 7
Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta
corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud
posicionalrdquo
Eventos Deportivos Lugar Eventos Deportivos Lugar
Evento 1 AK 30 25 90 Evento 1 AK 30 25 90
Evento 2 AC 63 215 20 Evento 2 Parque La Florida
Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar
Fecha
inconsistente
Fechas no secuenciales
Lugar inexistente
26 Buenas praacutecticas para la publicacioacuten de datos
9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten
El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de
alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una
institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las
variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a
cabo los traacutemites de una entidad etc
Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un
espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados
Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten
asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un
establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario
identificar la localizacioacuten del dato publicado
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean puedan compartir en maacutes plataformas
Que los usuarios puedan visualizar mis datos en un mapa
iexclRecomendaciones
Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o
lugares geograacuteficos
Ejemplo 1
Incluya direcciones que permitan localizar espacialmente sus datos
Programa Direccioacuten
Registro de atencioacuten a la ciudadaniacutea CL 138 108 16
Centro de autocuidado KR 18 D 77 A 11 SUR
Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46
Centro de autocuidado KR 18 D 73 A 33 SUR
19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico
27 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 2
Utilice coordenadas para indicar la ubicacioacuten de sus datos
EPS Coordenada X Coordenada Y
EPS Convida 9087496334 1051342164
Capital Salud EPS 986321006 954875808
EPS Famisanar 9742508812 8837031501
Aliansalud EPS 9716943356 9659706891
Salud Total EPS 9215624975 9625189518
Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro
de su metadato el Sistema de referencia empleado
MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686
MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116
MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458
Ejemplo 3
Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute
Usuario Vacunado Lugar de Vacunacioacuten
Usuario 1 BOSQUE IZQUIERDO
Usuario 2 LAGUNITAS URBANO
Usuario 3 LA CAPUCHINA
Usuario 4 SAN JOSE SUR
Usuario 5 VENECIA
28 Buenas praacutecticas para la publicacioacuten de datos
10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado
Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el
dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los
usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la
citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el
formato de este
En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero
de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de
su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la
informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado
y reconocido faacutecilmente entre los demaacutes datos
Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de
identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por
cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta
gestioacuten y reutilizacioacuten de sus datos
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean compartidos en maacutes plataformas
Que mis datos puedan vincularse a otros datos en el entorno Web
Que mis datos sean encontrados usados y citados inequiacutevocamente
Garantizar y monitorear la reutilizacioacuten de mis datos
Reducir del uso erroacuteneo de mis datos
iexclRecomendaciones
Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar
Utilice siempre el identificador asignado para publicar sus datos
29 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos
httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la
creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la
asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten
de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito
garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar
descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando
asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten
geograacutefica
Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems
publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace
referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades
territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el
planeamiento del suelo urbano de expansioacuten y ruralrdquo
30 Buenas praacutecticas para la publicacioacuten de datos
OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS
Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten
Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado
Nivel Baacutesico
En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)
Nivel Intermedio
Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)
Nivel Avanzado
Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)
31 Buenas praacutecticas para la publicacioacuten de datos
REFERENCIAS
Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best
Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp
Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices
for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp
Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington
Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec
Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI
Recommendation URL httpdublincoreorgdocumentsdcmi-terms
Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C
Recommendation URL httpswwww3orgTRvocab-dcat
ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de
2014 International Standard
ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers
noviembre de 2009 International Standard
ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013
International Standard
Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best
Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp
T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax
Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986
World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg
W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second
Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-
overview
W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado
el 12 de septiembre de 2018
19 Buenas praacutecticas para la publicacioacuten de datos
6 Proporcionar un diccionario de datos que facilite el uso e interpretacioacuten de los datos publicados
Un diccionario estaacute definido como un repertorio en forma de libro o en soporte electroacutenico en el
que se recogen seguacuten un orden determinado las palabras o expresiones de una o maacutes lenguas
o de una materia concreta acompantildeadas de su definicioacuten equivalencia o explicacioacuten15
especiacuteficamente en un diccionario de datos se encuentran los conceptos de los datos y sus
propiedades (atributos dominios asociaciones y operaciones) acompantildeados de una definicioacuten
en donde se identifica el propoacutesito alcance y campo de aplicacioacuten del dato publicado
Lograr que los usuarios de mis datos entiendan la informacioacuten que estaacute publicada le permitiraacute
decidir si satisfacen o no su necesidad y le facilitaraacute la decisioacuten para explotar lo datos
Para maacutes informacioacuten consulte el Instructivo Diccionario de Datos
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que se eviten ambiguumledades en la interpretacioacuten de mis datos
Que mis datos publicados esteacuten unificados y consistentes
Que los usuarios comprendan mejor y dispongan de claridad sobre los conceptos de
mis datos
iexclRecomendaciones
Publique como miacutenimo un diccionario de datos que contenga la caracterizacioacuten del
conjunto de datos producidos por su entidad
Cree el diccionario de datos teniendo en cuenta como miacutenimo la siguiente informacioacuten
Nombre del atributo Nombre que identifica de manera clara un atributo
Definicioacuten Descripcioacuten del atributo
Tipo de dato Tipo de valor del atributo
Unidad de medida Expresa la unidad de medida del atributo
Dominio Determina si el atributo tiene asociado un dominio
15 httpdleraeesw=diccionario
20 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
Para el conjunto de datos ldquoEstablecimientos Educativos en Bogotaacuterdquo publicariacuteamos un
diccionario de datos similar al siguiente
Nombre del atributo Definicioacuten Tipo de dato
Unidad de Medida
Dominio
Coacutedigo del establecimiento
Coacutedigo DANE asignado al Institucioacuten Educativa Decimal
Nombre del establecimiento
Nombre de la Institucioacuten Educativa Cadena de Caracteres
Aacuterea construida del establecimiento
Aacuterea construida de la Institucioacuten Educativa Decimal Metros
cuadrados
Sector
Clasificacioacuten asignada seguacuten la naturaleza juriacutedica la cual define las principales caracteriacutesticas que desde lo juriacutedico - administrativo y tiene que ver con el origen de su creacioacuten
Entero
EESector
No podriacuteamos olvidar detallar el dominio asociado
Atributo Nombre del Dominio Coacutedigo Definicioacuten
EESector
Oficial 1
Es una institucioacuten donde su naturaleza de servicio puacuteblico cultural y su funcioacuten social le es inherente cumpliendo con las disposiciones legales y estatutarias que las rigen donde sus rentas se conservan y se aplican debidamente
Privado 2
Es una institucioacuten constituida como persona juriacutedica de utilidad comuacuten donde sus rentas se conservan y se aplican debidamente y que en todo lo esencial se cumple con la voluntad de sus fundadores
21 Buenas praacutecticas para la publicacioacuten de datos
7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos
Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para
acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que
conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como
cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o
software
En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos
publicados se proporcionen recursos o documentos adicionales que puedan ser consultados
yo descargados traveacutes de enlaces o links de otro sitio Web
Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los
procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los
documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad
entre otros
iquestQueacute logro
Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos
Que los usuarios comprendan mejor mis datos
Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios
iexclRecomendaciones
Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el
horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del
dato
No olvide vincular o registrar esta informacioacuten en el metadato
16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp
22 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos
Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318
Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57
Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30
Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217
Ejemplo 2
La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en
httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos
o Gestioacuten de los humedales
o Poliacutetica de Humedales del Distrito Capital
o Normatividad
o Planes de Manejo Ambiental
o Comiteacute distrital de humedales documentos de consulta normatividad
23 Buenas praacutecticas para la publicacioacuten de datos
8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza
La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten
juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado
Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para
satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas
y especificaciones establecidas
Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades
de estos sin embargo en este aparte citaremos los elementos principales que usted o su
entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad
Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de
los datos espaciales
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que los usuarios hablen bien de mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean maacutes compartidos
Que mis datos sean maacutes confiables
Recomendacioacuten 1
Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten
descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten
corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Suba 200 Tunjuelito 500
Ameacutericas 100
850
Tunjuelito 500
18 httpdleraeesid=6nVpk8P|6nXVL1Z
Campo duplicado
Campo inconsistente
Campo vaciacuteo
24 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 2
Identifique y transforme si es necesario los datos que hayan sido registrados en un formato
diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida
del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de
formatordquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Tunjuelito 5008 Tunjuelito 500
Fontiboacuten 40 Fontiboacuten 430
Tunjuelito 500 Tunjuelito 500
Recomendacioacuten 3
Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos
se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de
clasificacioacutenrdquo
Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad
Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10
Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20
Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40
Recomendacioacuten 4
Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos
correspondan a valores conocidos como verdaderos El elemento de calidad asociado se
denomina ldquoexactitud de atributos cuantitativosrdquo
Localidad Mes Temperatura Localidad Mes Temperatura
Chapinero Enero 7degC Chapinero Enero 7degC
Suba Agosto -15degC Suba Agosto 15degC
Tunjuelito Abril 60degC Tunjuelito Abril 16degC
Clasificacioacuten inconsistente
Formato inconsistente
Valor inconsistente
25 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 5
Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por
ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que
las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad
asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo
Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro
00 20580101 00 20180101
01 20180102 01 20180102
126 20510403 126 20180103
20 20180104 20 20180104
Recomendacioacuten 6
Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes
de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se
denomina ldquoconsistencia temporalrdquo
Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio
Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231
Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231
Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112
Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112
Recomendacioacuten 7
Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta
corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud
posicionalrdquo
Eventos Deportivos Lugar Eventos Deportivos Lugar
Evento 1 AK 30 25 90 Evento 1 AK 30 25 90
Evento 2 AC 63 215 20 Evento 2 Parque La Florida
Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar
Fecha
inconsistente
Fechas no secuenciales
Lugar inexistente
26 Buenas praacutecticas para la publicacioacuten de datos
9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten
El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de
alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una
institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las
variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a
cabo los traacutemites de una entidad etc
Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un
espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados
Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten
asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un
establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario
identificar la localizacioacuten del dato publicado
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean puedan compartir en maacutes plataformas
Que los usuarios puedan visualizar mis datos en un mapa
iexclRecomendaciones
Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o
lugares geograacuteficos
Ejemplo 1
Incluya direcciones que permitan localizar espacialmente sus datos
Programa Direccioacuten
Registro de atencioacuten a la ciudadaniacutea CL 138 108 16
Centro de autocuidado KR 18 D 77 A 11 SUR
Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46
Centro de autocuidado KR 18 D 73 A 33 SUR
19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico
27 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 2
Utilice coordenadas para indicar la ubicacioacuten de sus datos
EPS Coordenada X Coordenada Y
EPS Convida 9087496334 1051342164
Capital Salud EPS 986321006 954875808
EPS Famisanar 9742508812 8837031501
Aliansalud EPS 9716943356 9659706891
Salud Total EPS 9215624975 9625189518
Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro
de su metadato el Sistema de referencia empleado
MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686
MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116
MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458
Ejemplo 3
Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute
Usuario Vacunado Lugar de Vacunacioacuten
Usuario 1 BOSQUE IZQUIERDO
Usuario 2 LAGUNITAS URBANO
Usuario 3 LA CAPUCHINA
Usuario 4 SAN JOSE SUR
Usuario 5 VENECIA
28 Buenas praacutecticas para la publicacioacuten de datos
10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado
Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el
dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los
usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la
citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el
formato de este
En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero
de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de
su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la
informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado
y reconocido faacutecilmente entre los demaacutes datos
Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de
identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por
cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta
gestioacuten y reutilizacioacuten de sus datos
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean compartidos en maacutes plataformas
Que mis datos puedan vincularse a otros datos en el entorno Web
Que mis datos sean encontrados usados y citados inequiacutevocamente
Garantizar y monitorear la reutilizacioacuten de mis datos
Reducir del uso erroacuteneo de mis datos
iexclRecomendaciones
Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar
Utilice siempre el identificador asignado para publicar sus datos
29 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos
httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la
creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la
asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten
de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito
garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar
descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando
asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten
geograacutefica
Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems
publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace
referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades
territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el
planeamiento del suelo urbano de expansioacuten y ruralrdquo
30 Buenas praacutecticas para la publicacioacuten de datos
OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS
Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten
Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado
Nivel Baacutesico
En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)
Nivel Intermedio
Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)
Nivel Avanzado
Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)
31 Buenas praacutecticas para la publicacioacuten de datos
REFERENCIAS
Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best
Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp
Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices
for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp
Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington
Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec
Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI
Recommendation URL httpdublincoreorgdocumentsdcmi-terms
Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C
Recommendation URL httpswwww3orgTRvocab-dcat
ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de
2014 International Standard
ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers
noviembre de 2009 International Standard
ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013
International Standard
Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best
Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp
T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax
Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986
World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg
W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second
Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-
overview
W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado
el 12 de septiembre de 2018
20 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
Para el conjunto de datos ldquoEstablecimientos Educativos en Bogotaacuterdquo publicariacuteamos un
diccionario de datos similar al siguiente
Nombre del atributo Definicioacuten Tipo de dato
Unidad de Medida
Dominio
Coacutedigo del establecimiento
Coacutedigo DANE asignado al Institucioacuten Educativa Decimal
Nombre del establecimiento
Nombre de la Institucioacuten Educativa Cadena de Caracteres
Aacuterea construida del establecimiento
Aacuterea construida de la Institucioacuten Educativa Decimal Metros
cuadrados
Sector
Clasificacioacuten asignada seguacuten la naturaleza juriacutedica la cual define las principales caracteriacutesticas que desde lo juriacutedico - administrativo y tiene que ver con el origen de su creacioacuten
Entero
EESector
No podriacuteamos olvidar detallar el dominio asociado
Atributo Nombre del Dominio Coacutedigo Definicioacuten
EESector
Oficial 1
Es una institucioacuten donde su naturaleza de servicio puacuteblico cultural y su funcioacuten social le es inherente cumpliendo con las disposiciones legales y estatutarias que las rigen donde sus rentas se conservan y se aplican debidamente
Privado 2
Es una institucioacuten constituida como persona juriacutedica de utilidad comuacuten donde sus rentas se conservan y se aplican debidamente y que en todo lo esencial se cumple con la voluntad de sus fundadores
21 Buenas praacutecticas para la publicacioacuten de datos
7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos
Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para
acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que
conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como
cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o
software
En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos
publicados se proporcionen recursos o documentos adicionales que puedan ser consultados
yo descargados traveacutes de enlaces o links de otro sitio Web
Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los
procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los
documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad
entre otros
iquestQueacute logro
Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos
Que los usuarios comprendan mejor mis datos
Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios
iexclRecomendaciones
Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el
horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del
dato
No olvide vincular o registrar esta informacioacuten en el metadato
16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp
22 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos
Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318
Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57
Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30
Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217
Ejemplo 2
La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en
httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos
o Gestioacuten de los humedales
o Poliacutetica de Humedales del Distrito Capital
o Normatividad
o Planes de Manejo Ambiental
o Comiteacute distrital de humedales documentos de consulta normatividad
23 Buenas praacutecticas para la publicacioacuten de datos
8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza
La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten
juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado
Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para
satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas
y especificaciones establecidas
Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades
de estos sin embargo en este aparte citaremos los elementos principales que usted o su
entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad
Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de
los datos espaciales
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que los usuarios hablen bien de mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean maacutes compartidos
Que mis datos sean maacutes confiables
Recomendacioacuten 1
Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten
descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten
corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Suba 200 Tunjuelito 500
Ameacutericas 100
850
Tunjuelito 500
18 httpdleraeesid=6nVpk8P|6nXVL1Z
Campo duplicado
Campo inconsistente
Campo vaciacuteo
24 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 2
Identifique y transforme si es necesario los datos que hayan sido registrados en un formato
diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida
del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de
formatordquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Tunjuelito 5008 Tunjuelito 500
Fontiboacuten 40 Fontiboacuten 430
Tunjuelito 500 Tunjuelito 500
Recomendacioacuten 3
Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos
se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de
clasificacioacutenrdquo
Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad
Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10
Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20
Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40
Recomendacioacuten 4
Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos
correspondan a valores conocidos como verdaderos El elemento de calidad asociado se
denomina ldquoexactitud de atributos cuantitativosrdquo
Localidad Mes Temperatura Localidad Mes Temperatura
Chapinero Enero 7degC Chapinero Enero 7degC
Suba Agosto -15degC Suba Agosto 15degC
Tunjuelito Abril 60degC Tunjuelito Abril 16degC
Clasificacioacuten inconsistente
Formato inconsistente
Valor inconsistente
25 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 5
Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por
ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que
las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad
asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo
Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro
00 20580101 00 20180101
01 20180102 01 20180102
126 20510403 126 20180103
20 20180104 20 20180104
Recomendacioacuten 6
Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes
de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se
denomina ldquoconsistencia temporalrdquo
Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio
Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231
Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231
Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112
Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112
Recomendacioacuten 7
Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta
corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud
posicionalrdquo
Eventos Deportivos Lugar Eventos Deportivos Lugar
Evento 1 AK 30 25 90 Evento 1 AK 30 25 90
Evento 2 AC 63 215 20 Evento 2 Parque La Florida
Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar
Fecha
inconsistente
Fechas no secuenciales
Lugar inexistente
26 Buenas praacutecticas para la publicacioacuten de datos
9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten
El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de
alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una
institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las
variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a
cabo los traacutemites de una entidad etc
Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un
espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados
Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten
asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un
establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario
identificar la localizacioacuten del dato publicado
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean puedan compartir en maacutes plataformas
Que los usuarios puedan visualizar mis datos en un mapa
iexclRecomendaciones
Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o
lugares geograacuteficos
Ejemplo 1
Incluya direcciones que permitan localizar espacialmente sus datos
Programa Direccioacuten
Registro de atencioacuten a la ciudadaniacutea CL 138 108 16
Centro de autocuidado KR 18 D 77 A 11 SUR
Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46
Centro de autocuidado KR 18 D 73 A 33 SUR
19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico
27 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 2
Utilice coordenadas para indicar la ubicacioacuten de sus datos
EPS Coordenada X Coordenada Y
EPS Convida 9087496334 1051342164
Capital Salud EPS 986321006 954875808
EPS Famisanar 9742508812 8837031501
Aliansalud EPS 9716943356 9659706891
Salud Total EPS 9215624975 9625189518
Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro
de su metadato el Sistema de referencia empleado
MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686
MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116
MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458
Ejemplo 3
Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute
Usuario Vacunado Lugar de Vacunacioacuten
Usuario 1 BOSQUE IZQUIERDO
Usuario 2 LAGUNITAS URBANO
Usuario 3 LA CAPUCHINA
Usuario 4 SAN JOSE SUR
Usuario 5 VENECIA
28 Buenas praacutecticas para la publicacioacuten de datos
10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado
Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el
dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los
usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la
citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el
formato de este
En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero
de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de
su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la
informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado
y reconocido faacutecilmente entre los demaacutes datos
Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de
identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por
cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta
gestioacuten y reutilizacioacuten de sus datos
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean compartidos en maacutes plataformas
Que mis datos puedan vincularse a otros datos en el entorno Web
Que mis datos sean encontrados usados y citados inequiacutevocamente
Garantizar y monitorear la reutilizacioacuten de mis datos
Reducir del uso erroacuteneo de mis datos
iexclRecomendaciones
Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar
Utilice siempre el identificador asignado para publicar sus datos
29 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos
httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la
creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la
asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten
de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito
garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar
descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando
asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten
geograacutefica
Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems
publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace
referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades
territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el
planeamiento del suelo urbano de expansioacuten y ruralrdquo
30 Buenas praacutecticas para la publicacioacuten de datos
OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS
Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten
Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado
Nivel Baacutesico
En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)
Nivel Intermedio
Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)
Nivel Avanzado
Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)
31 Buenas praacutecticas para la publicacioacuten de datos
REFERENCIAS
Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best
Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp
Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices
for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp
Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington
Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec
Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI
Recommendation URL httpdublincoreorgdocumentsdcmi-terms
Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C
Recommendation URL httpswwww3orgTRvocab-dcat
ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de
2014 International Standard
ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers
noviembre de 2009 International Standard
ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013
International Standard
Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best
Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp
T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax
Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986
World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg
W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second
Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-
overview
W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado
el 12 de septiembre de 2018
21 Buenas praacutecticas para la publicacioacuten de datos
7 Acompantildear la publicacioacuten de los datos con enlaces a otros recursos
Un enlace es definido como una secuencia de caracteres que se utiliza como direccioacuten para
acceder a informacioacuten adicional16 maacutes sencillo puede definirse como una expresioacuten que
conecta una cierta informacioacuten con otra17Ahora bien un recurso se puede entender como
cualquier medio que satisfaga una necesidad por ejemplo datos servicios documentos o
software
En teacuterminos generales se sugiere que para facilitar al usuario la comprensioacuten de los datos
publicados se proporcionen recursos o documentos adicionales que puedan ser consultados
yo descargados traveacutes de enlaces o links de otro sitio Web
Dentro de los recursos adicionales que pueden publicarse para acompantildear el dato estaacuten los
procedimientos de captura del dato los cataacutelogos de objetos las especificaciones teacutecnicas los
documentos normativos los cataacutelogos de simbologiacutea los reportes de evaluacioacuten de calidad
entre otros
iquestQueacute logro
Mejorar la consulta utilizacioacuten y reutilizacioacuten de mis datos
Que los usuarios comprendan mejor mis datos
Que mis datos sean compartidos e intercambiados por un mayor nuacutemero de usuarios
iexclRecomendaciones
Disponga informacioacuten adicional de sus datos que le permita a los usuarios ampliar el
horizonte de las aplicaciones y funcionalidades en las que pueda utilizar y explotar del
dato
No olvide vincular o registrar esta informacioacuten en el metadato
16 httpdleraeesid=FTVRKyj 17 httpssistemascomenlacephp
22 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos
Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318
Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57
Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30
Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217
Ejemplo 2
La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en
httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos
o Gestioacuten de los humedales
o Poliacutetica de Humedales del Distrito Capital
o Normatividad
o Planes de Manejo Ambiental
o Comiteacute distrital de humedales documentos de consulta normatividad
23 Buenas praacutecticas para la publicacioacuten de datos
8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza
La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten
juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado
Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para
satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas
y especificaciones establecidas
Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades
de estos sin embargo en este aparte citaremos los elementos principales que usted o su
entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad
Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de
los datos espaciales
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que los usuarios hablen bien de mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean maacutes compartidos
Que mis datos sean maacutes confiables
Recomendacioacuten 1
Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten
descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten
corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Suba 200 Tunjuelito 500
Ameacutericas 100
850
Tunjuelito 500
18 httpdleraeesid=6nVpk8P|6nXVL1Z
Campo duplicado
Campo inconsistente
Campo vaciacuteo
24 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 2
Identifique y transforme si es necesario los datos que hayan sido registrados en un formato
diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida
del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de
formatordquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Tunjuelito 5008 Tunjuelito 500
Fontiboacuten 40 Fontiboacuten 430
Tunjuelito 500 Tunjuelito 500
Recomendacioacuten 3
Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos
se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de
clasificacioacutenrdquo
Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad
Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10
Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20
Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40
Recomendacioacuten 4
Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos
correspondan a valores conocidos como verdaderos El elemento de calidad asociado se
denomina ldquoexactitud de atributos cuantitativosrdquo
Localidad Mes Temperatura Localidad Mes Temperatura
Chapinero Enero 7degC Chapinero Enero 7degC
Suba Agosto -15degC Suba Agosto 15degC
Tunjuelito Abril 60degC Tunjuelito Abril 16degC
Clasificacioacuten inconsistente
Formato inconsistente
Valor inconsistente
25 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 5
Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por
ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que
las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad
asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo
Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro
00 20580101 00 20180101
01 20180102 01 20180102
126 20510403 126 20180103
20 20180104 20 20180104
Recomendacioacuten 6
Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes
de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se
denomina ldquoconsistencia temporalrdquo
Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio
Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231
Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231
Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112
Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112
Recomendacioacuten 7
Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta
corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud
posicionalrdquo
Eventos Deportivos Lugar Eventos Deportivos Lugar
Evento 1 AK 30 25 90 Evento 1 AK 30 25 90
Evento 2 AC 63 215 20 Evento 2 Parque La Florida
Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar
Fecha
inconsistente
Fechas no secuenciales
Lugar inexistente
26 Buenas praacutecticas para la publicacioacuten de datos
9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten
El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de
alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una
institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las
variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a
cabo los traacutemites de una entidad etc
Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un
espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados
Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten
asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un
establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario
identificar la localizacioacuten del dato publicado
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean puedan compartir en maacutes plataformas
Que los usuarios puedan visualizar mis datos en un mapa
iexclRecomendaciones
Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o
lugares geograacuteficos
Ejemplo 1
Incluya direcciones que permitan localizar espacialmente sus datos
Programa Direccioacuten
Registro de atencioacuten a la ciudadaniacutea CL 138 108 16
Centro de autocuidado KR 18 D 77 A 11 SUR
Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46
Centro de autocuidado KR 18 D 73 A 33 SUR
19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico
27 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 2
Utilice coordenadas para indicar la ubicacioacuten de sus datos
EPS Coordenada X Coordenada Y
EPS Convida 9087496334 1051342164
Capital Salud EPS 986321006 954875808
EPS Famisanar 9742508812 8837031501
Aliansalud EPS 9716943356 9659706891
Salud Total EPS 9215624975 9625189518
Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro
de su metadato el Sistema de referencia empleado
MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686
MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116
MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458
Ejemplo 3
Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute
Usuario Vacunado Lugar de Vacunacioacuten
Usuario 1 BOSQUE IZQUIERDO
Usuario 2 LAGUNITAS URBANO
Usuario 3 LA CAPUCHINA
Usuario 4 SAN JOSE SUR
Usuario 5 VENECIA
28 Buenas praacutecticas para la publicacioacuten de datos
10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado
Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el
dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los
usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la
citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el
formato de este
En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero
de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de
su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la
informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado
y reconocido faacutecilmente entre los demaacutes datos
Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de
identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por
cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta
gestioacuten y reutilizacioacuten de sus datos
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean compartidos en maacutes plataformas
Que mis datos puedan vincularse a otros datos en el entorno Web
Que mis datos sean encontrados usados y citados inequiacutevocamente
Garantizar y monitorear la reutilizacioacuten de mis datos
Reducir del uso erroacuteneo de mis datos
iexclRecomendaciones
Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar
Utilice siempre el identificador asignado para publicar sus datos
29 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos
httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la
creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la
asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten
de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito
garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar
descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando
asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten
geograacutefica
Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems
publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace
referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades
territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el
planeamiento del suelo urbano de expansioacuten y ruralrdquo
30 Buenas praacutecticas para la publicacioacuten de datos
OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS
Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten
Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado
Nivel Baacutesico
En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)
Nivel Intermedio
Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)
Nivel Avanzado
Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)
31 Buenas praacutecticas para la publicacioacuten de datos
REFERENCIAS
Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best
Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp
Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices
for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp
Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington
Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec
Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI
Recommendation URL httpdublincoreorgdocumentsdcmi-terms
Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C
Recommendation URL httpswwww3orgTRvocab-dcat
ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de
2014 International Standard
ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers
noviembre de 2009 International Standard
ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013
International Standard
Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best
Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp
T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax
Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986
World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg
W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second
Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-
overview
W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado
el 12 de septiembre de 2018
22 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 1
El ldquoMapa de Referencia para Bogotaacuterdquo publicado en httpswwwidecagovcoesserviciosmapa-de-referencia tiene publicados varios enlaces a otros recursos
Especificacioacuten teacutecnica para la elaboracioacuten del Mapa de Referencia para Bogotaacute DC V0318
Cataacutelogo de Objetos del Mapa de Referencia de Bogotaacute DC V 57
Cataacutelogo de Representacioacuten del Mapa de Referencia de Bogotaacute DC V30
Reporte de evaluacioacuten de calidad generado al Mapa de Referencia del Distrito Capital V1217
Ejemplo 2
La informacioacuten de los ldquohumedales de Bogotaacuterdquo publicada en
httpambientebogotagovcowebsdahumedales tiene publicados enlaces a otros recursos
o Gestioacuten de los humedales
o Poliacutetica de Humedales del Distrito Capital
o Normatividad
o Planes de Manejo Ambiental
o Comiteacute distrital de humedales documentos de consulta normatividad
23 Buenas praacutecticas para la publicacioacuten de datos
8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza
La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten
juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado
Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para
satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas
y especificaciones establecidas
Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades
de estos sin embargo en este aparte citaremos los elementos principales que usted o su
entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad
Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de
los datos espaciales
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que los usuarios hablen bien de mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean maacutes compartidos
Que mis datos sean maacutes confiables
Recomendacioacuten 1
Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten
descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten
corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Suba 200 Tunjuelito 500
Ameacutericas 100
850
Tunjuelito 500
18 httpdleraeesid=6nVpk8P|6nXVL1Z
Campo duplicado
Campo inconsistente
Campo vaciacuteo
24 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 2
Identifique y transforme si es necesario los datos que hayan sido registrados en un formato
diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida
del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de
formatordquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Tunjuelito 5008 Tunjuelito 500
Fontiboacuten 40 Fontiboacuten 430
Tunjuelito 500 Tunjuelito 500
Recomendacioacuten 3
Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos
se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de
clasificacioacutenrdquo
Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad
Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10
Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20
Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40
Recomendacioacuten 4
Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos
correspondan a valores conocidos como verdaderos El elemento de calidad asociado se
denomina ldquoexactitud de atributos cuantitativosrdquo
Localidad Mes Temperatura Localidad Mes Temperatura
Chapinero Enero 7degC Chapinero Enero 7degC
Suba Agosto -15degC Suba Agosto 15degC
Tunjuelito Abril 60degC Tunjuelito Abril 16degC
Clasificacioacuten inconsistente
Formato inconsistente
Valor inconsistente
25 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 5
Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por
ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que
las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad
asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo
Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro
00 20580101 00 20180101
01 20180102 01 20180102
126 20510403 126 20180103
20 20180104 20 20180104
Recomendacioacuten 6
Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes
de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se
denomina ldquoconsistencia temporalrdquo
Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio
Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231
Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231
Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112
Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112
Recomendacioacuten 7
Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta
corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud
posicionalrdquo
Eventos Deportivos Lugar Eventos Deportivos Lugar
Evento 1 AK 30 25 90 Evento 1 AK 30 25 90
Evento 2 AC 63 215 20 Evento 2 Parque La Florida
Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar
Fecha
inconsistente
Fechas no secuenciales
Lugar inexistente
26 Buenas praacutecticas para la publicacioacuten de datos
9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten
El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de
alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una
institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las
variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a
cabo los traacutemites de una entidad etc
Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un
espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados
Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten
asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un
establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario
identificar la localizacioacuten del dato publicado
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean puedan compartir en maacutes plataformas
Que los usuarios puedan visualizar mis datos en un mapa
iexclRecomendaciones
Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o
lugares geograacuteficos
Ejemplo 1
Incluya direcciones que permitan localizar espacialmente sus datos
Programa Direccioacuten
Registro de atencioacuten a la ciudadaniacutea CL 138 108 16
Centro de autocuidado KR 18 D 77 A 11 SUR
Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46
Centro de autocuidado KR 18 D 73 A 33 SUR
19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico
27 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 2
Utilice coordenadas para indicar la ubicacioacuten de sus datos
EPS Coordenada X Coordenada Y
EPS Convida 9087496334 1051342164
Capital Salud EPS 986321006 954875808
EPS Famisanar 9742508812 8837031501
Aliansalud EPS 9716943356 9659706891
Salud Total EPS 9215624975 9625189518
Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro
de su metadato el Sistema de referencia empleado
MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686
MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116
MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458
Ejemplo 3
Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute
Usuario Vacunado Lugar de Vacunacioacuten
Usuario 1 BOSQUE IZQUIERDO
Usuario 2 LAGUNITAS URBANO
Usuario 3 LA CAPUCHINA
Usuario 4 SAN JOSE SUR
Usuario 5 VENECIA
28 Buenas praacutecticas para la publicacioacuten de datos
10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado
Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el
dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los
usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la
citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el
formato de este
En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero
de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de
su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la
informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado
y reconocido faacutecilmente entre los demaacutes datos
Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de
identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por
cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta
gestioacuten y reutilizacioacuten de sus datos
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean compartidos en maacutes plataformas
Que mis datos puedan vincularse a otros datos en el entorno Web
Que mis datos sean encontrados usados y citados inequiacutevocamente
Garantizar y monitorear la reutilizacioacuten de mis datos
Reducir del uso erroacuteneo de mis datos
iexclRecomendaciones
Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar
Utilice siempre el identificador asignado para publicar sus datos
29 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos
httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la
creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la
asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten
de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito
garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar
descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando
asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten
geograacutefica
Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems
publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace
referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades
territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el
planeamiento del suelo urbano de expansioacuten y ruralrdquo
30 Buenas praacutecticas para la publicacioacuten de datos
OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS
Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten
Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado
Nivel Baacutesico
En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)
Nivel Intermedio
Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)
Nivel Avanzado
Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)
31 Buenas praacutecticas para la publicacioacuten de datos
REFERENCIAS
Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best
Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp
Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices
for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp
Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington
Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec
Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI
Recommendation URL httpdublincoreorgdocumentsdcmi-terms
Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C
Recommendation URL httpswwww3orgTRvocab-dcat
ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de
2014 International Standard
ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers
noviembre de 2009 International Standard
ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013
International Standard
Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best
Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp
T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax
Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986
World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg
W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second
Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-
overview
W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado
el 12 de septiembre de 2018
23 Buenas praacutecticas para la publicacioacuten de datos
8 Depurar sus datos antes de publicarlos para garantizar su calidad y aumentar su confianza
La calidad estaacute definida como el conjunto de propiedades inherentes a algo que permiten
juzgar su valor18 para el caso que nos concierne este algo hace referencia al dato publicado
Ahora bien la calidad tambieacuten es entendida como la capacidad del dato publicado para
satisfacer los requerimientos y las necesidades de los usuarios respetando una serie de normas
y especificaciones establecidas
Actualmente existen muacuteltiples elementos de calidad de los datos que identifican las cualidades
de estos sin embargo en este aparte citaremos los elementos principales que usted o su
entidad deben tener en cuenta para publicar sus datos con un estaacutendar miacutenimo de calidad
Para maacutes informacioacuten consulte el Procedimiento para evaluar y reportar la calidad de
los datos espaciales
iquestQueacute logro
Que mis datos sean consultados utilizados y reutilizados por maacutes usuarios
Que los usuarios hablen bien de mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean maacutes compartidos
Que mis datos sean maacutes confiables
Recomendacioacuten 1
Establezca si dentro de su conjunto de datos existen capos vaciacuteos o nulos con informacioacuten
descontextualizada sobrante o duplicada Si existen compleacutetelos o elimiacutenelos seguacuten
corresponda antes de la publicacioacuten El elemento de calidad asociado se denomina ldquototalidadrdquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Suba 200 Tunjuelito 500
Ameacutericas 100
850
Tunjuelito 500
18 httpdleraeesid=6nVpk8P|6nXVL1Z
Campo duplicado
Campo inconsistente
Campo vaciacuteo
24 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 2
Identifique y transforme si es necesario los datos que hayan sido registrados en un formato
diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida
del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de
formatordquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Tunjuelito 5008 Tunjuelito 500
Fontiboacuten 40 Fontiboacuten 430
Tunjuelito 500 Tunjuelito 500
Recomendacioacuten 3
Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos
se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de
clasificacioacutenrdquo
Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad
Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10
Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20
Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40
Recomendacioacuten 4
Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos
correspondan a valores conocidos como verdaderos El elemento de calidad asociado se
denomina ldquoexactitud de atributos cuantitativosrdquo
Localidad Mes Temperatura Localidad Mes Temperatura
Chapinero Enero 7degC Chapinero Enero 7degC
Suba Agosto -15degC Suba Agosto 15degC
Tunjuelito Abril 60degC Tunjuelito Abril 16degC
Clasificacioacuten inconsistente
Formato inconsistente
Valor inconsistente
25 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 5
Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por
ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que
las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad
asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo
Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro
00 20580101 00 20180101
01 20180102 01 20180102
126 20510403 126 20180103
20 20180104 20 20180104
Recomendacioacuten 6
Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes
de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se
denomina ldquoconsistencia temporalrdquo
Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio
Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231
Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231
Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112
Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112
Recomendacioacuten 7
Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta
corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud
posicionalrdquo
Eventos Deportivos Lugar Eventos Deportivos Lugar
Evento 1 AK 30 25 90 Evento 1 AK 30 25 90
Evento 2 AC 63 215 20 Evento 2 Parque La Florida
Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar
Fecha
inconsistente
Fechas no secuenciales
Lugar inexistente
26 Buenas praacutecticas para la publicacioacuten de datos
9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten
El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de
alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una
institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las
variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a
cabo los traacutemites de una entidad etc
Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un
espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados
Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten
asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un
establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario
identificar la localizacioacuten del dato publicado
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean puedan compartir en maacutes plataformas
Que los usuarios puedan visualizar mis datos en un mapa
iexclRecomendaciones
Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o
lugares geograacuteficos
Ejemplo 1
Incluya direcciones que permitan localizar espacialmente sus datos
Programa Direccioacuten
Registro de atencioacuten a la ciudadaniacutea CL 138 108 16
Centro de autocuidado KR 18 D 77 A 11 SUR
Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46
Centro de autocuidado KR 18 D 73 A 33 SUR
19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico
27 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 2
Utilice coordenadas para indicar la ubicacioacuten de sus datos
EPS Coordenada X Coordenada Y
EPS Convida 9087496334 1051342164
Capital Salud EPS 986321006 954875808
EPS Famisanar 9742508812 8837031501
Aliansalud EPS 9716943356 9659706891
Salud Total EPS 9215624975 9625189518
Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro
de su metadato el Sistema de referencia empleado
MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686
MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116
MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458
Ejemplo 3
Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute
Usuario Vacunado Lugar de Vacunacioacuten
Usuario 1 BOSQUE IZQUIERDO
Usuario 2 LAGUNITAS URBANO
Usuario 3 LA CAPUCHINA
Usuario 4 SAN JOSE SUR
Usuario 5 VENECIA
28 Buenas praacutecticas para la publicacioacuten de datos
10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado
Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el
dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los
usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la
citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el
formato de este
En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero
de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de
su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la
informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado
y reconocido faacutecilmente entre los demaacutes datos
Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de
identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por
cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta
gestioacuten y reutilizacioacuten de sus datos
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean compartidos en maacutes plataformas
Que mis datos puedan vincularse a otros datos en el entorno Web
Que mis datos sean encontrados usados y citados inequiacutevocamente
Garantizar y monitorear la reutilizacioacuten de mis datos
Reducir del uso erroacuteneo de mis datos
iexclRecomendaciones
Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar
Utilice siempre el identificador asignado para publicar sus datos
29 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos
httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la
creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la
asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten
de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito
garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar
descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando
asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten
geograacutefica
Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems
publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace
referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades
territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el
planeamiento del suelo urbano de expansioacuten y ruralrdquo
30 Buenas praacutecticas para la publicacioacuten de datos
OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS
Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten
Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado
Nivel Baacutesico
En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)
Nivel Intermedio
Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)
Nivel Avanzado
Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)
31 Buenas praacutecticas para la publicacioacuten de datos
REFERENCIAS
Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best
Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp
Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices
for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp
Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington
Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec
Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI
Recommendation URL httpdublincoreorgdocumentsdcmi-terms
Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C
Recommendation URL httpswwww3orgTRvocab-dcat
ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de
2014 International Standard
ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers
noviembre de 2009 International Standard
ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013
International Standard
Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best
Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp
T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax
Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986
World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg
W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second
Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-
overview
W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado
el 12 de septiembre de 2018
24 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 2
Identifique y transforme si es necesario los datos que hayan sido registrados en un formato
diferente al establecido para su conjunto de datos Es decir estandarice el formato de salida
del dato que va a publicar El elemento de calidad asociado se denomina ldquoconsistencia de
formatordquo
Localidad Atendidos Localidad Atendidos
Suba 200 Suba 200
Tunjuelito 5008 Tunjuelito 500
Fontiboacuten 40 Fontiboacuten 430
Tunjuelito 500 Tunjuelito 500
Recomendacioacuten 3
Si sus datos tienen alguacuten tipo de clasificacioacuten o rangos previo a la publicacioacuten valide que estos
se hayan registrado correctamente El elemento de calidad asociado se denomina ldquoexactitud de
clasificacioacutenrdquo
Geacutenero Edad Rango de Edad Geacutenero Edad Rango de Edad
Femenino 5 0 lt Edad le 10 Femenino 5 0 lt Edad le 10
Masculino 15 0 lt Edad le 10 Masculino 15 10 lt Edad le 20
Femenino 35 40 lt Edad le 50 Femenino 35 30 lt Edad le 40
Recomendacioacuten 4
Si sus datos representan atributos cuantitativos verifique antes de la publicacioacuten que estos
correspondan a valores conocidos como verdaderos El elemento de calidad asociado se
denomina ldquoexactitud de atributos cuantitativosrdquo
Localidad Mes Temperatura Localidad Mes Temperatura
Chapinero Enero 7degC Chapinero Enero 7degC
Suba Agosto -15degC Suba Agosto 15degC
Tunjuelito Abril 60degC Tunjuelito Abril 16degC
Clasificacioacuten inconsistente
Formato inconsistente
Valor inconsistente
25 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 5
Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por
ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que
las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad
asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo
Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro
00 20580101 00 20180101
01 20180102 01 20180102
126 20510403 126 20180103
20 20180104 20 20180104
Recomendacioacuten 6
Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes
de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se
denomina ldquoconsistencia temporalrdquo
Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio
Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231
Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231
Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112
Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112
Recomendacioacuten 7
Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta
corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud
posicionalrdquo
Eventos Deportivos Lugar Eventos Deportivos Lugar
Evento 1 AK 30 25 90 Evento 1 AK 30 25 90
Evento 2 AC 63 215 20 Evento 2 Parque La Florida
Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar
Fecha
inconsistente
Fechas no secuenciales
Lugar inexistente
26 Buenas praacutecticas para la publicacioacuten de datos
9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten
El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de
alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una
institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las
variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a
cabo los traacutemites de una entidad etc
Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un
espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados
Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten
asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un
establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario
identificar la localizacioacuten del dato publicado
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean puedan compartir en maacutes plataformas
Que los usuarios puedan visualizar mis datos en un mapa
iexclRecomendaciones
Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o
lugares geograacuteficos
Ejemplo 1
Incluya direcciones que permitan localizar espacialmente sus datos
Programa Direccioacuten
Registro de atencioacuten a la ciudadaniacutea CL 138 108 16
Centro de autocuidado KR 18 D 77 A 11 SUR
Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46
Centro de autocuidado KR 18 D 73 A 33 SUR
19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico
27 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 2
Utilice coordenadas para indicar la ubicacioacuten de sus datos
EPS Coordenada X Coordenada Y
EPS Convida 9087496334 1051342164
Capital Salud EPS 986321006 954875808
EPS Famisanar 9742508812 8837031501
Aliansalud EPS 9716943356 9659706891
Salud Total EPS 9215624975 9625189518
Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro
de su metadato el Sistema de referencia empleado
MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686
MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116
MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458
Ejemplo 3
Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute
Usuario Vacunado Lugar de Vacunacioacuten
Usuario 1 BOSQUE IZQUIERDO
Usuario 2 LAGUNITAS URBANO
Usuario 3 LA CAPUCHINA
Usuario 4 SAN JOSE SUR
Usuario 5 VENECIA
28 Buenas praacutecticas para la publicacioacuten de datos
10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado
Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el
dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los
usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la
citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el
formato de este
En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero
de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de
su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la
informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado
y reconocido faacutecilmente entre los demaacutes datos
Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de
identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por
cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta
gestioacuten y reutilizacioacuten de sus datos
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean compartidos en maacutes plataformas
Que mis datos puedan vincularse a otros datos en el entorno Web
Que mis datos sean encontrados usados y citados inequiacutevocamente
Garantizar y monitorear la reutilizacioacuten de mis datos
Reducir del uso erroacuteneo de mis datos
iexclRecomendaciones
Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar
Utilice siempre el identificador asignado para publicar sus datos
29 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos
httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la
creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la
asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten
de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito
garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar
descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando
asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten
geograacutefica
Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems
publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace
referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades
territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el
planeamiento del suelo urbano de expansioacuten y ruralrdquo
30 Buenas praacutecticas para la publicacioacuten de datos
OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS
Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten
Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado
Nivel Baacutesico
En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)
Nivel Intermedio
Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)
Nivel Avanzado
Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)
31 Buenas praacutecticas para la publicacioacuten de datos
REFERENCIAS
Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best
Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp
Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices
for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp
Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington
Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec
Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI
Recommendation URL httpdublincoreorgdocumentsdcmi-terms
Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C
Recommendation URL httpswwww3orgTRvocab-dcat
ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de
2014 International Standard
ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers
noviembre de 2009 International Standard
ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013
International Standard
Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best
Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp
T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax
Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986
World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg
W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second
Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-
overview
W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado
el 12 de septiembre de 2018
25 Buenas praacutecticas para la publicacioacuten de datos
Recomendacioacuten 5
Si los datos a publicar tienen asociadas fechas de captura o recoleccioacuten de informacioacuten (Por
ejemplo registro de incidentes registro de vacunacioacuten conteo de vehiacuteculos etc) valide que
las fechas registradas coincidan con la fecha del evento capturado El elemento de calidad
asociado se denomina ldquoexactitud de la medicioacuten del tiempordquo
Precipitacioacuten (mm) Fecha de registro Precipitacioacuten (mm) Fecha de registro
00 20580101 00 20180101
01 20180102 01 20180102
126 20510403 126 20180103
20 20180104 20 20180104
Recomendacioacuten 6
Cuando sus datos reflejen informacioacuten determinada por un orden de eventos garantice antes
de la publicacioacuten que este orden sea el adecuado El elemento de calidad asociado se
denomina ldquoconsistencia temporalrdquo
Usuario Escolaridad Periodo de Estudio Usuario Escolaridad Periodo de Estudio
Usuario 1 Preescolar 20030101 ndash 20051231 Usuario 1 Preescolar 20030101 ndash 20051231
Usuario 1 Primaria 20030101 ndash 20101231 Usuario 1 Primaria 20060101 ndash 20101231
Usuario 1 Secundaria 20060101 ndash 20163112 Usuario 1 Secundaria 20110101 ndash 20143112
Usuario 1 Media 20150101 - 20163112 Usuario 1 Media 20150101 - 20163112
Recomendacioacuten 7
Si sus datos incluyen alguna ubicacioacuten (direccioacuten lugar coordenadas) verifique que esta
corresponda a la ubicacioacuten real El elemento de calidad asociado se denomina ldquoexactitud
posicionalrdquo
Eventos Deportivos Lugar Eventos Deportivos Lugar
Evento 1 AK 30 25 90 Evento 1 AK 30 25 90
Evento 2 AC 63 215 20 Evento 2 Parque La Florida
Evento 3 Parque Simoacuten Boliacutevar Evento 3 Parque Simoacuten Boliacutevar
Fecha
inconsistente
Fechas no secuenciales
Lugar inexistente
26 Buenas praacutecticas para la publicacioacuten de datos
9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten
El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de
alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una
institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las
variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a
cabo los traacutemites de una entidad etc
Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un
espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados
Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten
asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un
establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario
identificar la localizacioacuten del dato publicado
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean puedan compartir en maacutes plataformas
Que los usuarios puedan visualizar mis datos en un mapa
iexclRecomendaciones
Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o
lugares geograacuteficos
Ejemplo 1
Incluya direcciones que permitan localizar espacialmente sus datos
Programa Direccioacuten
Registro de atencioacuten a la ciudadaniacutea CL 138 108 16
Centro de autocuidado KR 18 D 77 A 11 SUR
Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46
Centro de autocuidado KR 18 D 73 A 33 SUR
19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico
27 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 2
Utilice coordenadas para indicar la ubicacioacuten de sus datos
EPS Coordenada X Coordenada Y
EPS Convida 9087496334 1051342164
Capital Salud EPS 986321006 954875808
EPS Famisanar 9742508812 8837031501
Aliansalud EPS 9716943356 9659706891
Salud Total EPS 9215624975 9625189518
Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro
de su metadato el Sistema de referencia empleado
MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686
MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116
MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458
Ejemplo 3
Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute
Usuario Vacunado Lugar de Vacunacioacuten
Usuario 1 BOSQUE IZQUIERDO
Usuario 2 LAGUNITAS URBANO
Usuario 3 LA CAPUCHINA
Usuario 4 SAN JOSE SUR
Usuario 5 VENECIA
28 Buenas praacutecticas para la publicacioacuten de datos
10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado
Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el
dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los
usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la
citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el
formato de este
En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero
de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de
su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la
informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado
y reconocido faacutecilmente entre los demaacutes datos
Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de
identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por
cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta
gestioacuten y reutilizacioacuten de sus datos
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean compartidos en maacutes plataformas
Que mis datos puedan vincularse a otros datos en el entorno Web
Que mis datos sean encontrados usados y citados inequiacutevocamente
Garantizar y monitorear la reutilizacioacuten de mis datos
Reducir del uso erroacuteneo de mis datos
iexclRecomendaciones
Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar
Utilice siempre el identificador asignado para publicar sus datos
29 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos
httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la
creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la
asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten
de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito
garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar
descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando
asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten
geograacutefica
Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems
publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace
referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades
territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el
planeamiento del suelo urbano de expansioacuten y ruralrdquo
30 Buenas praacutecticas para la publicacioacuten de datos
OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS
Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten
Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado
Nivel Baacutesico
En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)
Nivel Intermedio
Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)
Nivel Avanzado
Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)
31 Buenas praacutecticas para la publicacioacuten de datos
REFERENCIAS
Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best
Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp
Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices
for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp
Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington
Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec
Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI
Recommendation URL httpdublincoreorgdocumentsdcmi-terms
Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C
Recommendation URL httpswwww3orgTRvocab-dcat
ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de
2014 International Standard
ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers
noviembre de 2009 International Standard
ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013
International Standard
Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best
Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp
T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax
Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986
World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg
W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second
Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-
overview
W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado
el 12 de septiembre de 2018
26 Buenas praacutecticas para la publicacioacuten de datos
9 Incorporar el componente geograacutefico en los datos publicados para optimizar su comprensioacuten uso re-uso y visualizacioacuten
El espacio geograacutefico es un punto de la superficie terrestre que se vea afectado o que afecte de
alguna manera a la humanidad19 Este punto de la superficie puede ser la direccioacuten de una
institucioacuten educativa la ubicacioacuten de un centro de vacunacioacuten el lugar donde se miden las
variaciones de traacutensito en la ciudad los parques de Bogotaacute el edificio en donde se llevan a
cabo los traacutemites de una entidad etc
Los datos que usted captura o recolecta en su quehacer misional siempre estaacuten asociados a un
espacio geograacutefico por lo tanto este componente deberiacutea ser incluido en los datos publicados
Tenga en cuenta que el componente geograacutefico lo puede incorporar incluyendo una ubicacioacuten
asociada a una direccioacuten a un lugar a una localidad a un barrio al nombre de un
establecimiento puacuteblicamente reconocido o a cualquier punto que permita al usuario
identificar la localizacioacuten del dato publicado
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean puedan compartir en maacutes plataformas
Que los usuarios puedan visualizar mis datos en un mapa
iexclRecomendaciones
Disponga sus datos agregando un atributo de ubicacioacuten como direcciones coordenadas o
lugares geograacuteficos
Ejemplo 1
Incluya direcciones que permitan localizar espacialmente sus datos
Programa Direccioacuten
Registro de atencioacuten a la ciudadaniacutea CL 138 108 16
Centro de autocuidado KR 18 D 77 A 11 SUR
Familias con un nintildeo en cupos cofinanciados CL 70 A SUR 20 46
Centro de autocuidado KR 18 D 73 A 33 SUR
19 httpenciclopediabanrepculturalorgindexphptitle=Espacio_geogrC3A1fico
27 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 2
Utilice coordenadas para indicar la ubicacioacuten de sus datos
EPS Coordenada X Coordenada Y
EPS Convida 9087496334 1051342164
Capital Salud EPS 986321006 954875808
EPS Famisanar 9742508812 8837031501
Aliansalud EPS 9716943356 9659706891
Salud Total EPS 9215624975 9625189518
Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro
de su metadato el Sistema de referencia empleado
MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686
MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116
MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458
Ejemplo 3
Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute
Usuario Vacunado Lugar de Vacunacioacuten
Usuario 1 BOSQUE IZQUIERDO
Usuario 2 LAGUNITAS URBANO
Usuario 3 LA CAPUCHINA
Usuario 4 SAN JOSE SUR
Usuario 5 VENECIA
28 Buenas praacutecticas para la publicacioacuten de datos
10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado
Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el
dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los
usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la
citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el
formato de este
En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero
de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de
su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la
informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado
y reconocido faacutecilmente entre los demaacutes datos
Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de
identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por
cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta
gestioacuten y reutilizacioacuten de sus datos
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean compartidos en maacutes plataformas
Que mis datos puedan vincularse a otros datos en el entorno Web
Que mis datos sean encontrados usados y citados inequiacutevocamente
Garantizar y monitorear la reutilizacioacuten de mis datos
Reducir del uso erroacuteneo de mis datos
iexclRecomendaciones
Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar
Utilice siempre el identificador asignado para publicar sus datos
29 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos
httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la
creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la
asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten
de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito
garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar
descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando
asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten
geograacutefica
Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems
publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace
referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades
territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el
planeamiento del suelo urbano de expansioacuten y ruralrdquo
30 Buenas praacutecticas para la publicacioacuten de datos
OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS
Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten
Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado
Nivel Baacutesico
En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)
Nivel Intermedio
Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)
Nivel Avanzado
Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)
31 Buenas praacutecticas para la publicacioacuten de datos
REFERENCIAS
Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best
Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp
Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices
for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp
Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington
Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec
Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI
Recommendation URL httpdublincoreorgdocumentsdcmi-terms
Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C
Recommendation URL httpswwww3orgTRvocab-dcat
ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de
2014 International Standard
ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers
noviembre de 2009 International Standard
ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013
International Standard
Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best
Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp
T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax
Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986
World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg
W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second
Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-
overview
W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado
el 12 de septiembre de 2018
27 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo 2
Utilice coordenadas para indicar la ubicacioacuten de sus datos
EPS Coordenada X Coordenada Y
EPS Convida 9087496334 1051342164
Capital Salud EPS 986321006 954875808
EPS Famisanar 9742508812 8837031501
Aliansalud EPS 9716943356 9659706891
Salud Total EPS 9215624975 9625189518
Tenga en cuenta que para publicar datos con coordenadas tendraacute que incluir dentro
de su metadato el Sistema de referencia empleado
MAGNA ndash SIRGAS EPSG 4686 httpsepsgio4686
MAGNA ndash SIRGAS EPSG 3116 httpsepsgio3116
MAGNA ndash BOGOTAacute SR-ORG 7458 httpspatialreferenceorgrefsr-org7458
Ejemplo 3
Tambieacuten puede incluir lugares geograacuteficos descriptivos asiacute
Usuario Vacunado Lugar de Vacunacioacuten
Usuario 1 BOSQUE IZQUIERDO
Usuario 2 LAGUNITAS URBANO
Usuario 3 LA CAPUCHINA
Usuario 4 SAN JOSE SUR
Usuario 5 VENECIA
28 Buenas praacutecticas para la publicacioacuten de datos
10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado
Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el
dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los
usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la
citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el
formato de este
En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero
de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de
su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la
informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado
y reconocido faacutecilmente entre los demaacutes datos
Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de
identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por
cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta
gestioacuten y reutilizacioacuten de sus datos
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean compartidos en maacutes plataformas
Que mis datos puedan vincularse a otros datos en el entorno Web
Que mis datos sean encontrados usados y citados inequiacutevocamente
Garantizar y monitorear la reutilizacioacuten de mis datos
Reducir del uso erroacuteneo de mis datos
iexclRecomendaciones
Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar
Utilice siempre el identificador asignado para publicar sus datos
29 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos
httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la
creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la
asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten
de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito
garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar
descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando
asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten
geograacutefica
Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems
publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace
referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades
territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el
planeamiento del suelo urbano de expansioacuten y ruralrdquo
30 Buenas praacutecticas para la publicacioacuten de datos
OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS
Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten
Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado
Nivel Baacutesico
En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)
Nivel Intermedio
Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)
Nivel Avanzado
Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)
31 Buenas praacutecticas para la publicacioacuten de datos
REFERENCIAS
Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best
Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp
Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices
for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp
Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington
Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec
Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI
Recommendation URL httpdublincoreorgdocumentsdcmi-terms
Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C
Recommendation URL httpswwww3orgTRvocab-dcat
ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de
2014 International Standard
ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers
noviembre de 2009 International Standard
ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013
International Standard
Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best
Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp
T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax
Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986
World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg
W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second
Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-
overview
W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado
el 12 de septiembre de 2018
28 Buenas praacutecticas para la publicacioacuten de datos
10 Asignar un identificador uacutenico que permita aumentar la consulta uso e interoperabilidad del dato publicado
Considere un identificador uacutenico como un texto que permite identificar inequiacutevocamente el
dato publicado Si usted va a publicar un dato buscando que este sea reutilizado por los
usuarios y por su propia entidad asignar un identificador facilitaraacute el descubrimiento y la
citacioacuten del dato a traveacutes del tiempo independientemente del estado la disponibilidad o el
formato de este
En la vida cotidiana mediante la ceacutedula de ciudadaniacutea se asigna a cada ciudadano un nuacutemero
de identificacioacuten uacutenico y a traveacutes de este identificador el ciudadano es reconocido a lo largo de
su vida e incluso despueacutes de su muerte por otras personas yo autoridades En el mundo de la
informacioacuten cada dato deberiacutea viajar con un identificador uacutenico que le permita ser encontrado
y reconocido faacutecilmente entre los demaacutes datos
Ahora bien si usted o su entidad publican continuamente datos establecer un sistema de
identificacioacuten comuacuten le permitiraacute identificar raacutepidamente los datos y los haraacute comparables por
cualquier usuario de manera confiable Esta condicioacuten es previa para lograr una correcta
gestioacuten y reutilizacioacuten de sus datos
iquestQueacute logro
Ampliar el espectro de usuarios que consultan utilizan y reutilizan mis datos
Que mis datos sean maacutes interoperables y maacutes procesados
Que mis datos sean compartidos en maacutes plataformas
Que mis datos puedan vincularse a otros datos en el entorno Web
Que mis datos sean encontrados usados y citados inequiacutevocamente
Garantizar y monitorear la reutilizacioacuten de mis datos
Reducir del uso erroacuteneo de mis datos
iexclRecomendaciones
Establezca un sistema de identificacioacuten comuacuten para los datos que va a publicar
Utilice siempre el identificador asignado para publicar sus datos
29 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos
httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la
creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la
asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten
de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito
garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar
descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando
asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten
geograacutefica
Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems
publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace
referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades
territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el
planeamiento del suelo urbano de expansioacuten y ruralrdquo
30 Buenas praacutecticas para la publicacioacuten de datos
OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS
Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten
Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado
Nivel Baacutesico
En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)
Nivel Intermedio
Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)
Nivel Avanzado
Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)
31 Buenas praacutecticas para la publicacioacuten de datos
REFERENCIAS
Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best
Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp
Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices
for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp
Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington
Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec
Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI
Recommendation URL httpdublincoreorgdocumentsdcmi-terms
Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C
Recommendation URL httpswwww3orgTRvocab-dcat
ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de
2014 International Standard
ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers
noviembre de 2009 International Standard
ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013
International Standard
Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best
Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp
T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax
Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986
World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg
W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second
Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-
overview
W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado
el 12 de septiembre de 2018
29 Buenas praacutecticas para la publicacioacuten de datos
Ejemplo
IDECA ha dispuesto el Sistema de Registro de Iacutetems geograacuteficos
httpgeoitemsidecagovcogeoitemsano una herramienta web desarrollada para la
creacioacuten aprobacioacuten publicacioacuten y mantenimiento de iacutetems geograacuteficos que permite la
asignacioacuten concertada de identificadores y significados uacutenicos que contribuyen a la definicioacuten
de un lenguaje comuacuten para el desarrollo de nuevos sistema de informacioacuten en el Distrito
garantizando con ello su fiabilidad e interoperabilidad Adicionalmente permite almacenar
descripciones de la informacioacuten oficial producida e identificar su respectivo custodio jugando
asiacute un papel importante en el control y seguimiento de la produccioacuten de informacioacuten
geograacutefica
Este sistema asigna un identificador uacutenico a cada uno de los iacutetems creados Dentro de los iacutetems
publicados se reconoce el ID 65 como unidad de planeamiento y siempre que se hace
referencia a este objeto es suficiente nombrarlo asiacute para entender que se habla de ldquoUnidades
territoriales de anaacutelisis planeamiento y gestioacuten que tienen como propoacutesito definir y precisar el
planeamiento del suelo urbano de expansioacuten y ruralrdquo
30 Buenas praacutecticas para la publicacioacuten de datos
OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS
Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten
Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado
Nivel Baacutesico
En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)
Nivel Intermedio
Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)
Nivel Avanzado
Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)
31 Buenas praacutecticas para la publicacioacuten de datos
REFERENCIAS
Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best
Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp
Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices
for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp
Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington
Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec
Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI
Recommendation URL httpdublincoreorgdocumentsdcmi-terms
Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C
Recommendation URL httpswwww3orgTRvocab-dcat
ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de
2014 International Standard
ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers
noviembre de 2009 International Standard
ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013
International Standard
Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best
Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp
T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax
Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986
World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg
W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second
Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-
overview
W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado
el 12 de septiembre de 2018
30 Buenas praacutecticas para la publicacioacuten de datos
OBTENGA EL MAacuteS ALTO NIVEL EN PUBLICACIOacuteN DE DATOS
Hasta aquiacute hemos publicado las que consideramos como mejores praacutecticas de publicacioacuten de datos Ahora usted como publicador o como entidad debe evaluar si sus datos se estaacuten disponiendo con los maacutes altos y mejores estaacutendares de publicacioacuten
Lo invitamos a que valide en queacute nivel de publicacioacuten se encuentra su entidad teniendo en cuenta el siguiente listado
Nivel Baacutesico
En este nivel se encuentran aquellas entidades que publican sus datos en formatos estaacutendar y reutilizables (praacutectica 5) que integran a la publicacioacuten sus respectivos metadatos (praacutectica 1) y que acompantildean la publicacioacuten con una licencia asociada (praacutectica 2)
Nivel Intermedio
Este nivel lo alcanzan las entidades que superando el nivel baacutesico disponen un mayor volumen de informacioacuten gracias a que anonimizan sus datos (praacutectica 4) implementan medidas de calidad que aumentan la confianza en sus datos (praacutectica 8) incorporan el componente geograacutefico proporcionando valor agregado a sus datos (praacutectica 9) y publican un diccionario de datos que facilita la interpretacioacuten de los datos publicados (praacutectica 6)
Nivel Avanzado
Las entidades que superando el nivel intermedio utilizan vocabularios estandarizados en sus nuevas publicaciones (praacutectica 3) acompantildean la publicacioacuten de sus datos con enlaces a otros recursos (praacutectica 7) y asignan un identificador uacutenico para dato logrando asiacute aumentar su descubrimiento y reutilizacioacuten (praacutectica 10)
31 Buenas praacutecticas para la publicacioacuten de datos
REFERENCIAS
Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best
Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp
Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices
for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp
Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington
Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec
Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI
Recommendation URL httpdublincoreorgdocumentsdcmi-terms
Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C
Recommendation URL httpswwww3orgTRvocab-dcat
ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de
2014 International Standard
ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers
noviembre de 2009 International Standard
ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013
International Standard
Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best
Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp
T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax
Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986
World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg
W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second
Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-
overview
W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado
el 12 de septiembre de 2018
31 Buenas praacutecticas para la publicacioacuten de datos
REFERENCIAS
Bernadette Farias Loacutescio Caroline Burle Newton Calegari W3C Data on the Web Best
Practices 31 de enero de 2017 W3C Recommendation URL httpswwww3orgTRdwbp
Bernadette Hyland Ghislain Auguste Atemezing Boris Villazoacuten-Terrazas W3C Best Practices
for Publishing Linked Data 9 de enero de 2014 W3C Note URL httpswwww3orgTRld-bp
Dan Brickley Libby Miller FOAF project FOAF Vocabulary Specification 099 (Paddington
Edition) 14 de enero de 2014 URL httpxmlnscomfoafspec
Dublin Core metadata initiative DCMI Metadata Terms 14 de junio de 2012 DCMI
Recommendation URL httpdublincoreorgdocumentsdcmi-terms
Fadi Maali John Erickson W3C Data Catalog Vocabulary (DCAT) 16 de enero de 2014 W3C
Recommendation URL httpswwww3orgTRvocab-dcat
ISO 19115-12014 (E) Geographic information ndash Metadata Part1 Fundamentals 01 de abril de
2014 International Standard
ISO 191262009 (E) Geographic information -- Feature concept dictionaries and registers
noviembre de 2009 International Standard
ISO 191572013 (E) Geographic information ndash Data quality 15 de diciembre de 2013
International Standard
Jeremy Tandy Payam Barnaghi Linda van den Brink W3C Spatial Data on the Web Best
Practices 5 de enero 2017 W3C Note URL httpswwww3orgTRsdw-bp
T Berners-Lee R Fielding L Masinter IETF Uniform Resource Identifier (URI) Generic Syntax
Enero de 2005 Internet Standard URL httpstoolsietforghtmlrfc3986
World Wide Web Foundation Open Data Barometer URL httpopendatabarometerorg
W3C OWL Working Group W3C OWL 2 Web Ontology Language Document Overview (Second
Edition) 11 de diciembre de 2012 W3C Recommendation URL httpswwww3orgTRowl2-
overview
W3org Semantic Web - W3C URL httpswwww3orgstandardssemanticweb Consultado
el 12 de septiembre de 2018