Glosario de Gestión de datos
Término
Definición
Accesibilidad El grado de sencillez y claridad con el que las personas usuarias pueden acceder, localizar, disponer, entender y obtener los datos. Según si están disponibles para la gama más amplia de usuarios para cualquier propósito, así como disponibles en un lenguaje y medios claros y asequibles. Ver: calidad de los datos Acceso abierto El acceso gratuito, oportuno y sin restricciones a los datos y otros recursos de tecnologías de información por parte de todas las personas, mediante herramientas de software libre o código abierto. Cualquier tipo de contenido digital puede estar publicado en acceso abierto: textos, bases de datos, software, audio, vídeo y multimedia, entre otros. Agencia Digital de Innovación Pública (ADIP) Órgano desconcentrado del gobierno de la Ciudad de México, adscrito a la Jefatura de Gobierno, que tiene entre sus atribuciones diseñar, coordinar, supervisar y evaluar las políticas relacionadas con la gestión de datos, el gobierno abierto, el gobierno digital, la gobernanza tecnológica y la gobernanza de la conectividad y la gestión de la infraestructura. Algoritmo Conjunto de instrucciones o reglas definidas, ordenadas y finitas que permite, típicamente, solucionar un problema, realizar un cómputo, procesar datos y llevar a cabo otras tareas o actividades. Almacén de datos Colección de un gran volumen de datos integrados, no volátil y variable en el tiempo, los cuales pueden provenir de numerosas fuentes, pueden estar organizados de manera centralizada o no centralizada. Almacén de RDF Base de datos especializada para almacenar tripletes o datos semánticos en formato RDF (Resource Description Framework), que organiza la información en grafos en lugar de en tablas de bases de datos fijas y consulta los datos mediante el lenguaje de SPARQL . Ver triplestore, ver RDF, ver SPARQL. Anonimización de la información Técnica que supone el tratamiento de datos personales con el objeto de disociar de manera irreversible o definitiva la información personal de su titular a fin de que no pueda asociarse con él, ni permitir su identificación por su estructura, contenido o grado de desagregación. Es diferente a la técnica de testeo definida en la Ley de Transparencia, Acceso a la Información Pública y Rendición de Cuentas de la Ciudad de México. API (Application Programming Interface) Siglas en inglés de Interfaz de Programación de Aplicaciones. Es una interfaz de comunicación que conjunta especificaciones y procedimientos que permiten intercambiar, acceder y aprovechar los datos y funcionalidades de una aplicación existente. App Una aplicación es un programa informático diseñado como herramienta para permitir a un usuario realizar uno o diversos tipos de tareas. En términos generales existen aplicaciones web, para su uso en un navegador web y aplicaciones móviles, para uso en dispositivos móviles. Arquitectura de datos Se refiere a la alineación de los datos, sistemas de información e infraestructura tecnológica con la misión y objetivos estratégicos de cada organización, mediante especificaciones para el modelado y diseño de bases de datos que aseguren la integración e interoperabilidad de los datos.
Atributo Un atributo representa las propiedades que puede tomar una observación o entidad dentro de una base de datos o conjunto de datos. Por ejemplo, la observación o entidad "Ciudadano" tiene los atributos "Edad", "Escolaridad", "Domicilio". Base de datos Repositorio de datos que se organizan y estructuran de acuerdo a diferentes modelos: relacionales, no relacionales, orientadas a objetos, etc. y que tiene rutinas optimizadas para recopilar, albergar, administrar, procesar y consultar dichos datos. Ver: base de datos relacional; base de datos no relacional. Base de datos relacional Repositorio que almacena datos en forma de relaciones, todo dentro de un esquema lógico mediante tablas. Las relaciones son creadas a través de columnas en las tablas que hacen referencia a otro registro. Ejemplo de bases de datos relacionales: MySQL, PostgreSQL, SQL Server, MariaDB, entre otros. ver: MySQL y SQL. Base de datos no relacional También conocidas como NoSQL, son las Bases de Datos que no siguen el modelo Relacional y que tampoco utilizan SQL como lenguaje de consultas, se caracterizan también por utilizar colecciones en vez de tablas para almacenar datos. Ejemplos: Redis, MongoDB Big Data Se refiere al enfoque de la ciencia de datos en la cual se analizan datos de gran volumen, ya sean estructurados o no estructurados, de gran complejidad y velocidad de crecimiento, por lo cual no pueden ser capturados, procesados o analizados mediante tecnologías y herramientas convencionales. Esta gran cantidad de datos tienen la potencialidad de identificar problemas y respuestas útiles a ellos, mediante búsqueda de tendencias u otros parámetros relevantes. Catálogo de datos Un catálogo de datos mantiene un inventario de datos mediante la organización y descripción de los conjuntos de datos. Un catálogo le permite a los usuarios de los datos descubrir, encontrar y entender datos para extraer y usar. Ciencia de datos Área de conocimiento que busca agregar valor a los datos por medio de la confluencia de análisis estadísticos, métodos computacionales y visualización de información, para el análisis de grandes volúmenes de datos. Código abierto También llamado "Open source", se refiere al modelo de desarrollo de un sotware en que el código de un programa (código fuente) se distribuye libremente (algunas veces de manera gratuita) para ser usado y modificado por las personas usuarias sin ninguna restricción. ver: código fuente. Código fuente Es el conjunto de líneas de texto, legibles por humanos y redactado en un lenguaje de programación determinado, con los comandos que debe seguir la computadora para ejecutar un programa. Conjunto de datos También llamado dataset, es una colección de datos oranizados, que en su forma más básica se organiza como una matriz n*m, en la cual n es el número de observaciones y m es el número de atributos o columnas. Los formatos más comúnes de almacenamiento de conjuntos de datos son xlsx y csv (archivos separados por comas). Ver csv. CSV Siglas en inglés de Comma Separated Values, es un formato de archivo que representa datos en forma de tabla, en las que las columnas se separan por comas y las filas por saltos de línea. Es uno de los formatos denominado "de formato abierto" y actualmente es ampliamente utilizado como formato de intercambio para datos tabulares. ver: formatos abiertos. DAMA Siglas en Inglés de Data Management Association. Data Lake Es un repositorio de datos a gran escala que almacena una gran cantidad de datos primarios, ya sean estructurados, semi-estructurados y no estructurados, en su formato original por el tiempo que sea necesario, sin límites fijos en cuanto al tamaño o formato, permitiendo así la integración de gran cantidad de datos. Cada elemento de los datos en el data lake está asociado a un identificador único y etiquedato con un conjunto de etiquetas de metadatos extendidos. El Data lake define el esquema de almacenamiento después de que los datos han sido almacendos. Utiliza procesos ELT (extract load transform). Data Warehouse Repositorio que almacena los datos provenientes de distintas fuentes, asociando sus atributos a métricas cuantitativas, en archivos o folders los cuales posibilitan su organización y uso para la toma de decisiones estratégicas. Este sistema de almacenamiento provee una vista multidimensional tanto de datos desagregados como resúmenes de ellos, designado así para proveer consultas y análisis, en lugar de procesos de transacción de los datos. El Data Warehouse define el esquema de almacenamiento antes de que los datos sean almacenados. Utiliza procesos ETL (extract transform load). Datos Aquellos registros, ya sean numéricos o textuales, que describen las características o atributos de cualquier evento, individuo o cosa y que son producidos y/o albergados digitalmente en diversos recursos de tecnologías de información, tales como bases de datos, conjuntos de datos y sistemas de información. Es el mínimo componente que, derivado de un proceso de análisis, permite producir información. Dataset Ver conjunto de datos. Datos abiertos Los datos abiertos son datos que pueden ser utilizados, reutilizados y redistribuidos libremente por cualquier persona, sin ningún tipo de restricción económica o de cualquier otro. Tienen las siguientes características:
a) Accesibles: Los datos están disponibles para la gama más amplia de usuarios, para cualquier propósito;
b) De libre uso: Citan la fuente de origen como único requerimiento para ser utilizados libremente;
c) En formatos abiertos: Los datos estarán disponibles con el conjunto de características técnicas y de presentación que corresponden a la estructura lógica usada para almacenar datos en un archivo digital, cuyas especificaciones técnicas están disponibles públicamente, que no suponen una dificultad de acceso y que su aplicación y reproducción no estén condicionadas a contraprestación alguna;
d) Gratuitos: Se obtienen sin entregar a cambio contraprestación alguna;
e) Integrales: Contienen el tema que describen a detalle y con los metadatos necesarios;
f) Legibles por máquinas: Deberán estar estructurados para ser procesados e interpretados por equipos electrónicos de manera automática;
g) No discriminatorios: Los datos están disponibles para cualquier persona, sin necesidad de registro;
h) Oportunos: Se publican de manera oportuna según las necesidades de información de las personas usuarias y son actualizados periódicamente conforme se generen;
i) Permanentes: Se conservan en el tiempo, para lo cual, las versiones históricas relevantes para uso público se mantendrán disponibles con identificadores adecuados al efecto; y
j) Primarios: Provienen de la fuente de origen con el máximo nivel de desagregación posible.
Datos primarios También denominados "datos brutos" del inglés raw data, son aquellos datos colectados directamente de su fuente, sin haber pasado por algún proceso de transformación, agregación y/o análisis. Datos estructurados Datos que se encuentran organizados de acuerdo a un esquema fijo y usualmente están incorporados en una base de datos relacional u hojas de cálculo; es decir, organizados en filas, columnas y tablas, con títulos para cada categoría que permite identificarlos. Los datos estructurados están escritos de tal forma que los motores de búsqueda entienden el contenido. Para gestionar este tipo de datos se utiliza un tipo de lenguaje de programación estructurado, conocido como SQL (Structured Query Language) diseñado para administrar y recuperar información de sistemas de gestión de bases de datos relacionales. Ejemplo de formatos de datos estructurados son XML, JSON y JSON-LD.
Ver: SQL Datos no estructurados Son los datos binarios que no tienen una estructura interna identificable. Por tanto, deben identificarse y almacenarse de forma organizada a través de una base de datos no relacional (NoSQL). Pueden ser textuales, numéricos, generados por humanos o por computadora.
Ejemplos de datos no estructurados hechos por humanos:
Archivos de texto como: archivos de texto de Microsoft Word, PDF, presentaciones.
Correos electrónicos y Chats.
Datos de redes sociales como Facebook, Twitter, LinkedIn.
Archivos multimedia como MP3, imágenes digitales, audio y video.
Ejemplos de datos no estructurados hechos por máquinas:
Datos satelitales.
Fotos y videos generados por cámaras de seguridad.
Datos generados por sensores.
Ver: NoSQL Datos personales Son aquellos datos concernientes a una persona física, identificada o identificable. Los datos personales suponen la titularidad de la persona física a que se refieren. En consecuencia, implican cierto poder de control y disposición por parte de la persona concernida, así como el deber de confidencialidad de quienes son responsables de su tratamiento. Ver: Ley de Transparencia, Acceso a la Información Pública y Rendición de Cuentas de la Ciudad de México. Datos vinculados Del inglés linked data, también conocidos como datos enlazados, son un método de publicación de datos estructurados para que puedan ser interconectados mediante tecnologías y protocolos web como http, rdf y los identificadores URI. Este método permite que los datos sean conectados, consultados y fácilmente localizados desde diferents fuentes. Ver: HTTP, Ver: URI, Ver: RDF, Ver: URL /// Denota datos estructurados en formato RDF en la WEB, identificados vía URI y accesibles vía HTTP. Los datos vinculados se enlazan con otros datos vía URI. Datum Término usado para datos geográficos, es un sistema de referencia espacial que describe la forma y el tamaño de la tierra y establece un origen para los sistemas de coordenadas o referencia. DCAT Siglas en inglés para Data Catalog Vocabulary, Es un volcabulario controlado del marco RDF (Resource Discovery Framework) diseñado para facilitar la interoperabilidad de los catálogos de datos publicados en Internet, mediante el uso de un modelo y vocabulario estándar. Diccionario de datos Es un tipo de metadato que enlista de manera organizada los nombres, definiciones y características de cada uno de los campos o atributos de una base de datos y/o conjunto de datos y tiene por objetivo proveer un lenguaje común entre el autor(a) de dichos datos y sus posibles usuarios(as).
ETL Siglas en inglés para extraer, transformar y cargar; es el proceso de compilación de datos a partir de un número ilimitado de fuentes, su posterior organización, limpieza, transformación y centralización en un único repositorio.
Excel Es una hoja de calculo desarrollada por la empresa Microsoft y forma parte de la suite de sotware Microsotf Office. Permite realizar análisis básicos de datos, mediante herramientas gráficas, tablas calculares, entre otros. Firewall Programa informático que busca mantener la seguridad en los datos, el software y el hardware, mediante el control al acceso de una computadora a la red y de elementos de la red a la computadora. Formato abierto Formato para almacenar datos digitales que no impone restricciones, económicas o de otro tipo, sobre su uso y que puede ser procesado con al menos una herramienta de software libre y/o de código abierto.
Ver: sotware libre; ver: código abierto. Formato legible por humanos Es una representación de datos o información que las personas humanas pueden leer de forma natural. Pueden ser texto ASCII o UNICODE. Formato legible por máquina Datos en un formato que pueda ser procesado de forma automática por una computadora, por tanto deben ser datos estructurados como CSV, JSON, XML, etc. GeoJSON Es un formato de estándar abierto diseñado para representar caracterísitcas geográficas simples, junto con sus atributos no espaciales. Se basa en la notación de objetos JavaScript (JSON). Ver: formato abierto Gestión de datos Conjunto de prácticas, procesos, y procedimientos, tanto tecnológicos y administrativos, que las organizaciones (en este caso Órganos de la Administración Pública) llevan a cabo con el objetivo controlar, proteger, aprovechar e incrementar el valor de los mismos. SIG Sigalas par Sistema de Información Geográfica. Ver: Sistema de Información Geográfica Gobierno abierto Modelo de relación entre los Órganos de la Administración Pública, las autoridades del poder legislativo y judicial, así como con los órganos autónomos y los habitantes de la Ciudad de México, que tiene como finalidad la co-innovación
tecnológica, la participación social y relacional que impulse la elaboración, implementación y evaluación de políticas públicas, servicios públicos y programas gubernamentales, de forma abierta y transparente. Gobierno digital Modelo de mejora y optimización de la calidad de los bienes y servicios de la Administración Pública de la Ciudad de México, a partir del uso estratégico de las tecnologías que permita facilitar a las personas el acceso, uso y realización de trámites y servicios públicos, de manera oportuna, simplificada, efectiva y con calidad, facilitando los vínculos de colaboración y participación social. Haciendo cumplir funciones de gobierno a partir del uso estratégico de las tecnologías de la Información y la Comunicación transparente; con el fin de establecer un modelo de mejora y optimización de la calidad de los bienes y servicios de la Administración Pública de la Ciudad de México, a partir del uso estratégico de las tecnologías que permita facilitar a las personas el acceso, uso y realización de trámites y servicios públicos, de manera oportuna, simplificada, efectiva y con calidad, facilitando los vínculos de colaboración y participación social Gobierno electrónico El uso estratégico de las Tecnologías de la Información y Comunicación por la Administración Pública de la Ciudad de México para ofrecer servicios e información a las personas de manera
receptiva, eficiente y efectiva, así como para relacionarse con estas para establecer vínculos de colaboración. GPS Siglas en inglés para Sistema de posicionamiento global, un sistema de navegación satelital que proporciona información de localización, velocidad y tiempo de sincronización a cualquier equipo con un receptor adecuado (incluidos los teléfonos inteligentes modernos). El GPS es invaluable para muchas aplicaciones basadas en la ubicación, ya que proporciona a los usuarios, por ejemplo, información de búsqueda de rutas o pronósticos meteorológicos basados en su ubicación actual. Hadoop Es una estrucutra de software (framework) de código abierto para almacenar datos y programar aplicaciones distribuidas que manejen grandes volúmenes de datos funciona por procesamiento distribuido (es decir, mediante nodos), escrito en lenguaje de programación Java. Ver: Java Hipertexto Es un sitema no lineal de organización y presentación de datos que permite crear, agregar, enlazar y compartirlos desde diversas funetes por medio de enlaces asociativos. Se basa en la vinculación de fragmentos textuales o gráficos a otros fragmentos mediante dichos enlaces. Permite a las personas usuarias acceder a la información desde cualquiera de los ítems relacionados, y no necesariamente de manera secuencial. Lo que convierte a un texto en hipertexto es la enorme capacidad que le dan los vínculos o enlaces dentro de una estructura de múltiples ramificaciones. Este tipo de sistema de organización de la información es sólo posible gracias a la utilización de un medio digital, un hipertexto solo puede realizarse y tomar forma gracias a los ordenadores. Hoja de cálculo Es un tipo de documento informático que permite manipular datos numéricos y alfanuméricos dispuestos en forma de tablas compuestas por celdas, las cuales se suelen organizar en una matriz de filas y columnas. El software más común para usar hojas de cálculo es Microsoft Excel. Una hoja de cálculo puede ser un conjunto de datos (dataset) pero no es una base de datos. Ver: conjunto de datos. HTML Siglas en inglés de HyperText Markup Language (lenguaje de marcado de hipertexto) es un sistema de lenguaje de marcado para la elaboración de páginas web que define el significado y la estructura del contenido web. El lenguaje "marcado" permite etiquetar texto, imágenes y otro contenido para mostrarlo en un navegador Web. Este marcado ingluye elementos especiales predefinidos como <head>, <title>, <body>, <header>, <footer>, <article>, <section>, <p>, <div>, <span>, <img>, entre muchos otros. Ver: Hipertexto HTTP Siglas en inglés de HyperText Transfer Protocol, es un protocolo de transferencia de comunicación mediante hipertextos, como HTML. Sigue un modelo cliente-servidor, en el que el cliente establece una conexión realizando una petición a un servidor quien envía la rspuesta. Este protocolo no guarda ningún dato o estado sobre las peticiones. Ver: HTML Información Todo archivo, registro o dato contenido en cualquier medio, documento o registro impreso, óptico, electrónico, magnético, químico, físico o biológico que se encuentre en poder de los Entes Públicos.
Ver: Ley de Transparencia, Acceso a la Información y Transparencia Gubernamental de la Ciudad de México. Interfaz de programación de aplicaciones Ver: API Internet de las Cosas Concepto que se refiere a una interconexión digital de objetos cotidianos con internet. Interoperabilidad Capacidad de los Sistemas de Información de compartir datos y posibilitar el intercambio entre ellos. IoT Internet of Things. Ver Internet de las Cosas. Java Es un lenguaje de programación orientado a objetos cuya principal característica es que no debe ser recompilado para correr en alguna plataforma. Actualmente es de los lenguajes de programación más utilizados en el mundo por su versatilidad. JSON JavaScript Object Notation. https://www.json.org/json-en.html. Es una sintaxis para almacenar e intercambiar información basada en texto, es un formato ligero utilizado para el intercambio de datos entre sistemas, pues para las máquinas resulta simple interpretarlo y generarlo. KML Keyhole Markup Language. Lenguaje basado en XML para representar datos geográficos en tres dimensiones. Es un formato de archivo utilizado para mostrar datos geográficos en un navegador de la Tierra como Google Earth. Latitud Es una coordenada geográfica que especifica la posición norte-sur de un punto en la superficie de la Tierra. Marco de descripción de recursos. Ver RDF Metadatos Los metadatos son datos que describen las características y propiedades de los datos; sirven para que las personas usuarias puedan buscar y consultar datos de forma más efectiva y eficiente, así como para la conformación de catálogos de datos. OWL Web Ontology Language. PDF Portable Document File. PostgreSQL Es un sistema de gestión de bases de datos relacionales de código abierto que fue desarrollado por voluntarios de todo el mundo Query Es un tipo de "pregunta" que se le hace a una base de datos con respecto a la información que contiene. Muchas bases de datos basan su funcionamiento en querys, como MySQL. Una API permite que una app envíe querys a una base de datos en la web, lo cual simplifica el proceso de procesamiento de datos. R Ver lenguage R R es un lenguaje y entorno para computación estadística y gráficos. R proporciona una amplia variedad de técnicas estadísticas (modelos lineales y no lineales, pruebas estadísticas clásicas, análisis de series temporales, clasificación, agrupamiento, ...) y gráficas, y es altamente extensible. https://www.r-project.org/about.html Raw Data Ver Datos primarios Recursos de tecnologías de información Son los conjuntos de datos, bases de datos, aplicaciones y sistemas de información digitales, tecnología (hardware, software, sistemas operativos, sistemas manejadores de bases de datos, redes, y demás aplicables) e instalaciones (recursos para alojar y dar soporte a los sistemas de información) en posesión de los Entes REST Por sus siglás en inglés Representational State Transfer, es una arquitectura de desarrollo web que puede ser utilizada en cualquier cliente HTTP. Además, es mucho más simple que otras arquitecturas ya existentes, como pueden ser XML-RPC o SOAP. Esta simplicidad se consigue porque emplea una interfaz web que usa hipermedios para la representación y transición de la información. RDF Resource Description Framework o Marco de descripción de recursos. Describe los datos vinculados. Los datos en RDF se estructuran en forma de "tripletes." Cada datum tiene tres elementos: sujeto, predicado y objeto. Se almacenan en bases de datos especializadas llamadas triplestore o almacén de RDF. RDF Schema RDF Schema es una extensión del vocabulario básico de RDF. Proporciona un vocabulario para modelar datos. Servicio Web Un servicio web es un sistema de software diseñado para admitir la interacción interoperable de máquina a máquina a través de una red.
Servidor Es una unidad central de procesamiento y almacenamiento de datos que permite la interacción de otros equipos de cómputo a través de una red que concentra los servicios habituales que permiten a los usuarios almacenar y acceder los archivos y aplicaciones que realizan tareas en beneficio directo del usuario final. Un servidor no necesariamente es una computadora de grandes capacidades. Shapefile Es el formato vectorial más popular, este formato esta basado en ficheros que SHP Es un formato simple y universal, que sirve para almacenar datos tabulares en texto simple, separados por comas y también es un formato abierto. Sistema de información geográfica
Un sistema de información geográfica (SIG) es un sistema diseñado para almacenar, administrar, capturar, manipular, analizar, y presentar datos espaciales o geográficos. SPARQL Lenguaje basado en querys, similar a SQL, utilizado para datos vinculados en lenguajes de tripletes como RDF, que permite hacer búsquedas sobre los recursos de la Web Semántica utilizando distintas fuentes de datos. SQL Structured Query Language. Es un estándar internacional para definir querys de bases de datos. triplestore Ver Almacén de RDF. TSV Tab Separated Values. Es un tipo de documento en formato abierto sencillo para representar datos en forma de tabla, en las que las columnas se separan por tabulacioness y las filas por saltos de línea. URI Por sus siglas en inglés Uniform Resource Identifier que significan Identificador uniforme de recursos, es un formato estándar para identificadores en Internet /// Define un simple y extensible esquema para la identificación única en la red de recursos abstractos o físicos (reales). Un recurso puede ser cualquier objeto con una identidad clara (según el contexto de aplicación). URL Uniform Resource Locator o Localizador uniforme de recurso. Se utiliza para identificar la dirección de una página web Usabilidad Enfoque de experiencia de usuario (UX) que busca la facilidad con la cual un usuario utiliza o accede a un producto o servicio. Generalmente depende de que un producto o servicio se diseñe tomando en cuenta la experiencia de usuario (UX). UX Experiencia de usuario. Se refiere al proceso de diseño de un producto o servicio que se basa en el entendimiento del usuario final. De acuerdo a este proceso, el diseño del producto o servicio debe tomar en cuenta los deseos, habilidades y limitaciones de los usuarios, de tal forma que el producto final les sea útil. Ver usabilidad. Visualización de datos Es la presentación de información y datos en un formato gráfico, con los siguientes propósitos: la interpretación y construcción de significado a partir de los datos y la comunicación a partir del análisis presentado visualmente que ayude a comprender conceptos o identificar nuevos patrones. W3C World Wide Web Consortium. Consorcio internacional que genera recomendaciones y estándares para asegurar el funcionamiento de la World Wide Web a largo plazo. Web API Ver API. World Wide Web Red informática mundial. De acuerdo al W3C, es un espacio de información en el cual ítems de interés, denominados recursos, se identifican mediante identificadores uniformes de recurso (URI por sus siglas en inglés). Web semántica Es un esfuerzo colaborativo liderado por el W3C con la participación de numerosos miembros del sector académico, público y privado, que busca en crear una red mundial de datos. Consiste en dos elementos:
1) Formatos comunes para integrar y combinar datos de distintas fuentes
2) Lenguajes comunes para nombrar los datos Web-scraping Su traducción en español "raspado de páginas web" consiste en la extracción de los datos relevantes o con significado de una o varias páginas web previamente seleccionadas, para su posterior manipulación y análisis. XLS Es un archivo de plantilla de cálculo y de formato propietario Microsoft que restringe la utilización de este archivo por software de terceros. XLS (X) Es un archivo de hoja de cálculo y de formato propietario Microsoft, de especificación abierta. XML Extensible Markup Language. Es un lenguaje estructurado mediante etiquetas o marcas que aportan datos o información que se desea procesar. Fue desarrollado por la World Wide Web Consortium (W3C) y es muy útil para representar datos estructurados. XML Schema Lenguaje para definir la estructura de los documentos XML.
Término | Definición |
---|---|
Accesibilidad | El grado de sencillez y claridad con el que las personas usuarias pueden acceder, localizar, disponer, entender y obtener los datos. Según si están disponibles para la gama más amplia de usuarios para cualquier propósito, así como disponibles en un lenguaje y medios claros y asequibles. Ver: calidad de los datos |
Acceso abierto | El acceso gratuito, oportuno y sin restricciones a los datos y otros recursos de tecnologías de información por parte de todas las personas, mediante herramientas de software libre o código abierto. Cualquier tipo de contenido digital puede estar publicado en acceso abierto: textos, bases de datos, software, audio, vídeo y multimedia, entre otros. |
Agencia Digital de Innovación Pública (ADIP) | Órgano desconcentrado del gobierno de la Ciudad de México, adscrito a la Jefatura de Gobierno, que tiene entre sus atribuciones diseñar, coordinar, supervisar y evaluar las políticas relacionadas con la gestión de datos, el gobierno abierto, el gobierno digital, la gobernanza tecnológica y la gobernanza de la conectividad y la gestión de la infraestructura. |
Algoritmo | Conjunto de instrucciones o reglas definidas, ordenadas y finitas que permite, típicamente, solucionar un problema, realizar un cómputo, procesar datos y llevar a cabo otras tareas o actividades. |
Almacén de datos | Colección de un gran volumen de datos integrados, no volátil y variable en el tiempo, los cuales pueden provenir de numerosas fuentes, pueden estar organizados de manera centralizada o no centralizada. |
Almacén de RDF | Base de datos especializada para almacenar tripletes o datos semánticos en formato RDF (Resource Description Framework), que organiza la información en grafos en lugar de en tablas de bases de datos fijas y consulta los datos mediante el lenguaje de SPARQL . Ver triplestore, ver RDF, ver SPARQL. |
Anonimización de la información | Técnica que supone el tratamiento de datos personales con el objeto de disociar de manera irreversible o definitiva la información personal de su titular a fin de que no pueda asociarse con él, ni permitir su identificación por su estructura, contenido o grado de desagregación. Es diferente a la técnica de testeo definida en la Ley de Transparencia, Acceso a la Información Pública y Rendición de Cuentas de la Ciudad de México. |
API (Application Programming Interface) | Siglas en inglés de Interfaz de Programación de Aplicaciones. Es una interfaz de comunicación que conjunta especificaciones y procedimientos que permiten intercambiar, acceder y aprovechar los datos y funcionalidades de una aplicación existente. |
App | Una aplicación es un programa informático diseñado como herramienta para permitir a un usuario realizar uno o diversos tipos de tareas. En términos generales existen aplicaciones web, para su uso en un navegador web y aplicaciones móviles, para uso en dispositivos móviles. |
Arquitectura de datos | Se refiere a la alineación de los datos, sistemas de información e infraestructura tecnológica con la misión y objetivos estratégicos de cada organización, mediante especificaciones para el modelado y diseño de bases de datos que aseguren la integración e interoperabilidad de los datos. |
Atributo | Un atributo representa las propiedades que puede tomar una observación o entidad dentro de una base de datos o conjunto de datos. Por ejemplo, la observación o entidad "Ciudadano" tiene los atributos "Edad", "Escolaridad", "Domicilio". |
Base de datos | Repositorio de datos que se organizan y estructuran de acuerdo a diferentes modelos: relacionales, no relacionales, orientadas a objetos, etc. y que tiene rutinas optimizadas para recopilar, albergar, administrar, procesar y consultar dichos datos. Ver: base de datos relacional; base de datos no relacional. |
Base de datos relacional | Repositorio que almacena datos en forma de relaciones, todo dentro de un esquema lógico mediante tablas. Las relaciones son creadas a través de columnas en las tablas que hacen referencia a otro registro. Ejemplo de bases de datos relacionales: MySQL, PostgreSQL, SQL Server, MariaDB, entre otros. ver: MySQL y SQL. |
Base de datos no relacional | También conocidas como NoSQL, son las Bases de Datos que no siguen el modelo Relacional y que tampoco utilizan SQL como lenguaje de consultas, se caracterizan también por utilizar colecciones en vez de tablas para almacenar datos. Ejemplos: Redis, MongoDB |
Big Data | Se refiere al enfoque de la ciencia de datos en la cual se analizan datos de gran volumen, ya sean estructurados o no estructurados, de gran complejidad y velocidad de crecimiento, por lo cual no pueden ser capturados, procesados o analizados mediante tecnologías y herramientas convencionales. Esta gran cantidad de datos tienen la potencialidad de identificar problemas y respuestas útiles a ellos, mediante búsqueda de tendencias u otros parámetros relevantes. |
Catálogo de datos | Un catálogo de datos mantiene un inventario de datos mediante la organización y descripción de los conjuntos de datos. Un catálogo le permite a los usuarios de los datos descubrir, encontrar y entender datos para extraer y usar. |
Ciencia de datos | Área de conocimiento que busca agregar valor a los datos por medio de la confluencia de análisis estadísticos, métodos computacionales y visualización de información, para el análisis de grandes volúmenes de datos. |
Código abierto | También llamado "Open source", se refiere al modelo de desarrollo de un sotware en que el código de un programa (código fuente) se distribuye libremente (algunas veces de manera gratuita) para ser usado y modificado por las personas usuarias sin ninguna restricción. ver: código fuente. |
Código fuente | Es el conjunto de líneas de texto, legibles por humanos y redactado en un lenguaje de programación determinado, con los comandos que debe seguir la computadora para ejecutar un programa. |
Conjunto de datos | También llamado dataset, es una colección de datos oranizados, que en su forma más básica se organiza como una matriz n*m, en la cual n es el número de observaciones y m es el número de atributos o columnas. Los formatos más comúnes de almacenamiento de conjuntos de datos son xlsx y csv (archivos separados por comas). Ver csv. |
CSV | Siglas en inglés de Comma Separated Values, es un formato de archivo que representa datos en forma de tabla, en las que las columnas se separan por comas y las filas por saltos de línea. Es uno de los formatos denominado "de formato abierto" y actualmente es ampliamente utilizado como formato de intercambio para datos tabulares. ver: formatos abiertos. |
DAMA | Siglas en Inglés de Data Management Association. |
Data Lake | Es un repositorio de datos a gran escala que almacena una gran cantidad de datos primarios, ya sean estructurados, semi-estructurados y no estructurados, en su formato original por el tiempo que sea necesario, sin límites fijos en cuanto al tamaño o formato, permitiendo así la integración de gran cantidad de datos. Cada elemento de los datos en el data lake está asociado a un identificador único y etiquedato con un conjunto de etiquetas de metadatos extendidos. El Data lake define el esquema de almacenamiento después de que los datos han sido almacendos. Utiliza procesos ELT (extract load transform). |
Data Warehouse | Repositorio que almacena los datos provenientes de distintas fuentes, asociando sus atributos a métricas cuantitativas, en archivos o folders los cuales posibilitan su organización y uso para la toma de decisiones estratégicas. Este sistema de almacenamiento provee una vista multidimensional tanto de datos desagregados como resúmenes de ellos, designado así para proveer consultas y análisis, en lugar de procesos de transacción de los datos. El Data Warehouse define el esquema de almacenamiento antes de que los datos sean almacenados. Utiliza procesos ETL (extract transform load). |
Datos | Aquellos registros, ya sean numéricos o textuales, que describen las características o atributos de cualquier evento, individuo o cosa y que son producidos y/o albergados digitalmente en diversos recursos de tecnologías de información, tales como bases de datos, conjuntos de datos y sistemas de información. Es el mínimo componente que, derivado de un proceso de análisis, permite producir información. |
Dataset | Ver conjunto de datos. |
Datos abiertos | Los datos abiertos son datos que pueden ser utilizados, reutilizados y redistribuidos libremente por cualquier persona, sin ningún tipo de restricción económica o de cualquier otro. Tienen las siguientes características: a) Accesibles: Los datos están disponibles para la gama más amplia de usuarios, para cualquier propósito; b) De libre uso: Citan la fuente de origen como único requerimiento para ser utilizados libremente; c) En formatos abiertos: Los datos estarán disponibles con el conjunto de características técnicas y de presentación que corresponden a la estructura lógica usada para almacenar datos en un archivo digital, cuyas especificaciones técnicas están disponibles públicamente, que no suponen una dificultad de acceso y que su aplicación y reproducción no estén condicionadas a contraprestación alguna; d) Gratuitos: Se obtienen sin entregar a cambio contraprestación alguna; e) Integrales: Contienen el tema que describen a detalle y con los metadatos necesarios; f) Legibles por máquinas: Deberán estar estructurados para ser procesados e interpretados por equipos electrónicos de manera automática; g) No discriminatorios: Los datos están disponibles para cualquier persona, sin necesidad de registro; h) Oportunos: Se publican de manera oportuna según las necesidades de información de las personas usuarias y son actualizados periódicamente conforme se generen; i) Permanentes: Se conservan en el tiempo, para lo cual, las versiones históricas relevantes para uso público se mantendrán disponibles con identificadores adecuados al efecto; y j) Primarios: Provienen de la fuente de origen con el máximo nivel de desagregación posible. |
Datos primarios | También denominados "datos brutos" del inglés raw data, son aquellos datos colectados directamente de su fuente, sin haber pasado por algún proceso de transformación, agregación y/o análisis. |
Datos estructurados | Datos que se encuentran organizados de acuerdo a un esquema fijo y usualmente están incorporados en una base de datos relacional u hojas de cálculo; es decir, organizados en filas, columnas y tablas, con títulos para cada categoría que permite identificarlos. Los datos estructurados están escritos de tal forma que los motores de búsqueda entienden el contenido. Para gestionar este tipo de datos se utiliza un tipo de lenguaje de programación estructurado, conocido como SQL (Structured Query Language) diseñado para administrar y recuperar información de sistemas de gestión de bases de datos relacionales. Ejemplo de formatos de datos estructurados son XML, JSON y JSON-LD. Ver: SQL |
Datos no estructurados | Son los datos binarios que no tienen una estructura interna identificable. Por tanto, deben identificarse y almacenarse de forma organizada a través de una base de datos no relacional (NoSQL). Pueden ser textuales, numéricos, generados por humanos o por computadora. Ejemplos de datos no estructurados hechos por humanos: Archivos de texto como: archivos de texto de Microsoft Word, PDF, presentaciones. Correos electrónicos y Chats. Datos de redes sociales como Facebook, Twitter, LinkedIn. Archivos multimedia como MP3, imágenes digitales, audio y video. Ejemplos de datos no estructurados hechos por máquinas: Datos satelitales. Fotos y videos generados por cámaras de seguridad. Datos generados por sensores. Ver: NoSQL |
Datos personales | Son aquellos datos concernientes a una persona física, identificada o identificable. Los datos personales suponen la titularidad de la persona física a que se refieren. En consecuencia, implican cierto poder de control y disposición por parte de la persona concernida, así como el deber de confidencialidad de quienes son responsables de su tratamiento. Ver: Ley de Transparencia, Acceso a la Información Pública y Rendición de Cuentas de la Ciudad de México. |
Datos vinculados | Del inglés linked data, también conocidos como datos enlazados, son un método de publicación de datos estructurados para que puedan ser interconectados mediante tecnologías y protocolos web como http, rdf y los identificadores URI. Este método permite que los datos sean conectados, consultados y fácilmente localizados desde diferents fuentes. Ver: HTTP, Ver: URI, Ver: RDF, Ver: URL /// Denota datos estructurados en formato RDF en la WEB, identificados vía URI y accesibles vía HTTP. Los datos vinculados se enlazan con otros datos vía URI. |
Datum | Término usado para datos geográficos, es un sistema de referencia espacial que describe la forma y el tamaño de la tierra y establece un origen para los sistemas de coordenadas o referencia. |
DCAT | Siglas en inglés para Data Catalog Vocabulary, Es un volcabulario controlado del marco RDF (Resource Discovery Framework) diseñado para facilitar la interoperabilidad de los catálogos de datos publicados en Internet, mediante el uso de un modelo y vocabulario estándar. |
Diccionario de datos | Es un tipo de metadato que enlista de manera organizada los nombres, definiciones y características de cada uno de los campos o atributos de una base de datos y/o conjunto de datos y tiene por objetivo proveer un lenguaje común entre el autor(a) de dichos datos y sus posibles usuarios(as). |
ETL | Siglas en inglés para extraer, transformar y cargar; es el proceso de compilación de datos a partir de un número ilimitado de fuentes, su posterior organización, limpieza, transformación y centralización en un único repositorio. |
Excel | Es una hoja de calculo desarrollada por la empresa Microsoft y forma parte de la suite de sotware Microsotf Office. Permite realizar análisis básicos de datos, mediante herramientas gráficas, tablas calculares, entre otros. |
Firewall | Programa informático que busca mantener la seguridad en los datos, el software y el hardware, mediante el control al acceso de una computadora a la red y de elementos de la red a la computadora. |
Formato abierto | Formato para almacenar datos digitales que no impone restricciones, económicas o de otro tipo, sobre su uso y que puede ser procesado con al menos una herramienta de software libre y/o de código abierto. Ver: sotware libre; ver: código abierto. |
Formato legible por humanos | Es una representación de datos o información que las personas humanas pueden leer de forma natural. Pueden ser texto ASCII o UNICODE. |
Formato legible por máquina | Datos en un formato que pueda ser procesado de forma automática por una computadora, por tanto deben ser datos estructurados como CSV, JSON, XML, etc. |
GeoJSON | Es un formato de estándar abierto diseñado para representar caracterísitcas geográficas simples, junto con sus atributos no espaciales. Se basa en la notación de objetos JavaScript (JSON). Ver: formato abierto |
Gestión de datos | Conjunto de prácticas, procesos, y procedimientos, tanto tecnológicos y administrativos, que las organizaciones (en este caso Órganos de la Administración Pública) llevan a cabo con el objetivo controlar, proteger, aprovechar e incrementar el valor de los mismos. |
SIG | Sigalas par Sistema de Información Geográfica. Ver: Sistema de Información Geográfica |
Gobierno abierto | Modelo de relación entre los Órganos de la Administración Pública, las autoridades del poder legislativo y judicial, así como con los órganos autónomos y los habitantes de la Ciudad de México, que tiene como finalidad la co-innovación tecnológica, la participación social y relacional que impulse la elaboración, implementación y evaluación de políticas públicas, servicios públicos y programas gubernamentales, de forma abierta y transparente. |
Gobierno digital | Modelo de mejora y optimización de la calidad de los bienes y servicios de la Administración Pública de la Ciudad de México, a partir del uso estratégico de las tecnologías que permita facilitar a las personas el acceso, uso y realización de trámites y servicios públicos, de manera oportuna, simplificada, efectiva y con calidad, facilitando los vínculos de colaboración y participación social. Haciendo cumplir funciones de gobierno a partir del uso estratégico de las tecnologías de la Información y la Comunicación transparente; con el fin de establecer un modelo de mejora y optimización de la calidad de los bienes y servicios de la Administración Pública de la Ciudad de México, a partir del uso estratégico de las tecnologías que permita facilitar a las personas el acceso, uso y realización de trámites y servicios públicos, de manera oportuna, simplificada, efectiva y con calidad, facilitando los vínculos de colaboración y participación social |
Gobierno electrónico | El uso estratégico de las Tecnologías de la Información y Comunicación por la Administración Pública de la Ciudad de México para ofrecer servicios e información a las personas de manera receptiva, eficiente y efectiva, así como para relacionarse con estas para establecer vínculos de colaboración. |
GPS | Siglas en inglés para Sistema de posicionamiento global, un sistema de navegación satelital que proporciona información de localización, velocidad y tiempo de sincronización a cualquier equipo con un receptor adecuado (incluidos los teléfonos inteligentes modernos). El GPS es invaluable para muchas aplicaciones basadas en la ubicación, ya que proporciona a los usuarios, por ejemplo, información de búsqueda de rutas o pronósticos meteorológicos basados en su ubicación actual. |
Hadoop | Es una estrucutra de software (framework) de código abierto para almacenar datos y programar aplicaciones distribuidas que manejen grandes volúmenes de datos funciona por procesamiento distribuido (es decir, mediante nodos), escrito en lenguaje de programación Java. Ver: Java |
Hipertexto | Es un sitema no lineal de organización y presentación de datos que permite crear, agregar, enlazar y compartirlos desde diversas funetes por medio de enlaces asociativos. Se basa en la vinculación de fragmentos textuales o gráficos a otros fragmentos mediante dichos enlaces. Permite a las personas usuarias acceder a la información desde cualquiera de los ítems relacionados, y no necesariamente de manera secuencial. Lo que convierte a un texto en hipertexto es la enorme capacidad que le dan los vínculos o enlaces dentro de una estructura de múltiples ramificaciones. Este tipo de sistema de organización de la información es sólo posible gracias a la utilización de un medio digital, un hipertexto solo puede realizarse y tomar forma gracias a los ordenadores. |
Hoja de cálculo | Es un tipo de documento informático que permite manipular datos numéricos y alfanuméricos dispuestos en forma de tablas compuestas por celdas, las cuales se suelen organizar en una matriz de filas y columnas. El software más común para usar hojas de cálculo es Microsoft Excel. Una hoja de cálculo puede ser un conjunto de datos (dataset) pero no es una base de datos. Ver: conjunto de datos. |
HTML | Siglas en inglés de HyperText Markup Language (lenguaje de marcado de hipertexto) es un sistema de lenguaje de marcado para la elaboración de páginas web que define el significado y la estructura del contenido web. El lenguaje "marcado" permite etiquetar texto, imágenes y otro contenido para mostrarlo en un navegador Web. Este marcado ingluye elementos especiales predefinidos como <head>, <title>, <body>, <header>, <footer>, <article>, <section>, <p>, <div>, <span>, <img>, entre muchos otros. Ver: Hipertexto |
HTTP | Siglas en inglés de HyperText Transfer Protocol, es un protocolo de transferencia de comunicación mediante hipertextos, como HTML. Sigue un modelo cliente-servidor, en el que el cliente establece una conexión realizando una petición a un servidor quien envía la rspuesta. Este protocolo no guarda ningún dato o estado sobre las peticiones. Ver: HTML |
Información | Todo archivo, registro o dato contenido en cualquier medio, documento o registro impreso, óptico, electrónico, magnético, químico, físico o biológico que se encuentre en poder de los Entes Públicos. Ver: Ley de Transparencia, Acceso a la Información y Transparencia Gubernamental de la Ciudad de México. |
Interfaz de programación de aplicaciones | Ver: API |
Internet de las Cosas | Concepto que se refiere a una interconexión digital de objetos cotidianos con internet. |
Interoperabilidad | Capacidad de los Sistemas de Información de compartir datos y posibilitar el intercambio entre ellos. |
IoT | Internet of Things. Ver Internet de las Cosas. |
Java | Es un lenguaje de programación orientado a objetos cuya principal característica es que no debe ser recompilado para correr en alguna plataforma. Actualmente es de los lenguajes de programación más utilizados en el mundo por su versatilidad. |
JSON | JavaScript Object Notation. https://www.json.org/json-en.html. Es una sintaxis para almacenar e intercambiar información basada en texto, es un formato ligero utilizado para el intercambio de datos entre sistemas, pues para las máquinas resulta simple interpretarlo y generarlo. |
KML | Keyhole Markup Language. Lenguaje basado en XML para representar datos geográficos en tres dimensiones. Es un formato de archivo utilizado para mostrar datos geográficos en un navegador de la Tierra como Google Earth. |
Latitud | Es una coordenada geográfica que especifica la posición norte-sur de un punto en la superficie de la Tierra. |
Marco de descripción de recursos. | Ver RDF |
Metadatos | Los metadatos son datos que describen las características y propiedades de los datos; sirven para que las personas usuarias puedan buscar y consultar datos de forma más efectiva y eficiente, así como para la conformación de catálogos de datos. |
OWL | Web Ontology Language. |
Portable Document File. | |
PostgreSQL | Es un sistema de gestión de bases de datos relacionales de código abierto que fue desarrollado por voluntarios de todo el mundo |
Query | Es un tipo de "pregunta" que se le hace a una base de datos con respecto a la información que contiene. Muchas bases de datos basan su funcionamiento en querys, como MySQL. Una API permite que una app envíe querys a una base de datos en la web, lo cual simplifica el proceso de procesamiento de datos. |
R | Ver lenguage R R es un lenguaje y entorno para computación estadística y gráficos. R proporciona una amplia variedad de técnicas estadísticas (modelos lineales y no lineales, pruebas estadísticas clásicas, análisis de series temporales, clasificación, agrupamiento, ...) y gráficas, y es altamente extensible. https://www.r-project.org/about.html |
Raw Data | Ver Datos primarios |
Recursos de tecnologías de información | Son los conjuntos de datos, bases de datos, aplicaciones y sistemas de información digitales, tecnología (hardware, software, sistemas operativos, sistemas manejadores de bases de datos, redes, y demás aplicables) e instalaciones (recursos para alojar y dar soporte a los sistemas de información) en posesión de los Entes |
REST | Por sus siglás en inglés Representational State Transfer, es una arquitectura de desarrollo web que puede ser utilizada en cualquier cliente HTTP. Además, es mucho más simple que otras arquitecturas ya existentes, como pueden ser XML-RPC o SOAP. Esta simplicidad se consigue porque emplea una interfaz web que usa hipermedios para la representación y transición de la información. |
RDF | Resource Description Framework o Marco de descripción de recursos. Describe los datos vinculados. Los datos en RDF se estructuran en forma de "tripletes." Cada datum tiene tres elementos: sujeto, predicado y objeto. Se almacenan en bases de datos especializadas llamadas triplestore o almacén de RDF. |
RDF Schema | RDF Schema es una extensión del vocabulario básico de RDF. Proporciona un vocabulario para modelar datos. |
Servicio Web | Un servicio web es un sistema de software diseñado para admitir la interacción interoperable de máquina a máquina a través de una red. |
Servidor | Es una unidad central de procesamiento y almacenamiento de datos que permite la interacción de otros equipos de cómputo a través de una red que concentra los servicios habituales que permiten a los usuarios almacenar y acceder los archivos y aplicaciones que realizan tareas en beneficio directo del usuario final. Un servidor no necesariamente es una computadora de grandes capacidades. |
Shapefile | Es el formato vectorial más popular, este formato esta basado en ficheros que |
SHP | Es un formato simple y universal, que sirve para almacenar datos tabulares en texto simple, separados por comas y también es un formato abierto. |
Sistema de información geográfica | Un sistema de información geográfica (SIG) es un sistema diseñado para almacenar, administrar, capturar, manipular, analizar, y presentar datos espaciales o geográficos. |
SPARQL | Lenguaje basado en querys, similar a SQL, utilizado para datos vinculados en lenguajes de tripletes como RDF, que permite hacer búsquedas sobre los recursos de la Web Semántica utilizando distintas fuentes de datos. |
SQL | Structured Query Language. Es un estándar internacional para definir querys de bases de datos. |
triplestore | Ver Almacén de RDF. |
TSV | Tab Separated Values. Es un tipo de documento en formato abierto sencillo para representar datos en forma de tabla, en las que las columnas se separan por tabulacioness y las filas por saltos de línea. |
URI | Por sus siglas en inglés Uniform Resource Identifier que significan Identificador uniforme de recursos, es un formato estándar para identificadores en Internet /// Define un simple y extensible esquema para la identificación única en la red de recursos abstractos o físicos (reales). Un recurso puede ser cualquier objeto con una identidad clara (según el contexto de aplicación). |
URL | Uniform Resource Locator o Localizador uniforme de recurso. Se utiliza para identificar la dirección de una página web |
Usabilidad | Enfoque de experiencia de usuario (UX) que busca la facilidad con la cual un usuario utiliza o accede a un producto o servicio. Generalmente depende de que un producto o servicio se diseñe tomando en cuenta la experiencia de usuario (UX). |
UX | Experiencia de usuario. Se refiere al proceso de diseño de un producto o servicio que se basa en el entendimiento del usuario final. De acuerdo a este proceso, el diseño del producto o servicio debe tomar en cuenta los deseos, habilidades y limitaciones de los usuarios, de tal forma que el producto final les sea útil. Ver usabilidad. |
Visualización de datos | Es la presentación de información y datos en un formato gráfico, con los siguientes propósitos: la interpretación y construcción de significado a partir de los datos y la comunicación a partir del análisis presentado visualmente que ayude a comprender conceptos o identificar nuevos patrones. |
W3C | World Wide Web Consortium. Consorcio internacional que genera recomendaciones y estándares para asegurar el funcionamiento de la World Wide Web a largo plazo. |
Web API | Ver API. |
World Wide Web | Red informática mundial. De acuerdo al W3C, es un espacio de información en el cual ítems de interés, denominados recursos, se identifican mediante identificadores uniformes de recurso (URI por sus siglas en inglés). |
Web semántica | Es un esfuerzo colaborativo liderado por el W3C con la participación de numerosos miembros del sector académico, público y privado, que busca en crear una red mundial de datos. Consiste en dos elementos: 1) Formatos comunes para integrar y combinar datos de distintas fuentes 2) Lenguajes comunes para nombrar los datos |
Web-scraping | Su traducción en español "raspado de páginas web" consiste en la extracción de los datos relevantes o con significado de una o varias páginas web previamente seleccionadas, para su posterior manipulación y análisis. |
XLS | Es un archivo de plantilla de cálculo y de formato propietario Microsoft que restringe la utilización de este archivo por software de terceros. |
XLS (X) | Es un archivo de hoja de cálculo y de formato propietario Microsoft, de especificación abierta. |
XML | Extensible Markup Language. Es un lenguaje estructurado mediante etiquetas o marcas que aportan datos o información que se desea procesar. Fue desarrollado por la World Wide Web Consortium (W3C) y es muy útil para representar datos estructurados. |
XML Schema | Lenguaje para definir la estructura de los documentos XML. |