ANÁLISIS DE METADATOS DE NOTICIAS PARA LA EXTRACCIÓN DE INFORMACIÓN DE CÓDIGO FUENTE. EL  SOFTWARE METADADOSHTML

Moreno, María-José Baños. Felipe, Eduardo Ribeiro.  Sánchez, Juan Antonio Pastor.  Lima, Gercina Angela de.

ANÁLISIS DE METADATOS DE NOTICIAS PARA LA EXTRACCIÓN DE INFORMACIÓN DE CÓDIGO FUENTE. EL SOFTWARE METADADOSHTML

dc.contributor.author	Moreno, María-José Baños. Felipe, Eduardo Ribeiro. Sánchez, Juan Antonio Pastor. Lima, Gercina Angela de.
dc.date.accessioned	2026-03-21T01:06:12Z
dc.date.issued	2017-03
dc.description.abstract	Introducción. Los objetivos de este trabajo son 1) determinar qué esquemas se utilizan para título, resumen, palabras clave, autoría y periódico en prensa; 2), conocer qué pautas siguen los periódicos en la implementación de dichos esquemas; 3) averiguar cómo esto afecta a la extracción de valores de datos. Metodología. Para ello, se define una muestra de diarios y se analiza su código fuente, identificando esquemas utilizados y patrones de uso. Esto permite extraer valores de dato utilizando la aplicación MetadadosHTML. Resultados. Se han detectado esquemas estándar, ad hoc y propios de los periódicos. Se han hallado diversas prácticas, como valores agrupados en una misma línea de código o por separado; ruido en un valor y errores al referir los nombres de los atributos de esquemas estándar. Conclusiones. Ello dificulta la extracción de información, por cuanto es necesario no sólo conocer esquemas y atributos, hay que saber qué prácticas sigue cada medio. Los errores al referir los nombres de los atributos impediría la extracción de valores de dato siguiendo los esquemas. Es necesario avanzar en el uso de estándares. También resulta imprescindible la adopción de buenas prácticas en el uso de esquemas estándar, ad hoc y propietarios.
dc.identifier.citation	https://www.researchgate.net/publication/315210943
dc.identifier.uri	https://ceprecri-ds.eci.ufmg.br/handle/123456789/117
dc.language.iso	es
dc.publisher	Information Research an international electronic journal
dc.subject	Metadatos
dc.subject	esquemas de metadatos
dc.subject	periódicos
dc.subject	palabras clave
dc.subject	extracción de información
dc.subject	MetadadosHTML
dc.subject	HTML
dc.subject	Open Graph Protocol
dc.subject	Twitter Cards
dc.subject	Schema.org
dc.subject	The New York Times
dc.title	ANÁLISIS DE METADATOS DE NOTICIAS PARA LA EXTRACCIÓN DE INFORMACIÓN DE CÓDIGO FUENTE. EL SOFTWARE METADADOSHTML
dc.type	Article

Files

Original bundle

Now showing 1 - 1 of 1

Name:: 2017_Análisis de metadatos de noticias para la extracción de información del código fuente. El software METADATOSHTML.pdf
Size:: 1.02 MB
Format:: Adobe Portable Document Format

Download

License bundle

Now showing 1 - 1 of 1

Name:: license.txt
Size:: 1.71 KB
Format:: Item-specific license agreed to upon submission
Description:

Download

Collections

Artigos