Documento

►

Estadísticas por tema

Agricultura y medio ambiente Ciencia y tecnología Demografía y Población Macroeconomía y finanzas públicas Precios e inflación

Industria, energía y construcción Mercado laboral Servicios Sociedad y condiciones de vida

Estadísticas experimentales

Ver detalles

►

Herramientas

Agenda estadística Sistema de Información de Mercado Laboral - SIMEL Banco de datos ENE Calculadora IPC Calculadora ICT Redatam

Buscador Asistido de Nomenclaturas Portal de Mapas INE.Stat Verificador de encuestadores Sistema de iniciativas estadísticas

►

Acerca del INE

Nuestra institución Plan Estratégico 2022-2026 Sala de Prensa Sistema estadístico nacional Inventario de registros administrativos

Área Internacional Calidad Estadística Conferencias Técnicas Participación institucional en ODS

Ver detalles

►

Regiones

►

Acceso Informantes

Personas

Información para personas encuestadas

Empresas

Información para empresas encuestadas

EN

Estadísticas por tema

Agricultura y medio ambiente

Ciencia y tecnología

Demografía y Población

Macroeconomía y finanzas públicas

Precios e inflación

Industria, energía y construcción

Mercado laboral

Servicios

Sociedad y condiciones de vida

Estadísticas Experimentales

Seguridad Ciudadana

Herramientas

Acerca del INE

Regiones

Acceso Informantes

Síguenos en redes sociales

EN

Información

Fecha:

Marzo, 2019

Autor:

Julio Guerrero / Julián Cabezas

Idioma:

Español

Documentos de trabajo Clasificación automática de textos utilizando técnicas de text mining: Aplicación a las glosas de la Encuesta Nacional de Empleo (ENE)

Documento de trabajo - Metodológico

Este documento explora los aspectos metodológicos relacionados con la clasificación automática de textos, tarea que consiste en asignar documentos de texto libres a una o más clases predefinidas, basadas en su contenido. Para este fin se describe la utilización de tres técnicas de machine learning: Naïve Bayes (NB), Support Vector Machine (SVM) y Random Forests (RF). Este estudio analiza las propiedades particulares del aprendizaje con datos de texto e identifica por qué estas técnicas son apropiadas para esta tarea. Una evaluación empírica de estas técnicas se realizó para apoyar los hallazgos teóricos, considerando la clasificación del “oficio, labor u ocupación” y del “sector económico” de la población ocupada a partir de los datos de la Encuesta Nacional de Empleo (ENE), recopilados durante 2017 por el Instituto Nacional de Estadísticas (INE). Las tres técnicas evaluadas mostraron buen desempeño en la tarea de clasificación, siendo SVM la de mejor desempeño, con una precisión global de alrededor del 90%. SVM logra un comportamiento sólido en una variedad de diferentes aprendizajes y es completamente automático, eliminando la necesidad de ajuste manual de parámetros.

Descargar Documento

Descargas complementarias

Sistema de Atención
Ciudadana a través de CRM

Le recomendamos utilizar este canal para contactarnos. Nuestro sistema CRM permite registrar y seguir cada caso dentro de los plazos establecidos por la normativa y gestionar de mejor manera a nuestros usuarios/as.

Ingresar

Norte

Centro

Sur

Personas

Empresas

Información

Documentos de trabajo Clasificación automática de textos utilizando técnicas de text mining: Aplicación a las glosas de la Encuesta Nacional de Empleo (ENE)

Descargas complementarias

Sistema de Atención
Ciudadana a través de CRM

Centros de atención Censo

Enlaces externos

Política de privacidad

Oficina de partes

Centros de atención

Norte

Centro

Sur

Personas

Empresas

Información

Documentos de trabajo Clasificación automática de textos utilizando técnicas de text mining: Aplicación a las glosas de la Encuesta Nacional de Empleo (ENE)

Descargas complementarias

Sistema de AtenciónCiudadana a través de CRM

Centros de atención Censo

Enlaces externos

Política de privacidad

Oficina de partes

Centros de atención

Sistema de Atención
Ciudadana a través de CRM