La velocidad con la que fluyen los datos también es un factor relevante para delimitar la información en el marco del Big Data, por consiguiente la creación, el flujo incesante en tiempo real y su utilización determina la naturaleza de la información (Gartner, 2011; Reimsbach-Kounatze, 2015). Claros ejemplos de lo anterior es la información de redes sociales y las miles y miles de transacciones financieras que se pueden realizar en cuestión de minutos. Por fuentes estructuradas se entienden, los datos que contienen campos fijos, definidos y ordenados.
Organizar dicha información manualmente es una tarea muy costosa en términos de tiempo y recursos (habría que clasificar alrededor de seiscientos cincuenta y cuatro cero registros de cada una de las ocupaciones correspondientes), por este motivo se ha recurrido al uso de Web Services16 y a la búsqueda de patrones o palabras clave para identificar a qué categoría ocupacional corresponden los anuncios de las plazas libres. En primer lugar, es necesario hacer una depuración del título de la vacante variable que tienen en común todas y cada una de las fuentes de información por medio de la minería de texto se hace la supresión de palabras que no contengan información sobre el perfil ocupacional, por ejemplo, «urgente», «se solicita», «necesario»; las preposiciones de la lengua española, nombres de empresas y los ayuntamientos y departamentos del país, entre otras muchas.
If you treasured this article and you simply would like to collect more info pertaining to abogados accidentes del trabajo copiapó generously visit our own web-page.