Como comentaba el otro día, estoy explorando aplicaciones de BigData utilizando Splunk.Para instalar Splunk, basta ir a la página web y buscar la descarga, está disponible para múltiples sistemas operativos, desde Windows Vista a Solaris, pasando por Linux y OS X. Aunque entre los sistemas operativos Windows que soporta no figura Windows XP, se puede elegir el paquete de Windows de 32-bit e instalar través del fichero MSI:
Para proceder a la descarga, es imprescindible creare una cuenta en Splunk.com, que se verifica mediante un mensaje de correo:
Una vez descargado, se puede clicar sobre el fichero MSI y empezará la instalación. No es necesario cerrar otras aplicaciones, pero si disponemos de un firewall, tendremos que autorizar acceso a internet para. las aplicaciones
En concreto, se instalan 2 servicios, Splunkd y Splunkweb, que pueden funcionar con el usuario local o con las credenciales de otro usuario (especialmente si se instala en un servidor)
Una vez confirmamos, Splunk empezará a indexar los datos:
Para proceder a la descarga, es imprescindible creare una cuenta en Splunk.com, que se verifica mediante un mensaje de correo:
Una vez descargado, se puede clicar sobre el fichero MSI y empezará la instalación. No es necesario cerrar otras aplicaciones, pero si disponemos de un firewall, tendremos que autorizar acceso a internet para. las aplicaciones
En concreto, se instalan 2 servicios, Splunkd y Splunkweb, que pueden funcionar con el usuario local o con las credenciales de otro usuario (especialmente si se instala en un servidor)
Una vez instalado, y arrancados los servicios, abrimos en el navegador: http://localhost:8000 y llegaremos a la pantalla de login, donde nos piden cambiar la contraseña. A continuación aparece la pantalla principal, desde donde podemos empezar a cargar datos:
Al pulsar el botón de la derecha, Add Data, aparece esta otra pantalla:
Lo habitual con Splunk es analizar datos de servidores, como los ficheros log de un servidor web, o eventos del registro de Windows. Pero en este caso quiero analizar datos del directorio de nuevas empresas. Para ello he extraído un fichero CSV con los datos de las empresas publicadas en los BORME de mayo.
Selecciono en Splunk la carga de un fichero o directorio de ficheros:
Existe la opción de previsualizar los datos antes de cargarlos, os lo recomiendo, por si hubiera algún error al elegir el fichero.
El sistema detecta automáticamente que se trata de un fichero CSV
Aquí podemos ver la previsualización. En la columna izquierda puedes ver una advertencia, ya que los campos de tiempo del Directorio de Nuevas Empresas sólo traen fecha, en vez de lo que espera Splunk que es un campo de fecha y hora completo.
Una vez confirmamos, Splunk empezará a indexar los datos:
El proceso de indexado es un poco lento en mi máquina, que es bastante antigua (por eso va con windows XP). Finalmente podemos proceder a realizar búsquedas, analizar y crear reportes de los datos. Pero eso será en la próxima entrada
El programa no es tan intuitivo como sería deseable, pero durante todo el proceso se puede consultar la documentación online de Splunk, que es muy completa, e incluye un e-book gratuito.
Es importante saber que la versión que se descarga es Splunk Enterprise. Se dispone de un periodo de prueba gratuito de 60 días, transcurrido ese periodo hay que comprar una licencia (cuyo coste depende del volumen diario de datos a tratar) o cambiar a licencia Splunk Free, que está limitada a procesar 500 MB diarios.
No hay comentarios:
Publicar un comentario