mardi 24 janvier 2012

Dividir un archivo de texto en medio (o cualquier otro porcentaje) en Ubuntu Linux

Si usted tiene un archivo de texto difícil de manejar que usted está tratando de proceso, la división en secciones a veces puede ayudar el tiempo de procesamiento, sobre todo si se va a importar un archivo en una hoja de cálculo. O es posible que desee recuperar sólo un conjunto de líneas de un archivo.

Introduzca división, wc, cola de gato, y grep. (No te olvides de sed y awk). Linux contiene un completo conjunto de utilidades para trabajar con archivos de texto en la línea de comandos. Para nuestra tarea de hoy vamos a dividir el uso y aseo.

En primer lugar, eche un vistazo a nuestro archivo de registro ....

> Ls-l
-Rw-rr-1 thegeek ggroup 42046520 19/09/2006 11:42 access.log

Vemos que el tamaño del archivo es de 42MB. Eso es un poco grande ... pero el número de líneas estamos tratando? Si quisiéramos importar esto en Excel, que tendría que mantenerlo a menos de 65 mil líneas.

Vamos a comprobar la cantidad de líneas en el archivo mediante la utilidad wc, que significa "Contar palabras".

> Wc-l access.log
146330 access.log

Estamos muy por encima de nuestro límite. Vamos a tener que dividirla en tres segmentos. Vamos a utilizar la utilidad de división para hacer esto.

> Split-l 60000 access.log
> Ls-l

total de 79.124
-Rw-rw-r-1 thegeek ggroup 40465200 19/09/2006 12:00 access.log
-Rw-rw-r-1 thegeek ggroup 16598163 19/09/2006 12:05 xaa
-Rw-rw-r-1 thegeek ggroup 16596545 19/09/2006 12:05 xab
-Rw-rw-r-1 thegeek ggroup 7270492 09/19/2006 12:05 xac

Ahora hemos dividido nuestros archivos de texto en 3 archivos separados, cada uno con menos de 60.000 líneas, lo que parecía un buen número para elegir. El último archivo que contiene la cantidad sobrante. Si se va a cortar este archivo en particular en el medio, usted tendría que hacer lo siguiente:

> Split-l 73165 access.log

Y eso es todo lo que hay que hacer.

Aucun commentaire:

Enregistrer un commentaire