Compartir

Hoy os traemos un artículo un tanto diferente. Analizaremos los formatos de compresión más populares que nos permiten comprimir cualquier tipo de archivos sin perder información. ¿Cuál es rápido? ¿El más potente? ¿Y el más usado?

¿Qué es la compresión de archivos? ¿Qué significa comprimir?

¿Alguna vez te topaste con algún archivo que ocupaba demasiado y no sabías cómo hacer que ocupase menos para, por ejemplo, mandárselo a un amigo por correo? Para eso está la compresión.

Comprimir un archivo nos permite reducir el tamaño del mismo. De esta forma, ocupará menos espacio en el disco duro, y será más fácil mandarlo. Dependiendo del tipo de archivo y tipo de compresión usada, su tamaño se reducirá más o menos.

Tal y como acabamos de decir hay varios tipos de métodos de compresión:

  • Con pérdidas. Este es el método de compresión usado para comprimir archivos de vídeo, audio o imágenes, por ejemplo. La principal característica de este método de compresión es que al comprimir se realizan aproximaciones, por lo que el archivo multimedia reduce el tamaño. El problema es que la aproximación es algo irreversible, y por tanto se perderá calidad al ver/reproducir el archivo multimedia.
  • Sin pérdidas. Al contrario que en el anterior caso, en este no se pierde información. En este método se buscan patrones que se repitan, además de otros métodos más avanzados. Con esto se consigue que se reduzca el tamaño de un archivo sin perder información ni calidad, aunque obviamente no se reduce tanto el tamaño del archivo.

Qué formatos de compresión hay y cuáles son más populares

En cuanto a formatos y métodos de compresión tenemos una amplia gama:

  • Con pérdidas. En el caso de con pérdidas tenemos multitud de formatos dependiendo de para que estén destinados. Esto se debe a que los algoritmos de compresión sólo valen para un tipo de archivos, es decir, si intentas comprimir un archivo de audio con un algoritmo de compresión de imagen, no funcionará. ¿Y cuáles tenemos en este ámbito? Por ejemplo, en el caso de imágenes tenemos JPEG, que es el más popular. En vídeo tenemos formatos como MPEG (todas sus variantes), MP4 y OGG. En el caso de audio tenemos AAC, OGG y WMA. Seguro que alguno de estos ya os sonaban, ¿no?
  • Sin pérdidas. Pero todos esos formatos de compresión con pérdidas no nos interesan para este artículo. Nos interesan los formatos sin pérdidas, entre los cuales destacan los algoritmos genéricos (que comprimen cualquier tipo de archivo), como el ZIP o el RAR. Éstos son los más populares, sobre todo el ZIP, pues es el que viene por defecto en la mayoría de los sistemas operativos.

Comparación de los formatos de compresión sin pérdidas genéricos

Ahora procederemos a analizar los formatos de compresión más famosos. En concreto analizaremos el ZIP, GZIP, BZIP2, TAR y 7z. ¿Y que pasa con el RAR? Si bien éste es el segundo más popular, éste no es libre, y por tanto no lo analizaremos en este artículo. Además, al ser un formato propietario la compresión en este formato es complicada sin contar con la aplicación oficial (aunque no hay problemas al descomprimir).

El primer parámetro que analizaremos será la velocidad de compresión. ¿Cuál es el más rápido comprimiendo? Para estas pruebas hemos comprimido una máquina virtual, y lo hemos hecho en un MacBook Pro con un Intel i5 de segunda generación y 8GB de RAM (la compresión se hizo sobre un disco HDD de 5200rpm conectado internamente por SATA). Además mencionar que usamos la herramienta Keka, que es compatible con macOS y es gratuita.

Qué formato de compresión es más rápido

Para nuestra segunda prueba veremos justo lo contrario. ¿Cuánto tarda en descomprimirse?

Tiempo que tarda en descomprimir

Y por último, ¿qué parámetro nos queda por comprobar? Pues el grado de compresión, sin duda. Si no analizamos cuánto espacio ahorramos este artículo perdería su sentido. Pues bien, este es el resultado:

Cuánto comprime cada formato de compresión

Como podemos ver, el que más comprimió resultó ser 7z.

Y el que menos TAR … de hecho no comprimió nada … ¿por qué? Por un sencillo motivo: os he engañado. Tar no es un formato de compresión, sino que es un archivo contenedor. Es decir, no reduce el tamaño, sino que sólo engloba varios archivos en uno, es como convertir una carpeta en un archivo directamente (lo que técnicamente se conoce como empaquetar). Este formato es usado junto con otros como BZIP2 o GZIP, pues estos sólo comprimen, no empaquetan.

Modo de compresión

Por último, para concluir este artículo mencionar que la gran mayoría de formatos permiten seleccionar la cantidad de compresión. El modo “normal” es el que usamos para las pruebas anteriores y el más recomendado, pues comprime lo suficiente pero no tarda mucho. La diferencia en cuanto a compresión entre el “normal” y el de mayor compresión es poca, pero el tiempo que tarda es mucho mayor. En cambio, si usamos el modo más rápido este apenas comprimirá. Por tanto, es necesario un equilibro.

Para hacer la prueba comprimimos el mismo archivo que antes en ZIP con la máxima y mínima compresión. Aunque, esta prueba se podría realizar también con los otros formatos (menos Tar, pues no comprime). Éste es el resultado:

Mejor modo de compresión

Conclusión

Esos son los resultados que hemos obtenido de nuestras pruebas. Esperamos que os sirvan como referencia, aunque no como algo exacto. Sobre todo, el resultado de las pruebas de tiempos hay que tomarlos con cuidado, pues muchas cosas pueden influir en eso. Pero sirve para hacernos una idea.

Como podéis ver, hay multitud de formatos y multitud de opciones. ¿Con cuál os quedáis vosotros? ¿Cuál usáis habitualmente? Yo suelo usar *.zip, aunque en ocasiones también uso *.tar.gz, por su enorme versatilidad.

No os olvidéis de comentarnos si queréis más artículos de estos, o si os gustaría que explicásemos como funcionan internamente.

mm
Soy Xoán Carlos Cosmed Peralejo, una mente curiosa con forma de estudiante de "Ingeniería de Tecnologías de Telecomunicaciones" en Vigo. Amante de la ciencia y la tecnología.
  • Samuel Peters

    Yo, desde siempre, he usado .7Z, más que todo por que usaba su programa homónimo “7zip”, y me anime a usar la alternativa que me ofrece el mismo programa, que suerte la mía que usaba de los que comprimen más sin darme cuenta xD

    • Samuel Peters

      Post Data: noto que mencionas el “.tar.gz”, ese formato solo lo he escuchado de los programas lanzados para distros de linux, sin embargo nunca llegue a descargar ningún archivo de ese formato (ya que prefería buscar un “.deb”, debido a que son más sencillos de instalar), y mucho menos comprimir algo bajo el mismo. ¿Qué tal es, en términos más específicos? Me da curiosidad ñ-ñ

      • Xoan Cosmed

        La compresión de los archivos *.tar.gz se realiza con Gzip para después empaquetarlo en un archivo Tar. Por tanto, en las tablas que he hecho, los archivos *.tar.gz se rigen por la columna de “Gzip”.

    • Xoan Cosmed

      Habrá sido intuición jajajaj