Compresión de datos
En ciencies de la computación, la compresión de datos ye l'amenorgamientu del volume de datos tratables pa representar una determinada información emplegando una menor cantidá d'espaciu. Al actu de compresión de datos denominar compresión», y al contrariu «descompresión».
Tipu | proceso técnico (es) |
---|---|
Etiqueta de Stack Exchange | Stack Exchange |
L'espaciu qu'ocupa una información codificada (datos, señal dixital, etc.) ensin compresión ye'l cociente ente la frecuencia de muestréu y la resolución. Poro, cuantos más bits empléguense mayor va ser el tamañu del archivu. Sicasí, el resolución vien impuesta pol sistema dixital con que se trabaya y nun puede alteriase el númberu de bits a voluntá; por ello, utilízase la compresión, pa tresmitir la mesma cantidá d'información qu'ocuparía un gran resolución nun númberu inferior de bits.
La compresión ye un casu particular de la codificación, que la so carauterística principal ye que'l códigu resultante tien menor tamañu que l'orixinal.
La compresión de datos básase fundamentalmente en buscar repeticiones en series de datos pa dempués almacenar solo'l datu xunto al númberu de vegaes que se repite. Asina, por casu, si nun ficheru apaez una secuencia como "AAAAAA", ocupando 6 bytes podría almacenase a cencielles "6A" qu'ocupa solo 2 bytes, en algoritmu RLE.
En realidá, el procesu ye muncho más complexu, yá que raramente consíguese atopar patrones de repetición tan exactos (salvu en delles imáxenes). Utilícense algoritmos de compresión:
- Per un sitiu, dalgunos busquen series llargues que depués codifican en formes más curties.
- Per otru llau, dellos algoritmos, como'l algoritmu de Huffman, esaminen los calteres más repitíos pa depués codificar de forma más curtia los que más se repiten.
- Otros, como'l LZW, constrúin un diccionariu colos patrones atopaos, a los cualos faise referencia de manera posterior.
- La codificación de bytes pares ye otru senciellu algoritmu de compresión bien fácil d'entender.
A la de falar de compresión hai que tener presentes dos conceutos:
- Redundancia: Datos que son repetitivos o previsibles.
- Entropía: La información nueva o esencial que se define como la diferencia ente la cantidá total de datos d'un mensaxe y la so redundancia.
La información que tresmiten los datos puede ser de tres tipos:
- Redundante: información repetitiva o predecible.
- Irrelevante: información que nun podemos apreciar y que la so eliminación por tanto nun afecta al conteníu del mensaxe. Por casu, si les frecuencies que ye capaz de captar l'oyíu humanu tán ente 16/20 Hz y 16 000/20 000 Hz, seríen irrelevantes aquelles frecuencies que tuvieren per debaxo o percima d'estos valores.
- Básica: la relevante. La que nun ye nin redundante nin irrelevante. La que tien de ser tresmitida por que pueda reconstruyise la señal.
Teniendo en cuenta estos trés tipos d'información, establécense tres tipología de compresión de la información:
- Ensin perdes reales: esto ye, tresmitiendo tola entropía del mensaxe (tola información básica ya irrelevante, pero esaniciando la redundante).
- Subjetivamente ensin perdes: esto ye, amás d'esaniciar la información redundante esaníciase tamién la irrelevante.
- Subjetivamente con perdes: esaníciase cierta cantidá d'información básica, polo que'l mensaxe va reconstruyir con errores perceptibles pero tolerables (por casu: la videoconferencia).
Diferencies ente compresión con y ensin perda
editarL'oxetivu de la compresión ye siempres amenorgar el tamañu de la información, intentando qu'esti amenorgamientu de tamañu nun afecte al conteníu. Sicasí, l'amenorgamientu de datos puede afectar o non a la calidá de la información:
- Compresión ensin perda: los datos antes y dempués d'estruyilos son exactos na compresión ensin perda. Nel casu de la compresión ensin perda una mayor compresión solo implica más tiempu de procesu. La tasa de bits siempres ye variable na compresión ensin perda. Utilízase principalmente na compresión de testu.
- Un algoritmu de compresión con perda puede esaniciar datos pa menguar entá más el tamañu, colo qu'amenorga la calidá. Na compresión con perda, la tasa de bits puede ser constante o variable. Una vegada realizada la compresión, nun puede llograse la señal orixinal, anque sí un aproximamientu que la so semeyanza cola orixinal va depender del tipu de compresión. Esti tipu de compresión dase principalmente n'imáxenes, videos y soníos. Amás d'estes funciones la compresión dexa que los algoritmos usaos p'amenorgar les cadenes del códigu refuguen información redundante de la imaxe. Unu de los formatos que dexa compensar esta perdida ye'l JPG, qu'emplega téuniques qu'anidien los cantos y árees que tienen un color similar dexando que la falta d'información seya invisible a güeyu. Esti métodu dexa un altu grau de compresión con perdes na imaxe que, munches vegaes, solo ye visible por aciu el zoom.
Ver tamién
editarReferencies
editarEnllaces esternos
editar- Procesamientu Dixital de Señales Acústiques utilizando Wavelets.
- Llista de manuales d'algoritmos de compresión ensin perda (enllaz rotu disponible n'Internet Archive; ver l'historial y la última versión).
- Compresión en Bases de datos (Teradata)
- Compresión d'archivos: formes, tipos y métodos