压缩文件是什么原理?

一个100M的文件,压缩后剩90M。同样的数据,少了10M,怎么实现的?

首先,计算机是基于二进制的,所以所有的数据都可以用0和1来表示。这样一来,在一大串数据中,同样的一小段数据重复的几率就会很高,比如111可能会重复多次出现。这样一来,我们假如用a来代替111,用b来代替000。那么例如原本一串111000111111000的数据就可以表示为abaab,这样就能使得冗长的数据变得精简,达到压缩的目的。

二进制

压缩文件有多种不同的格式,其中以ZIP和RAR的普及率最高。不同的压缩格式基于不同的算法,就像运用了不同的翻译密码,因此,在压缩效果方面也存在着差异,各有优势。ZIP格式压缩速度较快而压缩率较低,RAR压缩速度较慢但压缩率较高。

压缩又分为有损压缩和无损压缩。有损压缩一般运用于音频、视频、图像等领域,如jpg、mp3等文件格式都属于有损压缩。它利用了人类对图像中的某些信息和声波中某些频段不敏感的特性,在压缩过程中将一些信息忽略,因此经有损压缩后,原有的信息将无法被完美还原;无损压缩则在压缩过程中能将原有信息进行等效压缩,ZIP和RAR就属于无损压缩。

(0)

相关推荐