为什么直到现在 RAR 仍然比 7Z 更流行?
如题,记得很久之前各个网站门户就通过评测认为 7-ZIP 比 winRAR 在多个方面优秀,而 7-ZIP 还是一个免费开源软件,为什么这么多年过来,即使解压软件各有不同,但 7z 始终无法取代 rar 呢?日常生活中 rar 远远比 7z 更常见,无论国内外还是新旧数据,是 7-ZIP 进步太慢还是 winRAR 活力依旧,亦或是 winRAR 形成了类似 windows 的垄断?
任何一样产品,如果沒有人用,那么只可能是一个原因——
它不好用。
绝对不可能是其他的原因。什么垄断啊,什么用户懒惰啊,这些原因都是不存在的。
7-Zip也是如此。
至于什么「7-ZIP比winRAR在多个方面优秀」这种说法,只是7-Zip往自己脸上贴金而已。
举个栗子,这是我公司的一个文件夹:
我就不说正宗的7-zip软件了,那玩意儿跟winRAR根本沒法比。我说说最近比较火的bandizip,这个软件也支持7z格式。
用bandizip压缩一下,选择zip格式,耗时4秒。
换7z格式压缩,耗时20秒。
zip格式压缩包的大小是79.9M,7z格式压缩包的大小是76.9M。7z格式只比zip格式小3%,但是压缩耗时多了4倍。这种情况下,7z的优势何在?
当然,我们可以修改参数。我把压缩级別调成快速压缩,再用7z格式压缩一遍,结果如下:
耗时8秒,压缩後的文件大小变成了79.8M。
同样的文件,我用winRAR,标准压缩成rar文件,耗时也就是8秒。快速压缩成rar文件甚至能达到跟zip文件同样的4秒速度。
7z总是吹它的压缩率,其真正的原因是:它能吹的也就只有压缩率了。压缩率高3% ,或者高5%,代价是压缩解压速度慢一倍以上,这沒什么值得骄傲的。
下面是谷歌官方做的一个评测:
Deflate是zip使用的算法,Lzma是7z使用的算法。把Deflate:9和Lzma:1做比较:
7z的压缩率比zip高(3.847÷3.371-1)×100%=14%
zip的压缩速度比7z高(15.5÷10.2-1)×100%=52%
zip的解压缩速度比7z高(347.3÷70-1)×100%=396%
7z別说打败rar了,它连把zip按到地上摩擦都做不到。原文是这样说的:
表明了Zopfli,LZMA,LZHAM,和 bzip2在压缩和解压缩时占用CPU时间较长,不会直接代替deflate。
Lzma算法的速度是如此之慢,以至于很多人使用7z时都误以为自己的电脑中病毒了,因为它实在是太慢了。
看看这位,他下载了一个16GB大小的7z格式的压缩包花了10分钟,然後解压缩花了10个小时。
7z的压缩包解压真是慢啊,是CPU的问题还是设置问题?求大佬帮解【cpu吧】_百度贴吧
再来做个实验。
我们知道文字类的文件是最容易压缩的。我随便下了几篇网文,加起来一千多万字,分別压缩成zip、7z、rar格式做比较。其中zip和7z用的是好压5.9版,rar用的是WinRAR5.71版,全都采用默认配置。
好压压缩成zip格式耗时2秒,压缩速度14.4M/秒,压缩率39.9%。
好压压缩成7z格式耗时30秒,压缩速度1.2M/秒,压缩率25.6%。
WinRAR压缩成rar格式耗时4秒,压缩率26%。
三个文件的大小比较:
7z凭什么取代rar?
2019年9月26日更新:
本文的所有实验都是简单且可复现的。
上面我们已经以实验的方式说明了为什么不要使用7-Zip压缩的7z格式,下面我们继续以实验的方式说明为什么不要使用7-Zip压缩的zip格式。
这次我还是不用正宗的7-Zip,我用360压缩举例说明。
新建一个文档:
用360压缩制作成zip格式:
点「压缩包语言」,选择「繁体中文」,不出意料地乱码了:
可能有人知道这是因为zip格式不支持Unicode文件名。但是同一个文件,我用2345好压制作成zip格式,换成360压缩打开:
点「压缩包语言」,选择「繁体中文」,这次沒有乱码!
这说明,用2345好压制作的zip文件,跟用360压缩制作的zip文件,是不一样的,不会出现文件名乱码。
事实真相是:並不是zip格式不支持Unicode文件名,而是用7-Zip压缩制作的zip格式不支持Unicode文件名。请注意这其中的差別。
上面说的是360压缩,怎么又跑到7-Zip上面去了?这是因为国产的所有压缩软件,除了好压之外,全都是7-Zip加了个壳。所以7-Zip有的缺点,他们全都有。
我刚试了下7-Zip目前最新的19.00版本,不出意外地发现它依然不支持Unicode文件名。而只要7-Zip不支持Unicode文件名,像360压缩这种7-Zip加壳软件也绝不可能支持Unicode文件名。
现阶段最好用的压缩软件还是好压和WinRAR,如果实在觉得广告讨厌可以用WinZip。
为什么不推荐bandizip呢?因为我讨厌它的推广方式。比方说下面这个表:
这个表是假的。WinZip和WinRAR都支持Unicode文件名,都支持7z的分卷压缩文件,目前也都是免费软件,剩下的「快速拖曳」和「高速压缩」我不太清楚是什么,估计也不是什么重要的东西。总之这个软件的虚假宣传很严重。
2019年9月27日更新:
重大發现!!!
刚才我用WinZip顺手压缩了一下前两天下载的网文,结果:
我第一反应是:我是不是看错了?因为同样的文件,其他压缩格式是这个效果:
zipx怎么可能比7z还小?
我想了一下觉得可能是参数的问题,于是上7-Zip:
极限压缩+LZMA2+64M字典+256单词大小。这次不在乎压缩时间,就冲着最大压缩比去了。但是结果不理想,压缩到9000多K,只比原来小了一丁点:
我就觉得:这个zipx格式有点意思啊!
上WinZip官网查了一下,人家是这么说的:
zipx包含BZip、LZMA、PPMd、XZ(LZMA2)、MP3、Jpeg、Wavpack七种压缩算法,实际使用的时候会自动选择合适的压缩算法。
然後我又查到PPMd算法对文本文档有加成,于是猜想WinZip使用的是PPMd算法,于是又一次上7-Zip:
这次选择极限压缩+PPMd算法+512M字典+32单词大小,冲最高压缩比。结果8000多K,就比zipx大了一丁点:
那么WinZip是根据什么判断原文件的格式呢?我猜测是後缀名,于是我把这几个文件的後缀名都删了,再用WinZip压缩,结果果然大了很多。
结论出来了:WinZip会根据文件後缀名猜测文件的格式,自动选用相应的压缩算法。
我觉得这个功能很牛逼啊,根本就是自动档和手动档的区別。这么说的话,WinZip的zipx就是目前压缩率最高的格式,因为我还沒有见过別的压缩软件有智能选择压缩算法这种黑科技。
注意必须是WinZip的zipx格式。bandizip的zipx格式是假的,就是7z换了个後缀名而已,沒有这么高的压缩能力。
9月28日更新:
这种看法是错误的。
好压、WinRAR、WinZip、bandizip这四款压缩软件制作的zip文件彼此通用,也就是说他们都是标准zip格式。
这四款软件都使用Unicode文件名,把这四款软件制作的zip文件拿到韩国去,拿到日本去,拿到世界上任何一个地方去,都不会乱码。只有7-Zip以及360压缩这种7-Zip加壳软件才会有文件名乱码问题。
实际上,对于Zip格式来说,Unicode文件名是可选的。7-Zip选择不支持Unicode文件名是有它自己的想法,因为加入Unicode支持会导致压缩包变大,然後研發7-Zip的那帮人觉得压缩率更重要,所以他们不支持Unicode。
7-Zip官网说7-Zip创建的 zip 格式比大多数其它压缩软件创建的都小 2-10%。大家都用一样的zip格式,凭什么你就比我小?就是因为7-Zip放弃支持Unicode。
「Zip格式本身沒有定义Unicode文件名」,我还真不好说这句话是错的。实际上这句话的正确说法是「Zip格式本身沒有定义一定要用Unicode文件名」,zip格式可以使用Unicode,也可以不使用Unicode,选择权在压缩软件,WinZip和bandizip的Unicode支持就是可选的。
7-Zip不加入对Unicode的支持,把压缩包缩小2-10%,它只说後者不说前者,只说好事不说坏事,这就是宣传。
9月28日更新:
评论区有人指出7-Zip支持Unicode,但是需要手动添加参数。我试了一下,是真的。看来7-Zip还是能用的,只是需要使用者拥有很强的专业知识,对普通用户不够友好。
评论区有人说7-Zip默认不支持Unicode是为了兼容老的程序。这裡我给大家看一段bandizip的帮助说明:
UTF-8是用于存储Unicode的标准字符编码方法,其被开发用于显示各种语言。
由于Unicode和UTF-8是在20世纪90年代之后开发的,因此ZIP格式的初始版本(在20世纪80年代制造)不支持UTF-8。 由于ZIP格式成为标准档案格式并且需要支持Unicode,因此,已经引入了几种方法来处理ZIP文件上的UTF-8字符串。
Bandizip支持其中两种;一种方法是将文件名转换为UTF-8,另一种方法是将额外的UTF-8文件名存储在额外的头字段中,同时将原始文件存储在MBCS中。
在Zip文件中使用Unicode文件名(UTF-8)
Bandizip将文件名存储在ZIP文件中,并将其转换为UTF-8。 它是由APPNOTE定义的标准文件名存储方法,但是一些压缩程序偶尔无法识别ZIP文件或错误处理它们将导致文件名损坏。
将Unicode文件名存储在Zip文件的额外头字段中(UTF-8)
Bandizip将附加UTF-8文件名存储在ZIP格式的额外头字段中,同时将原始文件存储在MBCS中。 此方法也由APPNOTE定义为“Info-ZIP Unicode Path Extra Field(ZIP信息U码路径额外字段)”。 因为它使用额外字段来存储UTF-8文件名,所以文件大小将比前者大几十字节。 但是,原始文件名存储在MBCS中,因此文件更安全,更兼容。
由于大多数压缩程序(如7zip,Winrar和Winzip)都支持此功能,因此可以防止文件名在使用不同系统语言的操作系统中被破坏。
Unicode filenames in ZIP format
简单点说就是zip支持Unicode有两种方式,第一种方式是直接把文件名从本地代码转换成UTF8存储在zip文件中,第二种方式是依然在zip文件中存储本地文件名代码,然後把本地文件名代码转换成UTF8存储在ZIP文件的额外头字段中。第一种方式有可能会出现兼容性问题,第二种方式因为存储的还是本地文件名代码,所以绝对不会出现兼容性问题,但是这样就相当于把文件名存了两次,所以文件会大一些。
大家猜猜,好压、WinRAR、WinZip,以及加了cu参数的7-Zip分別支持哪一种Unicode存储方式?
实测好压支持的是第一种。
上面我用好压制作了一个「新建文本文档.zip」,裡面内容就是一个名为「新建文本文档.txt」的空文档,我用notepad++打开是这个样子的:
一堆乱码,注意那个「金區板缓XXXXX.txt」其实就是「新建文本文档.txt」的乱码。
选择UTF8编码。
正确的文件名就出来了。
我再把这个名为「新建文本文档.txt」的空文档用WinRAR压缩成zip格式,用notepad++打开:
注意前面是正确的文件名「新建文本文档.txt」,後面是乱码。
选择UTF8编码。
前面变成乱码,後面显示正确的文件名「新建文本文档.txt」。
这个用WinRAR制作的文件比先前用好压制作的文件大了48个字节。
这就是第二种方式,实测WinZip用的也是这种方式。
至于7-Zip,它用的是跟好压一样的第一种方式。
我们理一下思路:
zip文件有三种方式,第一种支持Unicode兼容性一般,第二种支持Unicode兼容性好但体积最大,第三种不支持Unicode体积最小。
好压使用的是第一种方式,WinRAR和WinZip使用的是第二种方式。7-Zip默认第三种方式,加入cu参数後是第一种,不支持第二种。
实际上像WinRAR和WinZip这种国际性大公司才是最在乎兼容性的,自由软件开發者我感觉都不太在乎兼容性。
9月30日更新:
说说bandizip这个软件。
安装之後右键菜单会多出来一个「新建文件夹」选项。
然後是传说中的压缩包预览功能。
發现问题所在了吗?bandizip佔的位置太大了,好压和WinRAR都只佔了四五行,bandizip一个软件就佔了十几行,挤得右键菜单都显示不全了。
按道理说,如果我想知道压缩包裡有什么,直接双击打开不就可以了吗?所以我给压缩包预览功能的评价是负分。
还有那个自动解压功能。压缩包裡面有个A文件夹,A文件夹裡面有个B文件,换別的软件解压出来都是A文件夹裡面有个B文件,而bandizip解压出来直接就是B文件,我还得自己建个文件夹把B文件放进去。
总之,许多bandizip吹爆的特性,反而给我造成了困扰。而去掉这些特性,bandizip就不剩什么了。
而且我认为bandizip的界面很「简陋」,这裡说明一下,我所谓的「简陋」意思可能和別人不太一样。
来对比一下。这是bandizip的压缩界面:
这是好压的压缩界面:
bandizip只有一个压缩时间。好压则是压缩时间、压缩速度、压缩率、文件个数什么都有。这就是我所谓的「简陋」,即功能上的「简陋」。
再来看看好压的配置界面,可以自定义压缩算法、字典大小、单词大小。以这个配置压缩解压需要多少内存直接给你标出来。7-Zip也不过如此了吧。
还可以编辑过滤列表,对不同後缀名的文件采用不同的压缩配置。
这就是为什么我宁愿使用有广告的好压,也不用干净清洁小巧的bandizip。
10月1日更新:
刚才测试了一下Win7自带的explorer.exe对zip文件的支持情况,结论如下。
explorer压缩zip文件不支持Unicode,但是可以打开Unicode文件名的zip文件,实测好压和WinRAR压缩的zip文件都可以打开。
explorer只支持deflate和deflate64两种压缩算法,不支持其他压缩算法。
10月2日更新:
感觉好像歪楼了,题目问的是为什么RAR 比 7Z 更流行。我总结一下,7-Zip相比于RAR至少有三大缺点:
⒈界面简陋
⒉压缩耗时高,佔用内存多(在有的人眼中这是优势)
⒊稳定性差,压缩包容易损坏
第三点不是我说的,我给大家摘一段bandizip对7z格式的评价(链接):
为了实现更高的压缩比,7z使用了包括报头压缩在内的各种方式。
但是,由于这些功能,当压缩文件受到轻微损坏时,几乎不可能恢复它。
因此,在以7z格式备份重要文件时,请注意不要损坏它们。
您可以在7Z网站上找到有关如何恢复损坏的7Z文件的信息,但即使对专家来说,完成恢复也是极其困难的。
有人说这是商业软件的刻意抹黑,我给大家转一段开源界大佬对7z的评价(链接):
The [LZMA2 format] contains an unrestricted mix of LZMA packets and uncompressed data packets. Each packet starts with a header that is not protected by any check sequence in spite of containing the type and size of the following data. Therefore, every bit flip in a LZMA2 header causes either a framing error or a desynchronization of the decoder. In any case it is usually not possible to decode the remaining data in the block or even to know what failed. Compare this with [Deflate] which at least does protect the length field of its non-compressed blocks. (Deflate's compressed blocks do not have a length field).
这段文字是什么意思呢?我简单解释一下,LZMA2是7z的默认压缩算法,用这种算法压缩文件会产生这么一种情况:
假如一个普通文件内容是「ABCDEFG」,然後它第二个字节损坏了,我们看到的就是「A?CDEFG」。但如果这是一个使用了LZMA2算法的7z压缩包,我们看到的就是「A??????」。
Therefore, every bit flip in a LZMA2 header causes either a framing error or a desynchronization of the decoder. In any case it is usually not possible to decode the remaining data in the block or even to know what failed.翻译:因此,在LZMA2报头中的每个位翻转都会引起解码器的帧错误或者同步失调。在所有情况下,通常都不可能解码块中的剩余数据,甚至都不知道哪里错了。
最後,这位大佬给出的建议是:不要用LZMA2算法储存重要文件。
也就是说,如果你坚持使用7z格式,那么你就祈祷吧,祈祷压缩包裡一个字节错误都不要有。因为只要出现一个字节错误,整个压缩包就废了。
所以,即使不考虑时间因素,rar相比于7z仍然是有优势的。
10月4日更新:
今天评论区还有人对我说:你说的不对,zip格式不支持Unicode。唉……
说个可能会违反大家常识的事:一般人可能会认为7-Zip这种免费软件靠的是口碑,WinRAR这种商业软件靠的是宣传。
错!
真实的情况是:WinRAR靠的是口碑,而7-Zip靠的是宣传。
我印象中从来沒见过WinRAR做广告宣传过它自己。WinRAR崛起靠的是它良好的口碑带动人民群众用脚投它的票。
7-Zip並不是缺乏宣传推广,而是它的宣传推广已经过头了。过头到什么程度?明明是7-Zip自己的zip格式不支持Unicode,现在好多人以为全世界的zip格式都不支持Unicode。7-Zip的bug已经快变成feature了。
我试过很多压缩软件,只有7-Zip的zip格式默认不支持Unicode。其他不支持Unicode的软件,我都能在他们的安装目录裡找到7z.dll,这些软件都是直接把7-Zip的东西拿过来用,都不带改的。
有人说什么国外都用7z,于是就有了这么一个有趣的问题:(为什么 Linux 要用 tar.gz,很少用 7Z 或 ZIP)?作为一个自由软件,7z连它的大本营linux都沒有搞定。
还有人说什么国外注重版权,都不用rar。我给大家看一张英文维基百科的截图:
英文维基百科对rar的评价是:second in popularity to .zip files.人家对7z可沒有这么高的评价。
类似的还有bandizip,有人做宣传说bandizip支持Unicode,而WinZip和WinRAR都不支持?
我發现,像7-Zip和bandizip这种免费软件,其官网还是比较靠谱的,基本沒什么虚假宣传。但是其免费的特征,会招来一群人帮他们做免费宣传。然後这群人中的大部分啥都不懂,但是想象力很丰富,会自动脑补出一些並不存在的东西。比方说他们看到7-Zip宣传自己的7z格式支持Unicode,就会自动脑补成zip格式不支持Unicode;他们看到bandizip宣传自己的zip格式支持Unicode,就会自动脑补成別家的zip格式不支持Unicode。明明bandizip的大标题是「ZIP格式的Unicode文件名」,正文说的是「我们和WinZip、WinRAR一样都支持Unicode」,这些人连点进去看一眼正文的想法都沒有。
然後这些人对他们宣传的东西有一种谜之自信。有人说7z格式易损坏,马上就会有人跳出来说你有什么证据?沒有人会把自己的缺点放在官网上宣传,然後这群人的逻辑是:7z不说它有这个缺点,那么它就沒有这个缺点,你这样造谣污蔑肯定是收了钱的。
为什么我说7z易损坏的时候要引用那么多资料呢?因为我害怕被人喷。
10月6日更新:
我记得我已经把这个评论踩下去了。怎么又被顶上来了?
这个评论存在事实错误。因为我用的都是默认配置,7z的默认配置是16M字典大小:
WinRAR的默认配置是是32M字典大小:
居然还有43个赞,可见7z的虚假宣传多么严重了。
市场永不失效。——这是我学了经济学之後最大的收获。
一提起市场失效,大部分都会想到德沃夏克键盘和QWERTY键盘的故事。我学经济学之前也认为这是一个市场失效的典型案例。但是後来我知道了三点我以前不知道的东西:
⒈德沃夏克键盘是有专利的,每一个使用德沃夏克键盘的人都要给德沃夏克交专利费,而QWERTY键盘免费。
⒉所有德沃夏克键盘优于QWERTY键盘的实验,都是德沃夏克自己搞的,他是在推销自己的产品,所以其实验的真实性值得怀疑。
⒊德沃夏克键盘並不完美,比如说现代英语中I的使用频率远高于U,但是德沃夏克键盘把U放在了比I更顺手的位置上。
我觉得第一点就能把这个问题下的大多数人劝退了。
有人说什么WinRAR的流行靠的是盗版软件,装机的人都装WinRAR,用户沒有选择权。
问题来了:为什么装机的人都装WinRAR呢?还不是因为它好用!
这就好比说Windows为什么流行?因为国内电脑都预装盗版Windows,用户沒有选择权。
我才不会告诉你们当年我的笔记本电脑上预装的就是Linux,我回家第一件事就是把Linux格了,换个盗版Windows装上去。
如果装机的人选择7-Zip而不是WinRAR,最大的可能不是用户从WinRAR迁移到7-Zip,而是他这个电脑卖不出去了。
目前的现状是:Windows平台上最流行的压缩格式是zip,其次是rar(rar是第二流行的压缩格式这种观点是英文维基百科说的)。
Linux平台上最流行的压缩格式是tar.gz,其次是tar.bz2。
zip用的是deflate算法,tar.gz用的也是deflate算法,其实就相当于换了个後缀名。tar.bz2用的是bzip2算法,rar用的是私有压缩算法。
这三种压缩格式中,综合考虑压缩率、压缩时间、稳定性等等因素,rar是最好的,但是它收费,所以屈居老二,zip排第一,这很合理,很符合市场规律。
现在好多人吹捧7z的同时都要把zip踩一下,这真是令人无语的操作。很多人都不知道,其实zip也是开源格式。现在压缩界的龙头老大,是被一个开源格式牢牢掌控着的,这个格式就是zip。我平时压东西用的也是zip。
7z三大缺点,一丑二慢三不稳定。按理说第一个缺点是最不重要的,为什么人们常常提起的反而是第一个缺点呢?
这是因为「丑」这个缺点,是一眼就能够看见的,不容抵赖。後两个缺点不是长年累月地使用是不会發现的。
我以前也用7-Zip,7-Zip的zip格式默认不支持Unicode文件名这种坑点我是亲身实践發现的。像WinRAR这种商业软件,人人得而诛之,它一旦出现什么问题就会被人挑出来指着鼻子骂;而7-Zip这种免费软件,推销的人都会或多或少地美化它。WinRAR名面上有很多坑,但是我们知道它就只有这么多坑,而7-Zip看似完美的表象下你根本不知道它有多少坑。
10月9日更新:
自v7.0开始,Bandizip会发布3种版本。
标准版:为大众提供的免费的版本
专业版:为专业用户提供的付费版本
企业版:为企业用户提供的付费版本
自7.0开始,Bandizip将会在软件中加入广告,强制更新,並且不再提供离线安装包。希望广大Bandizip爱好者届时能继续支持这个软件,呵呵。
10月13日更新:
评论区有人问我:「你给WinRAR付过钱了吗?」我在这裡统一回复:「沒有。」
因为我从来不用WinRAR,本回答中的WinRAR是我为了测试装的,测完之後我马上就删了。我一般都用zip。zip相对于7z和rar的缺点主要有两条,一是压缩率不如後两者,二是不支持文件名加密。
压缩率的问题其实不大,因为电脑中的很多文件本就是压缩过的。打个比方,分別用zip、7z、rar去压jpg文件,压出来都是100%,但是zip耗时5秒,rar耗时10秒,7z耗时20秒,zip相对于rar和7z就有优势。
我感觉还是WinZip那种根据後缀名智能选择压缩算法的方式比较好。今天又试了一下WinZip的zipx格式,有如下發现:
zipx对txt文件、bmp文件、html文件采用PPMd压缩算法。
zipx对jpg、jpeg文件采用JPEG压缩算法。
zipx对doc、xls、gif文件采用LZMA压缩算法。
zipx对docx、xlsx、zip、png文件采用XZ压缩算法。
WinRAR、7-Zip不能识別zipx的JPEG压缩算法,好压不能识別zipx的XZ压缩算法。
也就是说,如果一个zipx压缩包中有docx,xlsx文件,用好压解压缩就会报错;如果一个zipx压缩包中有jpg文件,用WinRAR、7-Zip解压缩就会报错。目前除了WinZip他自己,沒有其他任何一个压缩软件完美支持zipx格式。
尤其令人吃惊的是zipx可以把一个80k的jpg文件压到60k,解压缩之後还是80k,也就是说zipx对jpg的压缩是无损的。估计是WinZip公司自己把JPEG压缩算法的实现重写了一遍,这是我见过的唯一可以压缩jpg文件的格式。
11月3日更新:
有人说字典大小不同不能比较,那我来一个字典大小相同的比较实验:zip用32K字典,rar和7z都用1M字典,使用的测试材料是中文小说,结论如下。
压缩耗时比:
zip标准:RAR标准:7z快速:7z标准=1:2.5:4.8:9
最终文件大小的比例是:
zip标准:RAR标准:7z快速:7z标准=120%:1:107%:93%
bandizip很鸡贼,他的「正常压缩」使用的是7-Zip「快速压缩」的参数,他的「最大压缩」使用的是7-Zip「标准压缩」的参数。所以使用bandizip压7z的时候,我们会發现他的压缩速度比较快,但是压缩比不高。
评论区有人说让我测试一下zstd算法,我找了一个网站(https://github.com/mcmilk/7-Zip-zstd)试了一下,感觉这个算法真不错。
zstd的特点是:他的压缩等级的设置非常合理,「快速压缩」「标准压缩」「最大压缩」分別对应了zip、rar、7z三种格式。我在网上下载了九千多万字的网文做实验,结果如下:
⒈好压+双线程标准压缩成zip格式,耗时6秒,最终文件大小74484KB。
Zstandard+快速压缩,耗时6s,最终文件大小63287KB。
⒉WinRAR标准压缩成rar格式,耗时28s,53557KB
Zstandard+标准压缩,耗时30s,57420KB
⒊7-Zip+LZMA2算法+标准压缩+16M字典+非固实,耗时1m30s,47599KB
Zstandard+最大压缩,耗时1m30s,49224KB
zstd在「快速压缩」这个档位可以达到zip的压缩速度,同时得到比zip更小的压缩文件。在「标准压缩」和「最大压缩」这两个档位可以达到rar和7z的压缩速度,同时得到的压缩文件只比rar和7z大一点。
由此看来zstd相对于rar和7z就沒有优势了?非也。我们知道zip的解压缩速度比rar和7z快,但是zstd的解压缩速度比zip更快。我实测zstd的解压缩速度比zip快一倍以上,比rar和7z快很多很多倍。
说说这个网址的其他算法。
lz4、lz5:速度非常快,比zip/deflate更快,但是压缩率惨不忍睹。
Brotli:跟zstd差不多,但是不支持自解压格式,所以不考虑使用。
Fast LZMA2:有人用zstd的代码把LZMA2算法重写了一遍,指导思想是以降低压缩比的代价提高压缩速度。我试用了一下感觉跟rar差不多,在达到跟rar相似压缩速度的参数配置下可以得到跟rar一般大小的压缩文件(原版LZMA2算法比rar慢得多),几乎就相当于一个免费版的rar。
编辑于 2019-11-03