Coding 敏捷研发

David Fifield推出新款“解压炸弹包”:46MB文件可膨胀到4.5PB

2019年07月12日 11:55 次阅读 稿源:cnBeta.COM 条评论

ZIP 一直是主流的压缩文件格式,并且可追溯到几十年前的 5.25 和 3.5 英寸软盘时代。然而该技术作为一把双刃剑,也难免被别有用心的人所利用。比如通过一个看似超小型的压缩包,制作一个内含巨量垃圾数据的“解压炸弹包”(zip bomb)。其实早在去年,研究员 David Fifield 就曾展示过早期的解压炸弹包,能够将一个 42kB 的 zbsm.zip 文件迅速膨胀到 5.5GB 。

Deflate-Comparison-640x639.png

(图自:David Fifield,via ExtremeTech

之后,他又继续努力,推出了一个表面上只有 10MB,但其实能够膨胀到 281TB 的 zbLG.zip 炸弹压缩包。

时间转眼到了 2019 年 7 月,David Fifield 又发表了他的最新研究成果 —— 一个表面上只有 46MB,但其实可以膨胀到 4.5PB 的 zbxl.zip 炸弹压缩包。

不过需要指出的是,由于其采用了 Zip64,所以兼容性较差。

image.png

(7 月 2 日,David Fifield 详细介绍了自己的最新研究成果

zip 解压炸弹包使用递归算法的原因,归结于 ZIP 解析器中使用的 DEFLATE 算法无法实现高于 1032:1 的压缩率。有趣的是,David Fifield 找到了一种绕过该限制的方法。

其写到:本文介绍了如何构造一款压缩比超过 DEFAATE 1032 的非递归解压炸弹包。其通过重置 zip 容器内的文件来实现,以便在多个文件中引用高度压缩数据的‘内核’,而不是制作它的多个副本。

normal[1].jpg

解压炸弹的输入与输出大小,呈现的是二次方增长。即随着炸弹变大,压缩比也就更强。构造取决于 zip 和 DEFLATE 的特征,它不能直接移植到其它文件格式或压缩算法。

此外,该方案与大多数 zip 解析器兼容,不过‘流’解析器是个例外。后者在一次传递中解析,而无需事先查询 zip 文件的中心目录。

overlap[1].jpg

为使该方法见效,Fifield 必须重新审视数据是如何存储在 zip 文件中的,并且选择了适当的 Deflate 实现。

其选择了 bulk_deflate,一个专门用于压缩一串重复字节的自定义压缩器,能够比 zlib、info_ZIP 或 Zopfli 更密集地打包数据的工具。

quote[1].jpg

尽管 bulk_deflate 优于这些解决方案,但 Fifield 指出,其在一般用例中的效率并不高,还必须借助被称作 ZIP64 的 zip 标准扩展,来创建一个内含超过 281TB 数据输出的文件。

但若使用 ZIP64,便可创建出一个内含有效无限长度的解压炸弹包。至于更多细节,还请移步至官网查看。

Coding

活动入口:

Coding敏捷研发 - 研发产出提升20% 5人以下小团队免费

走进Verisign - 互联网根服务器的管理者/.com的守护者

对文章打分

David Fifield推出新款“解压炸弹包”:46MB文件可膨胀到4.5PB

1 (50%)
已有 条意见

    最新资讯

    加载中...

    今日最热

    加载中...

    热门评论

      Top 10

      招聘


      Advertisment ad adsense googles cpro.baidu.com
      created by ceallan