圧縮されたファイル名が、そのファイルシステム上では長すぎる場合、 gzip はファイル名を切り詰める。 gzip はファイル名のうちの 4 文字以上のパートを切り詰めようとする。 (各パートはドットで区切られている。) 小さなパートだけからファイル名ができている場合、 もっとも長いパートが切り詰められる。 例えば、ファイル名が 14 文字までに制限されている場合、 gzip.msdos.exe は gzi.msd.exe.gz という名前で圧縮される。 ファイル名の長さに制限がないシステムでは、 ファイル名が切り詰められることはない。
デフォルトでは、 gzip は圧縮ファイルの中に元ファイルの名前とタイムスタンプを保存する。 これらの情報はファイルを -N オプションで伸長するときに使われる。 これは、圧縮されたファイルの名前が切り詰められた場合や、 ファイル転送の後でタイムスタンプが保存されなかった場合に役立つ。
圧縮されたファイルは gzip -d, gunzip, zcat を使うと元の形に復元することができる。 圧縮ファイルに保存された元ファイルの名前がファイルシステムに適合しない場合、 そのファイルシステムに適合するように元の名前から新しい名前が作られる。
gunzip は、ファイル名が .gz, -gz, .z, -z, _z (大文字小文字は区別しない) で終わっており、 正しいマジックナンバーで始まっているファイルのリストを コマンドラインから受け取り、 伸長したファイルに置き換える。このとき圧縮ファイルの拡張子は取り除かれる。 gunzip は .tgz と .taz という特別な拡張子も認識する。 これらはそれぞれ、 .tar.gz と .tar.Z の省略形である。 圧縮するときに .tar という拡張子をもつファイルの名前を切り詰める必要があるなら、 gzip はかわりに .tgz という拡張子を使う。
gunzip は gzip, zip, compress, compress -H, pack で作られたファイルを正しく伸長できる。 入力形式の検知は自動的に行われる。 はじめの 2 つの形式を使った場合、 gunzip は 32 ビットの CRC をチェックする。 pack に対して、gunzip は伸長した長さをチェックする。 標準的な compress 形式は、整合性チェックをするようには設計されていない。 しかし、 gunzip は壊れた .Z ファイルを検知することができる場合もある。.Z ファイルを 伸長しているときにエラーが出たときには、 単に標準の uncompress がエラーを出さないという理由で .Z ファイルが正しいと考えてはならない。 一般的にいうと、標準的な uncompress は入力をチェックせず、脳天気にゴミを出力してしまうことがある。 SCO の compress -H 形式 (lzh 圧縮法) は CRC を含んでいないが、いくつかの整合性チェックができる。
zip によって作られたファイルは、'deflation' 法で圧縮された元ファイルを 1 つしか 含まない場合にだけ、gzip で伸長することができる。この特徴は、tar.zip ファイルを tar.gz 形式へ変換する際の補助となることだけを意図している。 元ファイルが 1 つだけの zip ファイルを伸長するには、gunzip <foo.zip や gunzip -S .zip foo.zip といったコマンドを使用する。 複数の元ファイルを含んでいる zip ファイルを伸長するためには、 gunzip ではなく unzip を使うこと。
zcat は gunzip -c と同一である。 (compress へのオリジナルのリンクを保存するために、 zcat が gzcat としてインストールされているシステムがあるかもしれない。) zcat はコマンドラインで指示されるファイルのリストまたは標準入力を伸長し、 伸長したデータを標準出力に書き出す。 zcat はファイルが .gz という拡張子であるかどうかわらず、 正しいマジックナンバーを持っているファイルであれば伸長しようとする。
gzip は zip と PKZIP で使われている Lempel-Ziv アルゴリズムを使う。 得られる圧縮量は、入力のサイズと共通の部分データ列の分布に依存する。 一般に、ソースコードや英文といったテキストでは 60-70% 小さくなる。 (compress に使われている) LZW・ (pack に使われている) Huffman コーディング・ (compact に使われている) 適応 Huffman コーディング、 これらによる圧縮に比べて、この圧縮率は一般にかなり良い。
たとえ圧縮されたファイルが元ファイルより少し大きくなるとしても、 圧縮は常に行われる。 最悪の場合、gzip ファイルヘッダのための数バイトと 32K バイトブロック毎に 5 バイトの増加となり、 大きなファイルでは 0.015% の増加率となる。 ただし実際の使用ディスクブロック数は、 ほとんど絶対に増加しない。 gzip は圧縮・伸長時にファイルのアクセス権・所有者・タイムスタンプを保存する。
gzip ファイル形式は P. Deutsch, GZIP file format specification version 4.3, <ftp://ftp.isi.edu/in-notes/rfc1952.txt>, Internet RFC 1952 (May 1996)で規定されている。zip deflation 形式は P. Deutsch, DEFLATE Compressed Data Format Specification version 1.3, <ftp://ftp.isi.edu/in-notes/rfc1951.txt>, Internet RFC 1951 (May 1996) で規定されている。
compressed size: 圧縮されたファイルのサイズ
uncompressed size: 伸長されたファイルのサイズ
ratio: 圧縮率 (不明の場合は 0.0%)
uncompressed_name: 伸長されたファイルの名前
compress でつくられた .Z ファイルのように、 gzip 形式でないファイルの伸長時サイズは -1 にされる。 そのようなファイルについて伸長されたファイルのサイズを求める場合は、
zcat file.Z | wc -c
を使うこと。--verbose オプションと組み合わせると 以下のフィールドも表示される。
method: 圧縮法
crc: 伸長されたデータの 32 ビット CRC
date & time: 伸長されたファイルのタイムスタンプ
現在サポートされている圧縮法は、deflate, compress, lzh (SCO compress -H), pack である。 gzip 形式でないファイルについて、crc は ffffffff とされる。
--name が同時に指定されると、(もし記録されているなら) 伸長されたファイルの名前・日付・時刻は 圧縮ファイル内に記録されているものになる。
--verbose が同時に指定されると、どれかのファイルのサイズが不明でない限り、 サイズの合計とその圧縮率も表示される。 --quiet が同時に指定されると、タイトルと合計の行は表示されない。
gunzip -S "" * (MSDOS の場合は *.*)
前のバージョンの gzip は拡張子 .z を使った。 これは pack(1) との衝突を避けるために変更された。
gzip -c file1 > foo.gz
gzip -c file2 >> foo.gz
の後に
gunzip -c foo
とするのは、以下と同じである。
cat file1 file2
.gz ファイルのうち 1 つのファイルが壊れても、 (壊れたファイルを削除すれば) 他のファイルはまだ回復できる。 しかし、次のようにすべてのファイルを一度に圧縮すれば、より高い圧縮が得られる。
cat file1 file2 | gzip > foo.gz
これは下の例より高く圧縮できる。
gzip -c file1 file2 > foo.gz
より高い圧縮を得るために、結合されたファイルをもう一度圧縮するには、 次のようにすること。
gzip -cd old.gz | gzip > new.gz
圧縮ファイルが複数の元ファイルで構成されている場合、 --list オプションで表示される伸長時のサイズと CRC は、 最後の元ファイルについてのみ適用されたものである。 すべての元ファイルについて伸長時のサイズが必要な場合は、 次のコマンドを使うこと。
gzip -cd file.gz | wc -c
複数の元ファイルからなる 1 つの書庫ファイルを作って、 後から元ファイルを別々に伸長できるようにしたいなら、 tar や zip といったアーカイバーを使うこと。 GNU tar は gzip を透過的に起動するために -z オプションをサポートしている。 gzip は tar の代用としてではなく、補助として設計されている。
Vax/VMS では、環境変数の名前は GZIP_OPT である。 これは、プログラムを呼び出すためのシンボルセットとの衝突を避けるためである。
gzip ファイル形式は P. Deutsch, GZIP file format specification version 4.3, <ftp://ftp.isi.edu/in-notes/rfc1952.txt>, Internet RFC 1952 (May 1996) で規定されている。zip deflation 形式は P. Deutsch, DEFLATE Compressed Data Format Specification version 1.3, <ftp://ftp.isi.edu/in-notes/rfc1951.txt>, Internet RFC 1951 (May 1996) で規定されている。
zcat file > recover
上の例では、gzip は GNU tar の -z オプションによって暗に呼び出されている。 テープ上の圧縮されたデータの読み出しと書き込みに 同じブロックサイズ (tar の -b オプション) が使われていることに注意すること。 (この例は、GNU 版の tar を使うことを仮定している。)
zcat file.gz | wc -c
圧縮ファイルがシークをサポートしていないメディア上に存在する場合、 --list オプションによる表示は、 サイズが -1、crc が ffffffff となる。
稀に --best オプションによって、デフォルトの圧縮レベル (-6) より 圧縮が悪くなることがある。 非常に冗長なファイルでは、 compress による圧縮が gzip より良くなることがある。
Permission is granted to make and distribute verbatim copies of this manual provided the copyright notice and this permission notice are preserved on all copies.
Permission is granted to copy and distribute modified versions of this manual under the conditions for verbatim copying, provided that the entire resulting derived work is distributed under the terms of a permission notice identical to this one.
Permission is granted to copy and distribute translations of this manual into another language, under the above conditions for modified versions, except that this permission notice may be stated in a translation approved by the Foundation.
[man1]
[man2]
[man3]
[man4]
[man5]
[man6]
[man7]
[man8]
[a]
[b]
[c]
[d]
[e]
[f]
[g]
[h]
[i]
[j]
[k]
[l]
[m]
[n]
[o]
[p]
[q]
[r]
[s]
[t]
[u]
[v]
[w]
[x]
[y]
[z]