Hexdumpは、バイナリファイルの内容を16進数、10進数、8進数、またはASCIIで表示するユーティリティです。これは検査用のユーティリティであり、データリカバリ、リバースエンジニアリング、プログラミングに使用できます。
Hexdumpは、ごくわずかな労力で出力を提供します。表示しているファイルのサイズによっては、大量の出力が発生する可能性があります。この記事の目的のために、1x1のPNGファイルを作成します。これは、GIMPやMtpaintなどのグラフィックアプリケーションを使用して行うことも、ImageMagickを使用してターミナルで作成することもできます。
ImageMagickを使用して1x1ピクセルのPNGを生成するコマンドは次のとおりです。
$ convert -size 1x1 canvas:black pixel.png
このファイルがファイルでPNGであることを確認できます コマンド:
$ file pixel.png
pixel.png: PNG image data, 1 x 1, 1-bit grayscale, non-interlaced
ファイルがどのようになっているのか不思議に思うかもしれません コマンドはそれがどんな種類のファイルであるかを決定することができます。偶然にも、それが hexdump 明らかになります。今のところ、選択した画像ビューアで1ピクセルのグラフィックを表示できます(次のようになります:。 )、または hexdumpを使用してファイルの内容を表示できます :
$ hexdump pixel.png
0000000 5089 474e 0a0d 0a1a 0000 0d00 4849 5244
0000010 0000 0100 0000 0100 0001 0000 3700 f96e
0000020 0024 0000 6704 4d41 0041 b100 0b8f 61fc
0000030 0005 0000 6320 5248 004d 7a00 0026 8000
0000040 0084 fa00 0000 8000 00e8 7500 0030 ea00
0000050 0060 3a00 0098 1700 9c70 51ba 003c 0000
0000060 6202 474b 0044 dd01 138a 00a4 0000 7407
0000070 4d49 0745 07e3 081a 3539 a487 46b0 0000
0000080 0a00 4449 5441 d708 6063 0000 0200 0100
0000090 21e2 33bc 0000 2500 4574 7458 6164 6574
00000a0 633a 6572 7461 0065 3032 3931 302d 2d37
00000b0 3532 3254 3a30 3735 353a 2b33 3231 303a
00000c0 ac30 5dcd 00c1 0000 7425 5845 6474 7461
00000d0 3a65 6f6d 6964 7966 3200 3130 2d39 3730
00000e0 322d 5435 3032 353a 3a37 3335 312b 3a32
00000f0 3030 90dd 7de5 0000 0000 4549 444e 42ae
0000100 8260
0000102
表示されているのは、これまで使用したことがない可能性のあるレンズを介したサンプルPNGファイルの内容です。これは、画像ビューアに表示されるデータとまったく同じであり、おそらく見慣れない方法でエンコードされています。
デフォルトのデータダンプが無意味に見えるからといって、それが貴重な情報を欠いていることを意味するわけではありません。この出力または少なくとも実際に翻訳される部分を、-canonicalを使用してより使い慣れた文字セットに翻訳できます。 オプション:
$ hexdump --canonical foo.png
00000000 89 50 4e 47 0d 0a 1a 0a 00 00 00 0d 49 48 44 52 |.PNG........IHDR|
00000010 00 00 00 01 00 00 00 01 01 00 00 00 00 37 6e f9 |.............7n.|
00000020 24 00 00 00 04 67 41 4d 41 00 00 b1 8f 0b fc 61 |$....gAMA......a|
00000030 05 00 00 00 20 63 48 52 4d 00 00 7a 26 00 00 80 |.... cHRM..z&...|
00000040 84 00 00 fa 00 00 00 80 e8 00 00 75 30 00 00 ea |...........u0...|
00000050 60 00 00 3a 98 00 00 17 70 9c ba 51 3c 00 00 00 |`..:....p..Q<...|
00000060 02 62 4b 47 44 00 01 dd 8a 13 a4 00 00 00 07 74 |.bKGD..........t|
00000070 49 4d 45 07 e3 07 1a 08 39 35 87 a4 b0 46 00 00 |IME.....95...F..|
00000080 00 0a 49 44 41 54 08 d7 63 60 00 00 00 02 00 01 |..IDAT..c`......|
00000090 e2 21 bc 33 00 00 00 25 74 45 58 74 64 61 74 65 |.!.3...%tEXtdate|
000000a0 3a 63 72 65 61 74 65 00 32 30 31 39 2d 30 37 2d |:create.2019-07-|
000000b0 32 35 54 32 30 3a 35 37 3a 35 33 2b 31 32 3a 30 |25T20:57:53+12:0|
000000c0 30 ac cd 5d c1 00 00 00 25 74 45 58 74 64 61 74 |0..]....%tEXtdat|
000000d0 65 3a 6d 6f 64 69 66 79 00 32 30 31 39 2d 30 37 |e:modify.2019-07|
000000e0 2d 32 35 54 32 30 3a 35 37 3a 35 33 2b 31 32 3a |-25T20:57:53+12:|
000000f0 30 30 dd 90 e5 7d 00 00 00 00 49 45 4e 44 ae 42 |00...}....IEND.B|
00000100 60 82 |`.|
00000102
右側の列には、左側にあるのと同じデータがASCIIとして表示されています。注意深く見ると、ファイルの形式(PNG)や、ファイルが作成されて最後に変更された日時など、いくつかの有用な情報を見つけることができます。ドットは、ASCII文字セットに存在しない記号を表します。これは、バイナリ形式がありふれた文字や数字に制限されていないために予想されることです。
ファイル コマンドは最初の8バイトからこのファイルが何であるかを知っています。 libpng仕様は、プログラマーに何を探すべきかを警告します。この画像ファイルの最初の8バイト内に、具体的には文字列 PNGがあることがわかります。 。この事実は、ファイルがどのようになっているのかを明らかにするため、重要です。 コマンドは、報告するファイルの種類を認識しています。
16進ダンプのバイト数を制御することもできます ディスプレイ。1ピクセルを超えるファイルで役立ちます:
$ hexdump --length 8 pixel.png
0000000 5089 474e 0a0d 0a1a
0000008
16進ダンプを制限する必要はありません PNGまたはグラフィックファイルに。 hexdumpを実行できます ls、rsync、または検査したい任意のバイナリ形式など、日常的に実行するバイナリに対しても同様です。
hexdumpを使用した猫の実装
Linuxターミナル
- Linux用の上位7つのターミナルエミュレータ
- Linuxでのデータ分析のための10個のコマンドラインツール
- 今すぐダウンロード:SSHチートシート
- 高度なLinuxコマンドのチートシート
- Linuxコマンドラインチュートリアル
PNG仕様を読むと、最初の8バイトのデータが hexdumpのものとは異なって見えることに気付くかもしれません。 提供します。実際には同じデータですが、異なる変換を使用して表示されています。したがって、 hexdumpの出力 本当ですが、探しているものによっては、必ずしも直接役立つとは限りません。そのため、 hexdump ダンプする生データをフォーマットおよび変換するオプションがあります。
変換オプションは複雑になる可能性があるため、最初に些細なことで練習すると便利です。 hexdumpのフォーマットの簡単な紹介です 猫を再実装して出力 指図。まず、 hexdumpを実行します テキストファイルで生データを確認します。通常、GNU General Public License(GPL)ライセンスのコピーは、ハードドライブのどこかにあります。または、手元にある任意のテキストファイルを使用することもできます。出力は異なる場合がありますが、システム(または少なくともその一部)でGPLのコピーを見つける方法は次のとおりです。
$ find /usr/share/doc/ -type f -name "COPYING" | tail -1
/usr/share/doc/libblkid-devel/COPYING
hexdumpを実行します それに対して:
$ hexdump /usr/share/doc/libblkid-devel/COPYING
0000000 6854 7369 6c20 6269 6172 7972 6920 2073
0000010 7266 6565 7320 666f 7774 7261 3b65 7920
0000020 756f 6320 6e61 7220 6465 7369 7274 6269
0000030 7475 2065 7469 6120 646e 6f2f 0a72 6f6d
0000040 6964 7966 6920 2074 6e75 6564 2072 6874
0000050 2065 6574 6d72 2073 666f 7420 6568 4720
0000060 554e 4c20 7365 6573 2072 6547 656e 6172
0000070 206c 7550 6c62 6369 4c0a 6369 6e65 6573
0000080 6120 2073 7570 6c62 7369 6568 2064 7962
[...]
ファイルの出力が非常に長い場合は、-lengthを使用してください (または -n 略して)自分で管理できるようにするため。
生データはおそらくあなたにとって何の意味もありませんが、ASCIIに変換する方法はすでに知っています:
hexdump --canonical /usr/share/doc/libblkid-devel/COPYING
00000000 54 68 69 73 20 6c 69 62 72 61 72 79 20 69 73 20 |This library is |
00000010 66 72 65 65 20 73 6f 66 74 77 61 72 65 3b 20 79 |free software; y|
00000020 6f 75 20 63 61 6e 20 72 65 64 69 73 74 72 69 62 |ou can redistrib|
00000030 75 74 65 20 69 74 20 61 6e 64 2f 6f 72 0a 6d 6f |ute it and/or.mo|
00000040 64 69 66 79 20 69 74 20 75 6e 64 65 72 20 74 68 |dify it under th|
00000050 65 20 74 65 72 6d 73 20 6f 66 20 74 68 65 20 47 |e terms of the G|
00000060 4e 55 20 4c 65 73 73 65 72 20 47 65 6e 65 72 61 |NU Lesser Genera|
00000070 6c 20 50 75 62 6c 69 63 0a 4c 69 63 65 6e 73 65 |l Public.License|
[...]
その出力は役に立ちますが、扱いにくく、読みにくいです。 16進ダンプをフォーマットするには 独自のオプションで提供されるものを超えるの出力には、-formatを使用します (または -e )特殊なフォーマットコードとともに。フォーマットに使用される省略形は、 printfと似ています。 コマンドはを使用するため、 printfに精通している場合 ステートメント、 hexdumpが見つかる場合があります 習得しやすいフォーマット。
16進ダンプ 、文字シーケンス%_ p hexdumpに通知します システムのデフォルトの文字セットで文字を印刷します。 -formatのすべてのフォーマット表記 オプションは一重引用符で囲む必要があります :
$ hexdump -e'"%_p"' /usr/share/doc/libblkid-devel/COPYING
This library is fre*
software; you can redistribute it and/or.modify it under the terms of the GNU Les*
er General Public.License as published by the Fre*
Software Foundation; either.version 2.1 of the License, or (at your option) any later.version..*
The complete text of the license is available in the..*
/Documentation/licenses/COPYING.LGPL-2.1-or-later file..
この出力の方が優れていますが、それでも読むのは不便です。従来、UNIXテキストファイルは80文字の出力幅を想定しています(昔は、モニターは80文字しか収まらない傾向があったため)。
この出力はフォーマットに拘束されませんが、16進ダンプを強制することができます 追加のオプションを使用して一度に80バイトを処理します。具体的には、80を1で割ると、 hexdumpがわかります。 80バイトを1つの単位として扱うには:
$ hexdump -e'80/1 "%_p"' /usr/share/doc/libblkid-devel/COPYING
This library is free software; you can redistribute it and/or.modify it under the terms of the GNU Lesser General Public.License as published by the Free Software Foundation; either.version 2.1 of the License, or (at your option) any later.version...The complete text of the license is available in the.../Documentation/licenses/COPYING.LGPL-2.1-or-later file..
現在、ファイルは80バイトのチャンクで処理されていますが、新しい行の意味が失われています。 \ nで独自に追加できます 文字。UNIXでは新しい行を表します:
$ hexdump -e'80/1 "%_p""\n"'
This library is free software; you can redistribute it and/or.modify it under th
e terms of the GNU Lesser General Public.License as published by the Free Softwa
re Foundation; either.version 2.1 of the License, or (at your option) any later.
version...The complete text of the license is available in the.../Documentation/
licenses/COPYING.LGPL-2.1-or-later file..
これで(おおよそ)猫が実装されました hexdumpを使用したコマンド フォーマット。
フォーマットは、現実的には、 hexdumpを作成する方法です。 使える。これで、少なくとも原則として、 hexdumpに精通しました。 フォーマットすると、 hexdump -n 8の出力を作成できます 公式のlibpngで説明されているように、PNGヘッダーの出力と一致します 仕様。
まず、 hexdumpが必要であることがわかります。 PNGファイルを8バイトのチャンクで処理します。さらに、整数認識によって、PNG仕様が10進数で文書化されていることがわかります。これは、%dで表されます。 hexdumpによると ドキュメント:
$ hexdump -n8 -e'8/1 "%d""\n"' pixel.png
13780787113102610
各整数の後に空白スペースを追加することで、出力を完全にすることができます:
$ hexdump -n8 -e'8/1 "%d ""\n"' pixel.png
137 80 78 71 13 10 26 10
これで、出力はPNG仕様と完全に一致します。
Hexdumpは、コンピューターが情報を処理および変換する方法だけでなく、ファイル形式とコンパイルされたバイナリーがどのように機能するかについても教える魅力的なツールです。 hexdumpを実行してみてください あなたが仕事をしている間、一日中ランダムにファイルに。どんな種類の情報を見つけることができるか、またその洞察をいつ持つことが役立つかはわかりません。