GNU/Linux >> Linux の 問題 >  >> Linux

Geditで無効な文字をスキャンする方法は?

javascriptファイルを編集するかどうかというジレンマがあります。 geditで開くと、次の警告が表示されます:

開いたファイルに無効な文字が含まれています。
このファイルの編集を続けると、このドキュメントが破損する可能性があります。
別の文字エンコードを選択して再試行することもできます。

現在のエンコーディングはUTF-8です。ファイルには100,000行を超えるコードが含まれているため、無効な文字をすばやくスキャンする方法はありますか?

承認された回答:

ファイルはUTF-8なので、isutf8を実行できます。追加のutilsパッケージ。
不良バイトのline、char、offsetの両方を提供します。

次に、xxd、hexdumpなどを使用して分析します。

残念ながら、最初のクラッシュで停止します。しかし、それはファイルによって異なります。
不良バイトが1つしかない可能性があります😉

同様の分析を行うがファイル全体を対象とするCコードをいくつか用意します。それは
どこか長い間忘れられていたディスクにあります。必要に応じてそれを見つけようとするかもしれません。

それ以外の場合は、迅速であり、 汚い方法は、
geditで保存されたコピーを比較することです–良い氏によって提案されたように。 @vonbrand。


Linux
  1. RkhunterでルートキットのDebianサーバーをスキャンする方法

  2. シンプルスキャンのデフォルトのファイルタイプPNGを設定するにはどうすればよいですか?

  3. sshfs の鍵ファイルを指定するにはどうすればよいですか?

  1. 印刷されない文字が含まれているファイル名のファイルを削除するにはどうすればよいですか?

  2. 文字を含むファイル名を変更するにはどうすればよいですか?

  3. 既存のSSL用のpemを作成する方法

  1. 特定のユーザーにパスワードなしのSudoを設定する方法

  2. ファイル内の複数行パターンを検索するにはどうすればよいですか?

  3. パターンの後にコンテンツをgrepする方法は?