javascriptファイルを編集するかどうかというジレンマがあります。 geditで開くと、次の警告が表示されます:
開いたファイルに無効な文字が含まれています。
このファイルの編集を続けると、このドキュメントが破損する可能性があります。
別の文字エンコードを選択して再試行することもできます。
現在のエンコーディングはUTF-8です。ファイルには100,000行を超えるコードが含まれているため、無効な文字をすばやくスキャンする方法はありますか?
承認された回答:
ファイルはUTF-8なので、isutf8を実行できます。追加のutilsパッケージ。
不良バイトのline、char、offsetの両方を提供します。
次に、xxd、hexdumpなどを使用して分析します。
残念ながら、最初のクラッシュで停止します。しかし、それはファイルによって異なります。
不良バイトが1つしかない可能性があります😉
同様の分析を行うがファイル全体を対象とするCコードをいくつか用意します。それは
どこか長い間忘れられていたディスクにあります。必要に応じてそれを見つけようとするかもしれません。
それ以外の場合は、迅速であり、 汚い方法は、
geditで保存されたコピーを比較することです–良い氏によって提案されたように。 @vonbrand。