Linux(具体的にはFedora)をプライマリワークステーションとして使用していると、次のスクリーンショット(最初の画像の左下と2番目の画像の左上)のような奇妙な印刷できない文字に気付くことがありました。
上の画像では、印刷できない文字がgnome-terminalにbashシェルで表示されています。 sys.stdin.close()
によってipythonインタラクティブシェルを終了しました ハッキング。
上の画像では、Firefoxで開かれたWebページ、具体的にはRFC 822テキストファイルの、このRFCの目次の直前に文字が表示されています。
私は興味があり、彼らが何であるか知りたいです。これらはUnicodeのある種の表現であると私は推測します。私は正しいですか?もしそうなら、この種の表記法はどこで定義されていますか?それは何と呼ばれていますか?
承認された回答:
四角いボックスは通常、現在のフォントにない文字用です。内部のコードは2バイトのUTF-8文字コードです。最近の端末はUTF8であるため、端末にバイナリデータを出力しようとするとこれが発生する可能性があります。 Pythonで本当に奇妙なことをしたようですが、Pythonが画面にゴミを出力しましたが、これは不明な文字として解釈され、utf-8のゴミが表示されました。 「cat/dev / urandom」を使用すると、いつでも同様のランダムなゴミを取得できます。