まず第一に、エディターでファイルを開きたくないことは間違いありません (エディターで編集するには大きすぎるためです)。
代わりに、識別したいだけなら ファイルに A 以外のものが含まれているかどうか 、 T 、 C そして G 、あなたはそれを行うことができます
grep '[^ATCG]' filename
これにより、これらの 4 文字以外を含むすべての行が返されます。
削除したい場合 ファイルからのこれらの文字、あなたはそうすることができます
tr -c -d 'ATCG\n' <filename >newfilename
(これがファイルを「修正」する正しい方法であるかどうかはわかりません)
これにより、ファイル内の 4 つの文字以外のすべての文字が削除され、改行も保持されます (\n )。編集されたファイルは newfilename に書き込まれます .
ファイルに何かを追加したシステム エラーである場合、これは sed によって修正される可能性があります。 または awk 、しかし、あなたのデータがどのように見えるかはまだわかりません.
vi でファイルを開いている場合 または vim 、次にコマンド
/[^ATCG]
A ではない編集バッファ内の次の文字を検索します 、 T 、 C または G .
そして :%s/[^ATCG]//g それらをすべて削除します。