まず第一に、エディターでファイルを開きたくないことは間違いありません (エディターで編集するには大きすぎるためです)。
代わりに、識別したいだけなら ファイルに A
以外のものが含まれているかどうか 、 T
、 C
そして G
、あなたはそれを行うことができます
grep '[^ATCG]' filename
これにより、これらの 4 文字以外を含むすべての行が返されます。
削除したい場合 ファイルからのこれらの文字、あなたはそうすることができます
tr -c -d 'ATCG\n' <filename >newfilename
(これがファイルを「修正」する正しい方法であるかどうかはわかりません)
これにより、ファイル内の 4 つの文字以外のすべての文字が削除され、改行も保持されます (\n
)。編集されたファイルは newfilename
に書き込まれます .
ファイルに何かを追加したシステム エラーである場合、これは sed
によって修正される可能性があります。 または awk
、しかし、あなたのデータがどのように見えるかはまだわかりません.
vi
でファイルを開いている場合 または vim
、次にコマンド
/[^ATCG]
A
ではない編集バッファ内の次の文字を検索します 、 T
、 C
または G
.
そして :%s/[^ATCG]//g
それらをすべて削除します。