GNU/Linux >> Linux の 問題 >  >> Linux

Linuxコマンドを使用してプレーンテキストファイルから重複した単語を削除する方法

単語が 1 行に 1 つずつあり、ファイルが既に並べ替えられていると仮定すると、

uniq filename

ファイルがソートされていない場合:

sort filename | uniq

それらが 1 行に 1 つではなく、1 行に 1 つであってもかまわない場合:

tr -s [:space:] \\n < filename | sort | uniq

ただし、句読点は削除されないため、必要になる場合があります:

tr -s [:space:][:punct:] \\n < filename | sort | uniq

ただし、これにより、ハイフンでつながれた単語からハイフンが削除されます。その他のオプションについては、「man tr」を参照してください。


ruby -pi.bak -e '$_.split(",").uniq.join(",")' filename ?

2 種類の引用が見苦しいことは認めます。


Linux
  1. Linuxコマンドを使用して画像にテキストを書き込む方法

  2. テキストファイル内の重複行を削除するにはどうすればよいですか?

  3. 7 ファイルから重複行を削除する Linux Uniq コマンドの例

  1. Linux で「split」コマンドを使用して iso またはファイルを分割する方法

  2. 「dd」コマンドを使用して Linux でスパース ファイルを作成する方法

  3. Linux で mail コマンドを使用してファイルを添付するには?

  1. Linuxでファイルまたはディレクトリを削除(削除)する方法

  2. ターミナル/コマンドラインを使用してLinuxでファイルを作成する方法

  3. テキスト ファイルから改行を削除するにはどうすればよいですか?