GNU/Linux >> Linux の 問題 >  >> Linux

タブ区切りのテキスト ファイル内のフィールドの一意の値の数をカウントする方法は?

cut を利用できます 、 sort そして uniq コマンドは次のとおりです:

cat input_file | cut -f 1 | sort | uniq

はフィールド 1 で一意の値を取得します。1 を 2 で置き換えると、フィールド 2 で一意の値が得られます。

UUOC の回避 :)

cut -f 1 input_file | sort | uniq

編集:

一意の出現回数をカウントするには、wc を使用できます チェーン内のコマンド:

cut -f 1 input_file | sort | uniq | wc -l

awk -F '\t' '{ a[$1]++ } END { for (n in a) print n, a[n] } ' test.csv

awk、sort、uniq を使用してこれを行うことができます。たとえば、最初の列にすべての一意の値を一覧表示します

awk < test.txt '{print $1}' | sort | uniq

他の場所に投稿されているように、何かのインスタンスの数を数えたい場合は、一意のリストを wc -l にパイプできます


Linux
  1. UnicodeテキストでUniqを使用していますか?

  2. Grep一致後のファイルの行数をカウントする方法は?

  3. Linux でファイルの行数を数える方法 (wc および nl コマンドの例)

  1. データファイルで一意の値を見つける

  2. ファイルにテキストを追加するにはどうすればよいですか?

  3. ファイルをその場でソートする方法

  1. Linuxでファイルの終わりにテキストを追加する方法

  2. Linuxでファイルの終わりにテキストを簡単に追加する方法

  3. テキストファイルで一致しない角かっこを見つける方法は?