タブ区切りのテキストファイル内のフィールドの一意の値の数をカウントする方法は?

cut を利用できます、 sort そして uniq コマンドは次のとおりです:

cat input_file | cut -f 1 | sort | uniq

はフィールド 1 で一意の値を取得します。1 を 2 で置き換えると、フィールド 2 で一意の値が得られます。

UUOC の回避 :)

cut -f 1 input_file | sort | uniq

編集:

一意の出現回数をカウントするには、wc を使用できますチェーン内のコマンド:

cut -f 1 input_file | sort | uniq | wc -l

awk -F '\t' '{ a[$1]++ } END { for (n in a) print n, a[n] } ' test.csv

awk、sort、uniq を使用してこれを行うことができます。たとえば、最初の列にすべての一意の値を一覧表示します

awk < test.txt '{print $1}' | sort | uniq

他の場所に投稿されているように、何かのインスタンスの数を数えたい場合は、一意のリストを wc -l にパイプできます

タブ区切りのテキスト ファイル内のフィールドの一意の値の数をカウントする方法は?