awkで重複行を排除してユニークな行をもとめる

release: 2016-06-05 update: 2020-09-21

awkだけで、「sort | uniq」をせずに重複した行をまとめることができるので、備忘として残しておく。
awkでは、以下のようにコマンドを実行することで、重複行を表示させないことが可能だ。

コマンド | awk '!a[$1]++'

[centos@test-centos7 ~]$ cat /tmp/test2.txt | sort | uniq
aaa
aab
aac
aba
abb
abc
aca
acb
acc
baa
bab
bac
bba
bbb
bbc
bca
bcb
bcc
caa
cab
cac
cba
cbb
cbc
cca
ccb
ccc
[centos@test-centos7 ~]$ cat /tmp/test2.txt | sort | uniq | wc -l
27
[centos@test-centos7 ~]$ cat /tmp/test2.txt | awk '!a[$1]++'
aba
abc
bbc
acc
aca
cbb
cbc
abb
ccb
bbb
cca
baa
aac
aaa
bca
aab
bcc
cba
acb
bba
cab
caa
bab
ccc
bcb
cac
bac
[centos@test-centos7 ~]$ cat /tmp/test2.txt | awk '!a[$1]++' | wc -l
27

普通に使うなら「sort | uniq」でやるだろうけど、まぁもしかしたら使うこともあるかも？

俺的備忘録〜なんかいろいろ〜

Blog

Documents

Tools

awkで重複行を排除してユニークな行をもとめる

俺的備忘録

〜なんかいろいろ〜

最近の投稿

gitで直近のmergeで発生した差分だけをgit diffで取得する

git diffの結果をフルパスで表示させる

Python 3.9でasync使用時に『can't register atexit after shutdown』というエラーが出るようになった

xargsで各引数ごとの出力の先頭を色分けして表示する

コンソール上でひらがな、カタカナの文字を一括指定して置換する

Twitter

Sponsored Link

Other Page

Sponsored Link

最近の投稿

Twitter

Sponsored Link