curlでGoogleサジェストの候補一覧を取得する

ちょっと前のシェル芸勉強会の時にも触れたのだけど、Googleのサジェストをxml形式で出力してくれるページへcurlでアクセスすることで、サジェストの一覧を取得することができる。
以下、「AIUEO(あいうえお)」というキーワードでサジェストを取得している。なお、出力結果はSJISとなっているようなので、途中でnkfでUTF-8に変換している。

curl -s 'http://suggestqueries.google.com/complete/search?output=toolbar&hl=ja&q=AIUEO&gl=JP' | nkf -w | grep -Po '(?<=<suggestion data=")[^",]+(?=")'
Sponsored Links

[root@BS-PUB-CENT7-01 ~]# curl -s 'http://suggestqueries.google.com/complete/search?output=toolbar&hl=ja&q=AIUEO&gl=JP' | nkf -w
<?xml version="1.0"?><toplevel><CompleteSuggestion><suggestion data="あいうえお"/></CompleteSuggestion><CompleteSuggestion><suggestion data="あいうえお表"/></CompleteSuggestion><CompleteSuggestion><suggestion data="あいうえお作文"/></CompleteSuggestion><CompleteSuggestion><suggestion data="あいうえお順"/></CompleteSuggestion><CompleteSuggestion><suggestion data="あいうえおか"/></CompleteSuggestion><CompleteSuggestion><suggestion data="あいうえおにぎり"/></CompleteSuggestion><CompleteSuggestion><suggestion data="あいうえおかきくけこさしすせそ"/></CompleteSuggestion><CompleteSuggestion><suggestion data="あいうえおあお"/></CompleteSuggestion><CompleteSuggestion><suggestion data="aiueo700"/></CompleteSuggestion><CompleteSuggestion><suggestion data="aiueo"/></CompleteSuggestion></toplevel>
[root@BS-PUB-CENT7-01 ~]# curl -s 'http://suggestqueries.google.com/complete/search?output=toolbar&hl=ja&q=AIUEO&gl=JP' | nkf -w | grep -Po '(?<=<suggestion data=")[^",]+(?=")'
あいうえお
あいうえお表
あいうえお作文
あいうえお順
あいうえおか
あいうえおにぎり
あいうえおかきくけこさしすせそ
あいうえおあお
aiueo700
aiueo

 


Written by blacknon

インフラ系のSE。一時期はプログラマ。 仮想化とオープンソースに興味あり。一日中寝てたい今日このごろ。 スペインとかで働きたいなぁ…(シエスタがあるので)

Leave a Comment

メールアドレスが公開されることはありません。

*