curlでGoogleサジェストの候補一覧を取得する

ちょっと前のシェル芸勉強会の時にも触れたのだけど、Googleのサジェストをxml形式で出力してくれるページへcurlでアクセスすることで、サジェストの一覧を取得することができる。
以下、「AIUEO(あいうえお)」というキーワードでサジェストを取得している。なお、出力結果はSJISとなっているようなので、途中でnkfでUTF-8に変換している。

curl -s 'http://suggestqueries.google.com/complete/search?output=toolbar&hl=ja&q=AIUEO&gl=JP' | nkf -w | grep -Po '(?<=<suggestion data=")[^",]+(?=")'
Sponsored Links

[root@BS-PUB-CENT7-01 ~]# curl -s 'http://suggestqueries.google.com/complete/search?output=toolbar&hl=ja&q=AIUEO&gl=JP' | nkf -w
<?xml version="1.0"?><toplevel><CompleteSuggestion><suggestion data="あいうえお"/></CompleteSuggestion><CompleteSuggestion><suggestion data="あいうえお表"/></CompleteSuggestion><CompleteSuggestion><suggestion data="あいうえお作文"/></CompleteSuggestion><CompleteSuggestion><suggestion data="あいうえお順"/></CompleteSuggestion><CompleteSuggestion><suggestion data="あいうえおか"/></CompleteSuggestion><CompleteSuggestion><suggestion data="あいうえおにぎり"/></CompleteSuggestion><CompleteSuggestion><suggestion data="あいうえおかきくけこさしすせそ"/></CompleteSuggestion><CompleteSuggestion><suggestion data="あいうえおあお"/></CompleteSuggestion><CompleteSuggestion><suggestion data="aiueo700"/></CompleteSuggestion><CompleteSuggestion><suggestion data="aiueo"/></CompleteSuggestion></toplevel>
[root@BS-PUB-CENT7-01 ~]# curl -s 'http://suggestqueries.google.com/complete/search?output=toolbar&hl=ja&q=AIUEO&gl=JP' | nkf -w | grep -Po '(?<=<suggestion data=")[^",]+(?=")'
あいうえお
あいうえお表
あいうえお作文
あいうえお順
あいうえおか
あいうえおにぎり
あいうえおかきくけこさしすせそ
あいうえおあお
aiueo700
aiueo

 


Written by blacknon

インフラエンジニア(…のつもり)。 仕事で使うならクライアントはWindowsよりはUNIXの方が好き。 大体いつも眠い。

Leave a Comment

メールアドレスが公開されることはありません。

*