Googleから画像を一括でダウンロードするツール「google-images-download」



Googleから画像を一括でダウンロードできるコマンドラインツール「google-images-download」の紹介です。
 

google-images-download で出来ること 

- 種類、キーワード、サイズ、色 ... etc を指定してGoogleから一括で画像がダウンロードできます

google-images-download を使って ' ipad ' の画像を一括で入手してみました

一括ダウンロードした ' ipad ' の画像 

 

google-images-download のインストール

 google-images-download は Python で作られており、導入はコマンドライン上から ' pip ' コマンドを使ってインストールします。
( * お使いの環境によっては ' sudo ' が必要になるかもしれません )

# pipコマンドでインストール
pip install google_images_download

 
 パッケージ本体がダウンロードされると、コマンドライン上で ' google_images_download ' コマンドが使えるようになります。

google-images-download の使い方

 google-images-download はコマンドライン上から ' google-images-download --オプション名  ' という形で簡単に使用することができます。

 例えば、' リンゴ ' の画像を一括で入手したい場合は ' keywords ' オプションを使います。また、キーワード名がアルファベット以外の文字でも問題ありません。

# リンゴの画像を一括入手 * デフォルトではダウンロードされる画像数は100
googleimagesdownload --keywords "リンゴ"
# googleimagesdownload -k "リンゴ" *こちらでも可能

 
 コマンドを実行すると、実行したディレクトリ内に ' downloads/キーワード ' のフォルダが作成され、ダウンロードされた画像が展開されます。

上のコマンドで入手した " リンゴ " の画像

* よく使いそうなオプション

オプション ショートカット 説明
keywords k ターゲットとなる画像のキーワード
suffix_keywords sk キーワードを追加する為の接尾辞 (* 'りんご' '赤' など)
limit l 一度にダウンロードする画像数 ( * デフォルトでは100個 )
format f ダウンロードする画像の形式
( jpg, gif, png, bmp, svg, webp, ico )
color co ダウンロードする画像の色を指定
( red, orange, yellow, green, teal, blue, purple, pink, white, gray, black, brown )
color_type ct ダウンロードする画像色のタイプ
( full-color, black-and-white *白黒, transparent *透明 )
size s ダウンロードする画像のサイズ
( large, medium, icon, >400*300, >640*480, >800*600, >1024*768, >2MP, >4MP, >6MP, >8MP, >10MP )
aspect_ratio a ダウンロードする画像の形 [ *パノラマなど ]
( tall, square, wide, panoramic )
type t ダウンロードする画像のタイプ [ *パノラマなど ]
( face, photo, clip-art, line-drawing, animated )
time w インデックスされた画像の期間を指定 [ *1日以内, 一週間以内など ]
( past-24-hours, past-7-days )
similar_images si 指定した画像ファイルやURLから、似たイメージをダウンロードします
output_directory o 指定したディレクトリに画像を展開
[* デフォルトではコマンドを実行したディレクトリに画像がダウンロードされます ]
language la

画像を入手するGoogleサービスの言語を指定
( Arabic, Chinese (Simplified), Chinese (Traditional), Czech, Danish, Dutch,
 English, Estonian. Finnish, French, German, Greek, Hebrew, Hungarian,
  Icelandic, Italian, Japanese, Korean, Latvianm, Lithuanian, Norwegian,
  Portuguese, Polish, Romanian, Russian, Spanish, Swedish, Turkish )

chromedriver cd 画像を入手するドライバを chromedriverに変更できます [* デフォルトではselenium ]
(Win : path/to/chromedriver.exe Other : path/to/chromedriver)

上記の色々なオプションを指定して ' 葛飾北斎 ' の画像をダウンロードしてみました。

googleimagesdownload -k "葛飾北斎" -la Japanese -l 20 -f "jpg" -s medium -t clip-art -co orange

''' #上のコマンドで指定したオプション#
キーワードには ' 葛飾北斎 '。 言語は ' 日本語 '。
ダウンロードするファイルは ' 20 ' 。
ファイル形式は 'jpg'。 画像のサイズは ' ミディアム '。
画像のタイプは ' クリップアート '。カラーは ' オレンジ色 ' 
'''

上のコマンドで入手した ' 葛飾北斎 'の画像


Summary

 個人用途では活躍する機会が少なそうですが、tensorflow などの 機械学習用のフレームワークで 特定オブジェクトを学習させる目的で 大量に画像が必要な時に打ってつけのツールだと感じました。

 google-images-downloadは コマンドにパラメーターを渡すだけで使用できるので、画像を準備するバッチファイルを作成する事も比較的簡単に作れそうです。また、PythonからAPIとして直接呼び出す事も可能なので、既存のPythonシステムに組み込むことも難しくなさそうです。

GitHub : hardikvasa/google-images-download

 

この記事のカテゴリ
プログラミング

この記事に付けられているタグ