Googleから画像を一括でダウンロードできるコマンドラインツール「google-images-download」の紹介です。
- 種類、キーワード、サイズ、色 ... etc を指定してGoogleから一括で画像がダウンロードできます
ipad
' の画像を一括で入手してみました 
ipad
' の画像 
google-images-download は Python で作られており、導入はコマンドライン上から ' pip
' コマンドを使ってインストールします。
( * お使いの環境によっては ' sudo
' が必要になるかもしれません )
# pipコマンドでインストール
pip install google_images_download
パッケージ本体がダウンロードされると、コマンドライン上で ' google_images_download
' コマンドが使えるようになります。
google-images-download はコマンドライン上から ' google-images-download --オプション名
' という形で簡単に使用することができます。
例えば、' リンゴ
' の画像を一括で入手したい場合は ' keywords
' オプションを使います。また、キーワード名がアルファベット以外の文字でも問題ありません。
# リンゴの画像を一括入手 * デフォルトではダウンロードされる画像数は100
googleimagesdownload --keywords "リンゴ"
# googleimagesdownload -k "リンゴ" *こちらでも可能
コマンドを実行すると、実行したディレクトリ内に ' downloads/キーワード名
' のフォルダが作成され、ダウンロードされた画像が展開されます。
リンゴ
" の画像 
* よく使いそうなオプション
オプション | ショートカット | 説明 |
---|---|---|
keywords | k | ターゲットとなる画像のキーワード |
suffix_keywords | sk | キーワードを追加する為の接尾辞 (* 'りんご' '赤' など) |
limit | l | 一度にダウンロードする画像数 ( * デフォルトでは100個 ) |
format | f | ダウンロードする画像の形式 ( jpg, gif, png, bmp, svg, webp, ico ) |
color | co | ダウンロードする画像の色を指定 ( red, orange, yellow, green, teal, blue, purple, pink, white, gray, black, brown ) |
color_type | ct | ダウンロードする画像色のタイプ ( full-color, black-and-white *白黒, transparent *透明 ) |
size | s | ダウンロードする画像のサイズ ( large, medium, icon, >400*300, >640*480, >800*600, >1024*768, >2MP, >4MP, >6MP, >8MP, >10MP ) |
aspect_ratio | a | ダウンロードする画像の形 [ *パノラマなど ] ( tall, square, wide, panoramic ) |
type | t | ダウンロードする画像のタイプ [ *パノラマなど ] ( face, photo, clip-art, line-drawing, animated ) |
time | w | インデックスされた画像の期間を指定 [ *1日以内, 一週間以内など ] ( past-24-hours, past-7-days ) |
similar_images | si | 指定した画像ファイルやURLから、似たイメージをダウンロードします |
output_directory | o | 指定したディレクトリに画像を展開 [* デフォルトではコマンドを実行したディレクトリに画像がダウンロードされます ] |
language | la |
画像を入手するGoogleサービスの言語を指定 |
chromedriver | cd | 画像を入手するドライバを chromedriverに変更できます [* デフォルトではselenium ] (Win : path/to/chromedriver.exe Other : path/to/chromedriver) |
上記の色々なオプションを指定して ' 葛飾北斎
' の画像をダウンロードしてみました。
googleimagesdownload -k "葛飾北斎" -la Japanese -l 20 -f "jpg" -s medium -t clip-art -co orange
''' #上のコマンドで指定したオプション#
キーワードには ' 葛飾北斎 '。 言語は ' 日本語 '。
ダウンロードするファイルは ' 20 ' 。
ファイル形式は 'jpg'。 画像のサイズは ' ミディアム '。
画像のタイプは ' クリップアート '。カラーは ' オレンジ色 '
'''
葛飾北斎
'の画像 
個人用途では活躍する機会が少なそうですが、tensorflow などの 機械学習用のフレームワークで 特定オブジェクトを学習させる目的で 大量に画像が必要な時に打ってつけのツールだと感じました。
google-images-downloadは コマンドにパラメーターを渡すだけで使用できるので、画像を準備するバッチファイルを作成する事も比較的簡単に作れそうです。また、PythonからAPIとして直接呼び出す事も可能なので、既存のPythonシステムに組み込むことも難しくなさそうです。
GitHub : hardikvasa/google-images-download