ベータ版だけど、Google DatasetSearchなるものがあるらしい.
Wikipediaによれば、研究者やデータジャーナリストのために、無料でオンラインで公開されているデータセットを探しやすくするために提供開始したもの.
https://toolbox.google.com/datasetsearch
ってことで、今回は「顔検出のデータセット」を探してみた.
今回はFace Detection IN Imagesで調べていますが、これはサジェスト補完によって出てきたものです.
顔検出のデータセット
ちゃんとCelebAとかもひっかかっていますね.
75件とかそこそこある気がします.
主にある項目は、ライセンスやダウンロード形式、データセットの作成元、更新日とかのようです.
以下、他の単語も試しましたが、kaggleがめっちゃひっかかります.
MNISTのデータセット
https://toolbox.google.com/datasetsearch/search?query=mnist
Extendedバージョンが一番上にきている.正規のデータセットがどれだけ分からないですね…
Semantic Segmentationのデータセット
https://toolbox.google.com/datasetsearch/search?query=semantic%20segmentation
これはほしいものが得られているのか良く分かりませんね…
恐らく手に入ってそうですが.
これいいの?って思ったのですが、ポケモンの画像データセットを提供している人がいるみたいです.しかも学術記事で使用されているみたいですね.
ライセンスはPublic Domainだし…研究用途なら許されるのでしょうか?
全体として便利そうな気はしています.
不満点としては、どんなデータが入っているのか分からないので、
ほしいものかどうかぱっとみで判断がつかない点ですかね…
テキストの説明だけじゃほしいものかどうかがぱっと分かりませんね…