ニューラルネットで二つの画像を入力にすることや途中でニューラルネットを混ぜることはできますか?

Facebookシェア Twitterツイート LINEで送る Googleシェア このエントリーをはてなブックマークに追加
質問の分野
ニューラルネットワーク
Up
0
Down

質問内容

  • 匿名質問
  • 2017.9.23
  • PV 7
今、二つの画像を入力にしようとしていて最後に単語を出したいと思います。 ざっと調べたところでは、あまりそういうことはしないように思われます。 ニューラルネットの仕組み的にそのようなことはできないのでしょうか? それともあまりやるメリットが存在しないのでしょうか? 抽象的な質問で恐縮です。 ご回答お願いします。
質問

Thoth

Up
0
Down
はい。結論から言えば可能です。
結論
正におっしゃってるような使い方でに入力にしています。 目的は様々ですが、近年は一度分離してから再度統合する形や ランダムに一部層をスキップすることもあります。 学習精度を向上させることや入力に近い情報を保つためなど様々です。 以下に幾らかの例を置いておきます
説明
二つの画像からひとつの画像を生成する例です
途中で分離して最後に統合していく例
Youtubeのオススメの動画では様々な要素を入力に突っ込んでいます
画像認識の適用例もあるので、参考にしてみてください
DeepLearningの画像認識適用例