見出し画像

PyTorch深層学習⑭畳み込み層:実践編

前回は、畳み込み層の仕組みを解説しました。今回は、特に画像処理などで使われる2次元畳み込み(nn.Conv2d)を紹介します。

本シリーズの記事リスト



nn.Conv2dでは次のような設定パラメータがあります。

  • 入力チャンネル(in_channels)

  • 出力チャンネル(out_channels)

  • カーネルサイズ(kernel_size)

  • ストライド(stride)

  • パディング(padding)

  • ダイレーション(dilation)

  • グループ(groups)

  • バイアス(bias)

  • パディングモード(padding_mode)

これらを一つ一つ見ていきます。

デフォルトでは次のような値が設定されます。

import torch.nn as nn

nn.Conv2d(
    in_channels,
    out_channels,
    kernel_size,
    stride=1,
    padding=0,
    dilation=1,
    groups=1,
    bias=True,
    padding_mode='zeros',
    device=None,
    dtype=None)

では、さっそく始めましょう。


ここから先は

4,105字 / 7画像

キカベン・読み放題

¥1,000 / 月
初月無料
このメンバーシップの詳細

この記事が気に入ったらサポートをしてみませんか?