AI実装検定S級～模擬試験～

DenseNetの「トランジションレイヤー」において、プーリング操作が行われる理由は何ですか？

特徴マップの解像度を縮小し、計算コストを削減するため

特徴マップのチャネル数を増やすため

モデルのパラメータ数を削減するため

勾配消失を防ぐため

None

Transformerモデルがseq2seqモデルに対して持つ最大の利点は何ですか？

アテンション機構のみを使用することで、並列処理が可能であり、長いシーケンスでも効率的に処理できるため

モデルのサイズを削減するため

パラメータ数を減らすため

モデルの訓練時間を短縮するため

None

HREDモデルにおいて「対話型システム」でよく使用される理由は何ですか？

生成された文を短縮できる

音声認識に特化しているため

ユーザーの過去の発話や文脈を保持し、より自然な応答を生成できるため

モデルのパラメータ数が少ないため

None

seq2seqモデルで「デコーダ」が生成するのは何ですか？

入力シーケンスの次元数

出力シーケンス

モデルの重み

エンコーダの隠れ状態

None

ResNetの設計において、最大の特徴である「残差接続（Residual Connection）」の目的は何ですか？

モデルの計算コストを削減するため

非線形性を増加させるため

勾配消失問題を軽減し、深い層でも学習が安定するようにするため

モデルのパラメータ数を増加させるため

None

VGGネットワークの層の総数が多い理由は何ですか？

複雑な画像処理をシンプルにするため

各層で異なるレベルの特徴を学習し、高次の抽象的特徴を得るため

各層のパラメータ数を減らすため

モデルの訓練を容易にするため

None

ResNetが「オーバーフィッティング」を防ぐために使用する手法は次のうちどれですか？

ドロップアウト

残差接続

正則化

L2正則化

None

ResNetの「学習率スケジューリング」が訓練において重要である理由は何ですか？

学習の初期段階で大きな学習率を使用し、後半では小さな学習率を使用して最適な収束を促すため

学習率を一定に保つため

勾配消失問題を解決するため

モデルのパラメータ数を増加させるため

None

VGGネットワークで「転移学習」が効果的な理由は何ですか？

モデルが浅いネットワーク構造を持つため

事前学習された特徴が多くの異なるタスクに対して汎用的であるため

モデルのパラメータ数が少ないため

モデルが固定された出力サイズを持つため

None

10.

VGG16において「16」という数字が示しているものは何ですか？

畳み込み層のカーネルサイズ

ネットワーク内の畳み込み層と全結合層の合計数

ネットワークの深さ

プーリング層の数

None

11.

HREDモデルにおいて「デコーダ」の役割は何ですか？

コンテキストエンコーダの出力に基づいて、次の文や発話を生成する

各単語をエンコードする

モデルの損失関数を計算する

モデルの学習率を調整する

None

12.

GoogLeNetで「Global Average Pooling（GAP）」が使用される理由は何ですか？

全結合層を削減し、過学習を防ぐため

特徴マップのサイズを増やすため

活性化関数を最適化するため

モデルの計算速度を低下させるため

None

13.

EfficientNetにおいて「MBConvブロック」の主な役割は何ですか？

低次元空間での情報を学習し、計算コストを削減するため

チャネルの次元を削減し、重要な特徴を強調するため

残差接続を無効にするため

特徴マップを拡大して精度を向上させるため

None

14.

MobileNetV3で新たに採用された「ハードスワッシュ（Hard-Swish）」の活性化関数は、何を改善するために使用されますか？

ReLU6の計算効率をさらに向上させるため

ネガティブな出力を増加させるため

特徴抽出のための出力範囲を広げるため

活性化関数の非線形性を減らすため

None

15.

Transformerモデルのトレーニングにおいて「学習率ウォームアップ」を使用する理由は何ですか？

モデルの学習を開始する前に、学習率を徐々に増加させて安定した学習を行うため

モデルの重みを初期化するため

モデルの過学習を防ぐため

データの正規化を行うため

None

16.

HREDモデルの訓練時に「長短期記憶（LSTM）」と「ゲート付きリカレントユニット（GRU）」のどちらを使用するか選択する際のポイントは何ですか？

モデルのパラメータ数がLSTMよりもGRUの方が少なく、計算が高速になるため

LSTMの方がGRUよりも常に優れているため

GRUは勾配消失問題を完全に解決できるため

GRUは学習速度が遅いため

None

17.

ResNetで使用される「バッチ正規化（Batch Normalization）」の主な役割は何ですか？

学習率を自動で最適化するため

モデルの計算量を減らすため

各層の出力を正規化し、学習の安定性を向上させるため

残差接続の効果を無効にするため

None

18.

seq2seqモデルにおいて、損失関数として「クロスエントロピー損失」がよく使用される理由は何ですか？

モデルのトレーニングを自動化できるため

データの前処理を省略できるため

モデルの出力をバイナリデータに変換するため

モデルの出力が確率分布であり、正解ラベルとの誤差を測定するのに適しているため

None

19.

GoogLeNetが「事前学習済みモデル」として広く使用される理由は何ですか？

モデルが軽量であるため

事前学習された特徴が他のタスクに適用できないため

異なる画像データセットに対しても高い性能を発揮するため

モデルの層が浅いため

None

20.

EfficientNet-B7がEfficientNet-B0に比べて優れている点は何ですか？

モデルの幅、深さ、解像度が大きくスケーリングされ、精度が高い

モデルが軽量で、計算リソースを節約できる

全結合層を使用していないため

バッチ正規化が全く使用されていないため

None

21.

DenseNetの「成長率（Growth Rate）」が小さすぎる場合、どのような影響がありますか？

モデルのパラメータ数が増加しすぎる

モデルの表現力が低下し、精度が低くなる可能性がある

特徴マップのサイズが増加しすぎる

勾配消失問題が発生する

None

22.

Transformerモデルにおいて「Layer Normalization（層正規化）」が行われる主な理由は何ですか？

モデルの出力を正規化して勾配爆発や消失を防ぐため

モデルのサイズを削減するため

モデルのトレーニング速度を遅くするため

データを自動で前処理するため

None

23.

EfficientNetの「Compound Scaling」の調整によって「解像度」を過度にスケーリングした場合、どのような問題が発生しますか？

解像度が高すぎて、学習が進まなくなる

モデルの計算コストが急激に増加し、処理が遅くなる

モデルの幅が狭くなり、パフォーマンスが低下する

モデルが過学習する

None

24.

seq2seqモデルにおいて、「BLEUスコア」とは何を測定する指標ですか？

モデルの出力シーケンスの生成速度

生成されたシーケンスが、ターゲットシーケンスとどれだけ一致しているかを測定する指標

モデルの損失関数の値

モデルのハイパーパラメータの最適性

None

25.

VGGネットワークが従来のCNNモデルと比較して持つ利点は何ですか？

訓練時間が大幅に短縮される

より浅いネットワークで同等の性能を達成する

より深い層を使用することで、より抽象的な特徴を学習できる

全結合層を減らすことでパラメータ数が減る

None

26.

Word2VecのSkip-gramモデルにおける「softmax関数」の役割は何ですか？

モデルの出力を正規化し、各文脈語に対する確率を計算するため

モデルのパラメータを初期化するため

モデルの損失関数を計算するため

モデルの学習速度を向上させるため

None

27.

VGGネットワークが多くのパラメータを持つことの欠点を軽減するために、近年利用される技術は何ですか？

データ拡張

モデルの蒸留

転移学習

プルーニング（剪定）

None

28.

GPT-3のような自己回帰型モデルにおいて「注意欠陥」が起こる理由は何ですか？

モデルが過去の情報に過剰に依存しすぎるため

モデルが同じトークンに繰り返し注意を向けるため

モデルが次のトークンを生成する際に、遠い過去の情報を無視する可能性があるため

モデルが文法的な構造を理解しないため

None

29.

DenseNetの「密結合」構造が、他のモデルと比較してパラメータ効率を向上させる理由は何ですか？

各層が残差接続を使用しているため

活性化関数をReLUからLeaky ReLUに変更しているため

各層が新しいパラメータを必要とせず、既存の特徴を再利用するため

特徴マップの解像度を一定に保っているため

None

30.

VGGネットワークにおける「ゼロパディング」の主な役割は何ですか？

特徴マップのサイズを固定し、畳み込み層で情報の損失を防ぐため

モデルの訓練時間を短縮するため

モデルの出力をシャッフルするため

モデルの重みを初期化するため

None

31.

HREDモデルにおいて「情報ボトルネック問題」が発生する可能性がある理由は何ですか？

モデルが過去の対話を全て記憶するため

モデルが同じ応答を繰り返し生成するため

コンテキストエンコーダが全ての情報を1つのベクトルに圧縮するため、長い対話では情報が失われやすくなるため

モデルの計算コストが高いため

None

32.

VGGネットワークの設計において、特徴的な要素は何ですか？

大きなカーネルサイズを持つ畳み込み層

複数の小さい3x3のカーネルを積み重ねる設計

平均プーリングのみを使用する

ReLU活性化関数を使用しない

None

33.

VGGネットワークの設計において「全結合層」を使用する目的は何ですか？

特徴マップのサイズを減らすため

畳み込み層で抽出した特徴を元に、最終的なクラス分類を行うため

モデルのパラメータ数を削減するため

活性化関数を変更するため

None

34.

EfficientNetにおける「Squeeze-and-Excitation（SE）」ブロックを適用することで期待できる効果は何ですか？

パラメータ数が削減され、計算コストが減少する

チャネルごとの重要度を学習し、精度が向上する

計算コストが大幅に増加する

モデルのスケーリングが無効になる

None

35.

MobileNetV2で導入された「インバーテッド残差構造（Inverted Residuals）」の主な利点は何ですか？

残差接続を無効にする

低次元空間での学習を避け、計算効率を向上させる

活性化関数をReLUからSigmoidに変更する

特徴マップのサイズを増加させる

None

36.

HREDモデルの生成した応答が一貫性を欠く場合、どのような改善策が考えられますか？

モデルの出力を正規化する

コンテキストエンコーダにアテンション機構を導入し、文脈の重要な部分に注意を向けさせる

モデルのパラメータを増やす

モデルの訓練データを減らす

None

37.

WideResNetが標準のResNetに比べて「計算効率」を高めるために採用している設計方針は次のうちどれですか？

残差ブロックの数を減らし、幅を増やすことで学習速度を向上させる

全ての畳み込み層を1x1に置き換える

モデルの深さをさらに増やす

全結合層を削除する

None

38.

MobileNetV3で導入された「ハードスワッシュ」とReLU6を比較した場合、どのような性能向上が期待されますか？

ハードスワッシュは、ReLU6よりも計算効率が高く、表現力が向上する

ハードスワッシュは、ReLU6よりも計算コストが高いが精度が向上する

ハードスワッシュは、ReLU6と同様のパフォーマンスを持つ

ReLU6は、ハードスワッシュよりも効率が良い

None

39.

seq2seqモデルにおいて、「学習時のスケジュールサンプリング」が持つ効果は何ですか？

モデルの学習速度を速めるため

モデルのパラメータ数を減少させるため

訓練時にモデルが予測したトークンを使い、実運用に近い形で学習するため

モデルのハイパーパラメータを自動的に最適化するため

None

40.

ResNetの「ボトルネックブロック」が非常に深い層でも有効に機能する理由は何ですか？

パラメータ数を減らすことで計算効率を向上させ、勾配消失を防ぐため

各層で出力を増加させるため

全結合層を使用しないため

活性化関数を削除するため

None

41.

EfficientNetの主な特徴は何ですか？

深さのみをスケールさせたモデル

モデルの幅、解像度、深さをバランスよくスケールさせる

幅を広げることでパフォーマンスを向上させたモデル

全結合層を多用した設計

None

42.

MobileNetにおいて「Depthwise Separable Convolution」の主な利点は何ですか？

ネットワークの層数を増やすため

計算量とパラメータ数を削減するため

特徴抽出能力を低下させるため

モデルの学習速度を遅くするため

None

43.

EfficientNet-B0が他のEfficientNetシリーズよりも軽量である理由は何ですか？

Compound Scalingの基準となるモデルで、パラメータ数が少ないため

モデルの幅と解像度が固定されているため

より多くの畳み込み層を使用しているため

ストライド2の畳み込みが多用されているため

None

44.

Word2VecのSkip-gramモデルにおける「学習率」を最適化する理由は何ですか？

モデルの出力を正規化するため

過学習を防ぐため

モデルが最適なパラメータ更新を行い、効率的に収束するため

モデルの計算速度を増加させるため

None

45.

GoogLeNetの出力層の設計に関して、正しい説明は次のうちどれですか？

Softmax活性化関数を使用して、各クラスの確率を出力する

ReLUを使用してクラス間の差異を明確にする

Linear活性化関数を使用して連続値を出力する

Tanh関数を使用して二値分類を行う

None

46.

EfficientNetで使用される「バッチ正規化（Batch Normalization）」の役割は何ですか？

モデルのパラメータ数を削減する

全ての層で活性化関数を無効にする

各層の出力を正規化し、学習の安定性を向上させる

モデルの幅を調整する

None

47.

GoogLeNetの設計で「プーリング層」を使用する主な目的は何ですか？

パラメータ数を増やすため

モデルの計算速度を低下させるため

特徴マップのサイズを縮小し、重要な特徴を強調するため

活性化関数を最適化するため

None

48.

EfficientNetで「深さ」をスケーリングしすぎた場合に起こりうる問題は何ですか？

計算量が減少し、モデルの表現力が低下する

特徴マップが縮小しすぎて情報が失われる

計算コストが過剰に増加し、学習が難しくなる

モデルが浅くなり、パフォーマンスが低下する

None

49.

GoogLeNetが従来のCNNモデルよりも効率的に計算できる理由は何ですか？

モデルの層が浅いため

1x1の畳み込みによる次元削減が計算量を大幅に削減するため

重みがランダムに初期化されているため

プーリング層が使用されていないため

None

50.

MobileNetV3で導入された「Squeeze-and-Excitation（SE）ブロック」の役割は何ですか？

モデルのパラメータ数を増加させるため

特徴マップの空間的解像度を増加させるため

各チャネルの重要度を学習し、適応的に特徴マップの重み付けを行うため

活性化関数をReLUに変更するため

None

Time's up