AI実装検定S級～模擬試験②～

MobileNetにおいて「Depthwise Separable Convolution」の主な利点は何ですか？

ネットワークの層数を増やすため

計算量とパラメータ数を削減するため

特徴抽出能力を低下させるため

モデルの学習速度を遅くするため

None

HREDモデルの「階層構造」の主な利点は何ですか？

学習データの量を減らせる

訓練速度を向上させる

長いシーケンスや対話の文脈を効果的に学習できる

モデルの計算コストを削減する

None

MobileNetの「Depthwise Separable Convolution」と従来の畳み込み層を比較した場合、パラメータ数の削減率はどの程度ですか？

約10%

約50%

約75%

約90%

None

MobileNetV2がMobileNetV1に比べてパフォーマンスが向上した主な理由は何ですか？

Depthwise Separable Convolutionを使用しなくなったため

インバーテッド残差構造とリニアボトルネックを導入したため

モデルの幅を狭くしたため

1x1の畳み込みを削除したため

None

HREDモデルが通常のseq2seqモデルと異なる点は何ですか？

seq2seqモデルは並列処理が可能だが、HREDはできない

HREDは発話や文の階層構造を扱うが、seq2seqモデルは単一のシーケンスのみを扱う

HREDはTransformerに基づくモデルである

HREDは畳み込み層を持つ

None

EfficientNetの「Compound Scaling」を調整する際、幅を大きくスケーリングしすぎるとどのような問題が発生しますか？

モデルの深さが減少し、学習が不安定になる

計算コストが減少しすぎ、精度が著しく低下する

特徴マップのチャネル数が減少しすぎて、表現力が低下する

モデルの計算コストが大幅に増加し、効率が低下する

None

Skip-gramモデルで、負のサンプリング（Negative Sampling）を使用する際に最も重要なハイパーパラメータは何ですか？

バッチサイズ

学習率

ウィンドウサイズ

サンプリングの負例の数

None

EfficientNetのMBConvブロックで「リニアボトルネック」を採用する理由は何ですか？

計算コストを削減しつつ、情報の損失を防ぐため

パラメータ数を増加させるため

特徴マップのサイズを増加させるため

残差接続を無効にするため

None

DenseNetにおける「成長率（Growth Rate）」は何を示していますか？

各層で新たに追加されるフィルタ数

ネットワーク全体の層数

モデルの学習速度

畳み込み層のカーネルサイズ

None

10.

Skip-gramモデルにおける「単語ベクトル」の次元数が増えると、何が改善される可能性がありますか？

モデルの計算速度が向上する

モデルの過学習が防止される

単語間の意味的な関係がより詳細に捉えられるようになる

モデルの出力サイズが固定される

None

11.

EfficientNetのスケーリング戦略である「Compound Scaling」の目的は何ですか？

計算コストを無視して最大限の精度を追求するため

幅、深さ、解像度をバランスよく拡大し、効率的に精度を向上させるため

モデルのパラメータ数を削減するため

モデルの訓練時間を短縮するため

None

12.

HREDモデルの「文エンコーダ」にLSTMを使用する利点は何ですか？

モデルの訓練時間を短縮できる

モデルのパラメータ数を減少させる

LSTMは勾配消失問題が発生しやすいため

LSTMは長期的な依存関係を保持しやすく、文中の単語間の関係をより正確に捉えることができる

None

13.

MobileNetの最大の特徴は次のうちどれですか？

モデルのパラメータ数を増やして高精度を実現する

分離可能な畳み込み（Depthwise Separable Convolution）による効率的な計算

大規模な計算リソースを必要とする

全結合層を削除している

None

14.

HREDモデルはどのようなタスクに特に適していますか？

文書生成や対話システム

画像分類

機械翻訳

音声認識

None

15.

DenseNetにおいて「トランジションレイヤー」が適切に設計されていない場合、どのような問題が発生しますか？

特徴マップが過度に大きくなり、計算効率が悪化する

モデルのパラメータ数が減少しすぎて精度が低下する

勾配消失が発生しやすくなる

モデルが学習しなくなる

None

16.

MobileNetが主に使用されるアプリケーション分野はどれですか？

モバイル端末や組み込みシステムなどの計算資源が限られた環境

高性能なサーバーでのバッチ処理

大規模なデータセットのトレーニング

分散コンピューティング環境

None

17.

HREDモデルが「対話システム」において持つ最大の利点は何ですか？

訓練時間を短縮できる

過去の対話の文脈を長期間にわたり保持し、文脈に基づいた応答を生成できる

生成する応答を短縮できる

各発話を独立して処理できる

None

18.

MobileNetV3で新たに採用された「ハードスワッシュ（Hard-Swish）」の活性化関数は、何を改善するために使用されますか？

ReLU6の計算効率をさらに向上させるため

ネガティブな出力を増加させるため

特徴抽出のための出力範囲を広げるため

活性化関数の非線形性を減らすため

None

19.

HREDモデルにおいて「デコーダ」の役割は何ですか？

コンテキストエンコーダの出力に基づいて、次の文や発話を生成する

各単語をエンコードする

モデルの損失関数を計算する

モデルの学習率を調整する

None

20.

HREDモデルの生成した応答が一貫性を欠く場合、どのような改善策が考えられますか？

モデルの出力を正規化する

コンテキストエンコーダにアテンション機構を導入し、文脈の重要な部分に注意を向けさせる

モデルのパラメータを増やす

モデルの訓練データを減らす

None

21.

HREDモデルにおいて「ドメイン特化型対話システム」を作成する際に考慮すべき点はどれですか？

モデルのパラメータ数を減らす

特定のドメインに特化したデータセットでモデルを訓練し、そのドメインに適した応答生成を行う

モデルの学習速度を向上させるために、一般的なデータセットを使用する

モデルの出力シーケンスをシャッフルする

None

22.

EfficientNetにおいて「MBConvブロック」の主な役割は何ですか？

低次元空間での情報を学習し、計算コストを削減するため

チャネルの次元を削減し、重要な特徴を強調するため

残差接続を無効にするため

特徴マップを拡大して精度を向上させるため

None

23.

Word2VecのSkip-gramモデルの目的は次のうちどれですか？

中心語に対してその文脈語を予測する

文全体の意味をエンコードする

文脈に基づいて文章を生成する

文中の単語をシャッフルする

None

24.

EfficientNetの「Compound Scaling」が従来のスケーリング手法と異なる点は何ですか？

幅、解像度、深さを同時にバランスよくスケールさせる

幅のみをスケールさせる

モデルの解像度だけを増加させる

深さを固定し、解像度を大きくスケールさせる

None

25.

MobileNetの設計において、「ストライド2」のDepthwise Convolutionを使用する主な目的は何ですか？

計算量を増加させるため

モデルのパラメータ数を増やすため

特徴マップのチャネル数を減らすため

特徴マップの空間解像度を縮小し、重要な特徴を強調するため

None

26.

MobileNetの「αパラメータ」を減少させることによって予想される影響は何ですか？

モデルの計算コストが増加し、精度が低下する

モデルの計算コストが減少し、精度が向上する

モデルの計算コストが減少し、精度が低下する

パラメータ数が増加し、モデルが過学習する

None

27.

EfficientNetの主な特徴は何ですか？

深さのみをスケールさせたモデル

モデルの幅、解像度、深さをバランスよくスケールさせる

幅を広げることでパフォーマンスを向上させたモデル

全結合層を多用した設計

None

28.

HREDのような階層型モデルが一般的なRNNに比べて長期依存関係を捉えるのに優れている理由は何ですか？

モデルのパラメータ数が少ないため

訓練時間が短いため

全てのシーケンスが並列処理されるため

階層構造によって文や発話単位の依存関係を保持しやすいため

None

29.

HREDモデルの「文エンコーダ」の役割は何ですか？

各文の単語をエンコードし、文の全体的な意味を表現する

モデルの出力シーケンスを生成する

モデルのパラメータを調整する

文全体の文脈を無視する

None

30.

EfficientNetが「Squeeze-and-Excitation（SE）」ブロックを導入している理由は何ですか？

パラメータ数を削減するため

各チャネルの重要度を学習し、適応的に重み付けを行うため

特徴マップのサイズを拡大するため

活性化関数を変更するため

None

31.

HREDモデルにおける「コンテキストエンコーダ」の役割は何ですか？

全体の文脈情報をエンコードし、各文の情報を統合する

各文の意味をエンコードする

モデルの重みを最適化する

モデルの学習率を調整する

None

32.

MobileNetV2で導入された「インバーテッド残差構造（Inverted Residuals）」の主な利点は何ですか？

残差接続を無効にする

低次元空間での学習を避け、計算効率を向上させる

活性化関数をReLUからSigmoidに変更する

特徴マップのサイズを増加させる

None

33.

DenseNetの「密結合」構造において、層ごとに出力される特徴が前層の出力と統合されることによって得られる効果は何ですか？

モデルのパラメータ数が増加する

層ごとに冗長な特徴を抽出し、精度が向上する

学習速度が遅くなる

特徴の再利用によって、効率的な学習が行われ、より高い性能が得られる

None

34.

EfficientNetが従来のモデルよりも計算効率が高い理由は何ですか？

全ての畳み込み層でストライド2を使用しているため

モデルの層数を削減しているため

Compound Scalingにより、計算コストを抑えつつ精度を向上させているため

活性化関数を変更したため

None

35.

HREDモデルの基本的な構造は次のうちどれですか？

単一のRNNエンコーダとデコーダ

階層的に複数のエンコーダとデコーダを持つモデル

畳み込みニューラルネットワーク（CNN）を使用したモデル

自己注意機構を使用したTransformerモデル

None

36.

EfficientNetで使用される「バッチ正規化（Batch Normalization）」の役割は何ですか？

モデルのパラメータ数を削減する

全ての層で活性化関数を無効にする

各層の出力を正規化し、学習の安定性を向上させる

モデルの幅を調整する

None

37.

DenseNetにおける「密結合」の利点は次のうちどれですか？

モデルのパラメータ数を削減する

各層が他の層からの情報を再利用し、効率的な学習が可能となる

モデルの訓練時間を短縮する

全ての層が独立して動作する

None

38.

Word2VecのSkip-gramモデルにおける「ウィンドウサイズ」が大きすぎると、どのような問題が発生する可能性がありますか？

単語の類似性が低下する

ノイズが増加し、関連性の低い単語が学習される可能性がある

モデルのパラメータが減少する

単語の出現回数が増加する

None

39.

DenseNetのアーキテクチャにおける「パラメータ効率の良さ」の主な理由は次のうちどれですか？

残差接続を用いているため

各層が他の層の出力を再利用し、新しいフィルタ数を最小限に抑えるため

活性化関数がReLUの代わりにSigmoidを使用しているため

全ての層で同じフィルタ数を使用しているため

None

40.

DenseNetの「成長率（Growth Rate）」が小さすぎる場合、どのような影響がありますか？

モデルのパラメータ数が増加しすぎる

モデルの表現力が低下し、精度が低くなる可能性がある

特徴マップのサイズが増加しすぎる

勾配消失問題が発生する

None

41.

DenseNetにおける「勾配爆発」や「勾配消失」を防ぐために有効な設計は次のうちどれですか？

各層での残差接続

全層での独立した学習

密結合による勾配の伝播とバッチ正規化の使用

活性化関数を完全に無効化する

None

42.

MobileNetV2の「インバーテッド残差構造」が従来の残差構造と異なる点は何ですか？

残差接続を削除している

全ての層でReLUを使用していない

非線形活性化を使用していない

高次元空間での特徴抽出後に次元削減を行う

None

43.

HREDモデルにおいて「情報ボトルネック問題」が発生する可能性がある理由は何ですか？

モデルが過去の対話を全て記憶するため

モデルが同じ応答を繰り返し生成するため

コンテキストエンコーダが全ての情報を1つのベクトルに圧縮するため、長い対話では情報が失われやすくなるため

モデルの計算コストが高いため

None

44.

DenseNetが「勾配消失問題」を効果的に防ぐ理由は何ですか？

各層が残差接続を使用しているため

モデルの深さが浅いため

全ての層が前の層から直接情報を受け取る密結合構造を持つため

活性化関数を使用していないため

None

45.

MobileNetV3で導入された「Squeeze-and-Excitation（SE）ブロック」の役割は何ですか？

モデルのパラメータ数を増加させるため

特徴マップの空間的解像度を増加させるため

各チャネルの重要度を学習し、適応的に特徴マップの重み付けを行うため

活性化関数をReLUに変更するため

None

46.

EfficientNetが「軽量」でありながら「高精度」を実現できる理由は何ですか？

MBConvブロック、リニアボトルネック、SEブロックの効率的な組み合わせによるため

全結合層を使用していないため

活性化関数をReLUからSigmoidに変更したため

モデルの深さを無限に増やせるため

None

47.

DenseNetにおいて「ブロック（Block）」はどのような役割を果たしますか？

それぞれのブロック内で独立した学習を行う

パラメータの数を大幅に減少させる

他のブロックと直接的に情報を交換しない

同じ特徴を再利用し、計算量を増やさずに学習を進める

None

48.

MobileNetが「軽量」でありながら「高精度」を維持できる理由は次のうちどれですか？

モデルの深さを増やしているため

分離可能な畳み込み（Depthwise Separable Convolution）や次元削減を効率的に使用しているため

全ての層でReLUを使用しているため

残差接続を多用しているため

None

49.

MobileNetで「1x1の畳み込み（Pointwise Convolution）」が使用される目的は何ですか？

各チャネルの情報を統合し、出力チャネルを生成するため

モデルのパラメータ数を増加させるため

モデルの学習速度を遅くするため

特徴マップのサイズを拡大するため

None

50.

HREDモデルにアテンション機構を導入することで得られる利点は何ですか？

モデルのパラメータ数を減らす

モデルの訓練速度を向上させる

文脈内の重要な部分に注意を向け、情報を劣化させずに保持できる

データの正規化が不要になる

None

Time's up