生成AIパスポート~模擬試験②~ 2024年12月9日2024年12月9日 ailearn 1. 次の機械学習手法のうち、「アンサンブル学習」に該当するものを選びなさい。 サポートベクターマシン(SVM) 主成分分析(PCA) ランダムフォレスト K-近傍法(KNN) None 2. 次のうち、「次元削減」に分類される手法はどれか。 主成分分析(PCA) Q学習 決定木 ロジスティック回帰 None 3. 機械学習における「決定木」の主な特徴として正しいものはどれか。 線形分離可能なデータにのみ適用できる データの分類や回帰の両方に使用できる 教師なし学習の一例である 事前にデータを次元削減する必要がある None 4. 生成モデルの最も初期の概念に近い理論として正しいものはどれか。 ガウス分布 隠れマルコフモデル(HMM) ニューラルネットワーク k-近傍法(k-NN) None 5. VAE(変分オートエンコーダ)がGANと比較して有利とされる点として正しいものはどれか。 VAEは計算資源をほとんど必要としない VAEは完全に教師あり学習に基づいて動作する VAEは確率的潜在空間を学習し、生成データの多様性が高い VAEは大規模データセットが必要ない None 6. 「ハイパーパラメータ調整」が重要となる手法はどれか。 線形回帰 主成分分析(PCA) A/Bテスト ランダムフォレスト None 7. パブリシティ権が適用される具体的な事例として適切なものはどれか。 著名人の出演するテレビ番組を録画する 著名人のファンがその名前をSNSでシェアする 著名人が所有する物件の住所を公開する 著名人の写真を許可なく広告に使用する None 8. 次のうち、AIの学習において「教師あり学習」に該当するものはどれか。 犬と猫の画像を分類する際にラベル付きデータを使用する 大量のデータから自然にクラスタを形成する 試行錯誤を繰り返して最適な行動を学ぶ 予測モデルを人間の手で設定する None 9. パブリシティ権が適用される場合、商業利用が認められるケースとして正しいものはどれか。 著名人が参加したイベントの写真を個人のブログでシェアする 著名人の名前を商標登録して商品名に使用する 著名人が認めた場合に限り、肖像を広告に使用する 著名人の写真を個人的に保存する None 10. 機械学習が使用される主な目的はどれか。 データの可視化を最適化する データから予測や分類を行う コンピュータの計算速度を高める 人間の知識を直接的に適用する None 11. 次のうち、「勾配ブースティング」の特徴として最も適切なものはどれか。 クラスタリングアルゴリズムの一例である 入力データの標準化を必須とする 過学習を防ぐために正則化を使用しない 弱学習器を直列的に構築し、モデルの精度を向上させる None 12. 生成モデルの系譜において「トランスフォーマーベースのモデル」が注目される理由として正しいものはどれか。 トレーニングが非常に高速である 画像データの生成には適していない 長い文脈を効率的に処理できる ラベル付きデータが必須である None 13. ニューラルネットワークがAIに知能をもたらす仕組みとして用いる主な原理はどれか。 確率論 シンボリック推論 人工的な神経回路モデル 強化学習 None 14. ニューラルネットワークが従来のルールベースAIと異なる点はどれか。 データの前処理が不要である 推論能力を持たない プログラミングなしで動作可能である 決定ルールを明示的に記述する必要がない None 15. 次のアルゴリズムのうち、データのクラスタリングに使用されるものはどれか。 ランダムフォレスト 線形回帰 K-平均法(K-means) サポートベクターマシン(SVM) None 16. 変分オートエンコーダ(VAE)の潜在空間において、データの分布が学習される過程で「KLダイバージェンス」が果たす役割として適切なものはどれか。 潜在空間内のデータ間距離を最小化する デコーダの出力を直接最適化する 潜在分布が標準正規分布に近づくように調整する トレーニングデータのラベルを補完する None 17. 生成モデルの主要な応用例として正しいものはどれか。 データ生成による訓練データの拡張 機械学習モデルの訓練時間の短縮 データの圧縮アルゴリズムの設計 データベースの高速検索 None 18. 強化学習で用いられるアルゴリズムとして適切なものはどれか。 Q学習 ランダムフォレスト K-means 主成分分析(PCA) None 19. AIが生成した商業ポスターに、著名なキャラクターに似たイラストが含まれていた場合、広告主が著作権侵害やパブリシティ権侵害を防ぐために取るべき最適な対応はどれか。 生成されたイラストに大幅な修正を加えて公開する 著名なキャラクターの権利者から利用許諾を得る AI開発者に責任を求める ポスターの公開を一旦中止して社内で検討する None 20. 企業が公共イベントの写真を広告に使用する際、肖像権の侵害を避けるために最も適切な対応はどれか。 写真の背景を加工して全員の顔を隠す 写真に写っている人物全員から事前の許可を得る 公共イベントで撮影された写真は自由に利用できるため許可は不要 写真の使用後に人物に通知を行う None 21. 自己回帰型生成モデル(例:PixelRNN)が画像生成タスクにおいて直面する主な課題として正しいものはどれか。 高次元データの逐次生成による計算コストの増大 ラベル付きデータが必須である点 モード崩壊の頻発 潜在変数の分布が不明確である点 None 22. 生成モデルの系譜において「フロー型モデル(Normalizing Flows)」が採用する主要な手法として正しいものはどれか。 データの逐次生成 ディスクリミネータを使用した分類 可逆変換によるデータ分布の明示的モデリング 高次元データのクラスタリング None 23. ディープラーニングにおける「畳み込みニューラルネットワーク(CNN)」が画像認識に特化している理由として正しいものはどれか。 画像データの空間的特徴を効率的に抽出できるから 全ての入力データを一括処理できるから データの分類を行わずに処理するから 大規模データセットが不要だから None 24. Transformerモデルが自然言語処理(NLP)で広く利用される理由として正しいものはどれか。 自然言語データの前処理を完全に不要にするため 小規模データセットでのみ高精度を達成できるため 文法構造を直接的に理解するため 文中の長距離依存関係を効率的にモデル化できるため None 25. ディープラーニングがAIに知能をもたらす点として最も適切なものはどれか。 簡単な問題を素早く解決する能力 全てのタスクを人間より正確に解決する能力 複雑で非線形な問題の解決能力 小規模データセットに特化した能力 None 26. 生成モデルの中で「フリシェーインセプション距離(FID)」が使用される主な目的として正しいものはどれか。 生成されたデータの品質を評価する トレーニングデータセットのサイズを決定する モデルのトレーニング速度を測定する データのクラスタリング精度を確認する None 27. GAN(生成的敵対ネットワーク)を活用した画像生成で発生しやすい「モード崩壊(mode collapse)」の問題とは何を指すか。 ディスクリミネータが正しい分類を行えなくなる現象 ジェネレータが非常に遅い速度でデータを生成する現象 ディスクリミネータがジェネレータを完全に打ち負かす現象 ジェネレータが複数の異なる種類のデータを生成できない現象 None 28. 生成モデルにおける「自己教師あり学習」が重要視される理由として正しいものはどれか。 ラベル付きデータが大量に必要であるため モデルのトレーニングを完全に自動化するため ラベル付きデータの精度を向上させるため ラベルなしデータから特徴を学習できるため None 29. AI生成物に基づいて著作権侵害の訴訟が提起された場合、開発者が最初に確認すべき事項として最も適切なものはどれか。 AIの利用規約が著作権侵害を回避できる内容かどうか AIの生成物が他人の商標を含むかどうか トレーニングデータが適切にライセンスされているか AIの生成結果が公開されたタイミング None 30. AIが生成した肖像画像が他人の顔に似ている場合、肖像権の侵害が成立する可能性があるのはどのような場合か。 AIの生成プロセスに人間が関与していない場合 生成された画像が特定の個人を連想させる場合 生成された画像が完全に架空の人物である場合 AIの開発者が画像を使用した場合 None 31. 生成モデルの系譜における「自己回帰型モデル」の特徴として正しいものはどれか。 全データを同時に生成する データを逐次的に生成する 潜在変数を使用してデータを再構築する データのクラスタリングに特化している None 32. 次のうち、機械学習モデルの回帰問題を解決するためのアルゴリズムはどれか。 ナイーブベイズ K-平均法(K-means) ロジスティック回帰 線形回帰 None 33. 自己回帰型生成モデルの特徴として適切なものはどれか。 全てのデータポイントを同時に生成する 逐次的にデータポイントを生成する ラベル付きデータに依存する 潜在空間を利用しない None 34. 機械学習の手法のうち、教師なし学習に該当するものはどれか。 線形判別分析(LDA) 決定木 主成分分析(PCA) サポートベクターマシン(SVM) None 35. Transformerモデルの自己注意機構で使用される「キー(Key)」、「クエリ(Query)」、「バリュー(Value)」の役割を正確に理解するには、どの点を考慮する必要があるか。以下の中で正しい選択はどれか。 クエリが入力データを分割し、キーがそれを分類し、バリューが分類結果を統合する クエリが関連性を評価し、キーが関連性を示し、バリューが関連するデータを提供する バリューがデータをスケーリングし、クエリがそのスケールを適用し、キーが結果を保存する キーがデータを圧縮し、クエリがその圧縮を展開し、バリューが計算を最適化する None 36. Transformerモデルを大規模にスケーリングした場合、一般的に発生し得る問題として最も適切なものはどれか。 モデルがトレーニングデータの全てを記憶する 勾配爆発が頻発する 訓練コストが指数関数的に増加する モデルが極端なモード崩壊を示す None 37. AIが生成した画像を商業利用する際、知的財産権の侵害を避けるための最適な手段はどれか。 AI生成物を完全に加工する 商業利用の前に適切な権利確認を行う AIが生成した場合、権利確認は不要 AIの出力結果を自動的に公開する None 38. 機械学習の基本的な役割はどれか。 データからルールを自動的に見つけ出すこと ルールを手動でプログラミングすること コンピュータのハードウェア性能を向上させること データベースを最適化すること None 39. 肖像権侵害を防ぐため、写真や動画を公開する際に最も適切な対応はどれか。 被写体の同意を得る 公共の場で撮影した場合は同意不要 商業利用のみ同意を得る 顔が写っていなければ公開に制限はない None 40. 生成モデルとは何を指すか。 訓練データから新しいデータを生成できるモデル 決定木やサポートベクターマシンのような分類モデル データのクラスタリングに特化したモデル 高速なデータ処理に最適化されたアルゴリズム None 41. 生成モデルが特に注目される応用分野として正しいものはどれか。 ハードウェア設計の最適化 医療画像の生成と診断支援 経済データの分析と予測 高速データベース検索 None 42. Transformerモデルで用いられる「マルチヘッドアテンション」の主な目的として正しいものはどれか。 異なる情報の側面を同時に学習する モデルの計算コストを削減する 入力データを圧縮する 出力のランダム性を増加させる None 43. 機械学習モデルの性能を評価する際に用いられる「クロスバリデーション」の主な目的として最も適切なものはどれか。 学習速度を向上させるため モデルのサイズを小さくするため ハイパーパラメータを調整するため 汎化性能を測定するため None 44. AIに知能をもたらす2つの仕組みとして正しい組み合わせはどれか。 機械学習とルールベース 機械学習とニューラルネットワーク ルールベースと推論エンジン 機械学習と知識ベース None 45. 「サポートベクターマシン(SVM)」において、カーネル関数が果たす役割として正しいものはどれか。 モデルの学習速度を上げる 高次元空間で線形分離を可能にする データをクラスタリングする 次元削減を自動的に行う None 46. AI生成物を商業利用する際、肖像権やパブリシティ権の侵害を防ぐための適切な方法として正しいものはどれか。 トレーニングデータに著名人の写真を含めない 生成物に著名人を想起させる特徴がないことを確認する 生成物が著名人に似ていても明確な断り書きを添える 生成物の使用後に対象者に通知を行う None 47. AIが生成した架空の人物の画像を商業利用する場合、パブリシティ権の侵害が成立する可能性はどのような場合か。 架空の人物が実在する著名人を連想させる場合 架空の画像であるため侵害は成立しない 生成物が一般的な外見で特定性がない場合 商業利用に関係なく侵害が成立する場合 None 48. Transformerモデルにおける「ヘッド間の重み共有」が生成される情報に与える影響を最も正確に表す選択肢はどれか。 モデルの計算速度を劇的に向上させる モデル全体のメモリ消費量を削減する 各ヘッドが異なる特徴を学習できなくなる 入力データの順序依存性が完全に排除される None 49. 機械学習モデルにおいて、バイアス・バリアンストレードオフが示す現象として正しいものはどれか。 モデルの複雑さが増すと、必ず汎化性能が向上する 高バイアスのモデルは訓練データにもテストデータにも適合しない傾向がある 高バリアンスのモデルは訓練データへの適合度が低い バイアスが高い場合、モデルは過学習する None 50. AIが生成した架空の人物の肖像画像について、肖像権が適用される可能性はどれか。 完全に架空であれば肖像権は適用されない AIが生成した場合、自動的に肖像権が適用される トレーニングデータが公開されていない場合、適用される 架空であっても特定の個人を連想させれば適用される None 51. Transformerモデルの「ポジショナルエンコーディング」を不要にするために提案されている改良点として最も適切なものはどれか。 入力データをランダムにシャッフルする デコーダでポジショナル情報を学習させる ポジショナル情報を完全に削除する 相対位置エンコーディングを導入する None 52. AIが生成した作品の著作権が帰属しない場合、生成物の扱いとして正しいものはどれか。 公共財として自由に利用できる 開発者の権利として保護される 利用者が独占的に利用できる 知的財産権の対象外となる None 53. Transformerモデルが視覚データの処理に応用される際の特有の工夫として正しいものはどれか。 入力画像をトークン化して処理する 自己注意機構を除去する ポジショナルエンコーディングを廃止する 畳み込み層を追加する None 54. 肖像権とパブリシティ権の侵害が同時に成立する可能性がある状況として最も適切なものはどれか。 著名人の写真を許可なくSNSで称賛する投稿を行った場合 一般人の顔写真を広告に使用した場合 公共イベントで撮影された群衆の写真を公開した場合 著名人の写真を無断で広告に使用した場合 None 55. AIが生成した作品が著作権保護の対象となるための条件として正しいものはどれか。 AIによる自動生成である場合 人間が生成プロセスに創作性を付加している場合 AIの出力内容が完全に自動的に決定された場合 トレーニングデータが著作権フリーである場合 None 56. 生成モデルの中で「生成的敵対ネットワーク(GAN)」が導入した革新的なアイデアとして正しいものはどれか。 データ生成と分類の競争的トレーニング 自己教師あり学習 確率分布の明示的なモデリング トレーニングにラベル付きデータが必要 None 57. GAN(生成的敵対ネットワーク)が生成したデータの品質を向上させるために導入される「WGAN(Wasserstein GAN)」の主な特徴として最も適切なものはどれか。 損失関数としてWasserstein距離を利用する ジェネレータの出力に正規化を適用する ディスクリミネータを確率的モデルに置き換える ジェネレータのトレーニング回数を減少させる None 58. 肖像権が適用される対象として正しいものはどれか。 企業のロゴ 一般人や著名人の顔や姿 著作物の内容 動物の画像 None 59. Transformerモデルが従来のRNNと比較して優れている点として正しいものはどれか。 時系列データの順序を完全に無視できる 並列処理が可能である 入力データの順序を保持しない 訓練にラベル付きデータが不要である None 60. 生成モデルが「モンテカルロ法」と関連する理由として最も適切なものはどれか。 データの確率分布を明示的に計算するため サンプリングを通じて不確実性をモデル化するため データの分類精度を向上させるため 潜在変数の次元を削減するため None Time's up