AI実装検定B級~模擬試験①~ 2024年12月8日 ailearn 1. 「機械学習における学習」とは何を指しますか? データを使用してモデルのパラメータを調整するプロセス 人間が直接データを入力する作業 プログラムを動かすための環境設定 モデルの推論結果を評価する作業 None 2. 異常検知のタスクにおいて、正常データが圧倒的に多く、異常データが少ない場合、最も適切な評価指標はどれですか? 正答率(Accuracy) 平均絶対誤差(MAE) F1スコア 平均二乗誤差(MSE) None 3. 特徴量選択の目的として最も適切なものは何ですか? モデルのサイズを増加させる データの欠損を補完する データのサイズを増やす モデルの性能向上と計算コストの削減 None 4. 「次元削減」とは何を指しますか? データを新しいクラスに分類する手法 データを時系列に沿って並べ替える手法 データを標準化する手法 データの次元数を減らして、学習効率や可視化を向上させる手法 None 5. 主成分分析(PCA)を用いた次元削減において、どのようにして「情報の損失」を最小限に抑えることができますか? データをすべて削除する 主成分のうち、分散が大きいものから順に選択する 主成分のうち、分散が小さいものから順に選択する データを標準化せずに使用する None 6. データの「標準化」とはどのような操作ですか? データを平均0、標準偏差1にスケーリングする操作 データをグループに分ける操作 データを欠損値で補完する操作 データにラベルを付ける操作 None 7. 特徴抽出における主成分分析(PCA)の目的は何ですか? データの次元を削減する データをクラス分けする データにノイズを加える データの品質を上げる None 8. 2016年に、囲碁の世界チャンピオンに勝利したAIプログラムは何ですか? AlphaGo IBM Watson ディープブルー LISP None 9. 時系列データに対するモデルを作成する際に考慮すべき特徴として最も重要なものは何ですか? データのスケール データのラベルの有無 データの時間的な依存関係 データの次元数 None 10. データの「オーバーサンプリング」とは何ですか? 少数のクラスのデータを増やすことで、クラス間のバランスを取る手法 データの次元を削減する手法 データの標準化を行う手法 欠損データを補完する手法 None 11. モデルの「汎化性能」を向上させるために適切な手法はどれですか? 学習データを増やさない モデルの複雑さを高める 交差検証や正則化を使用する 過学習を促進する None 12. 異常検知に使用される代表的なアルゴリズムはどれですか? 主成分分析(PCA) 線形回帰 k-近傍法(k-NN) ニューラルネットワーク None 13. 1960年代のAIの発展を支えた代表的なAIプログラム「ELIZA」は、どのようなプログラムですか? ロボット制御プログラム 自然言語処理プログラム 自動運転プログラム 数値解析プログラム None 14. 「ハイパーパラメータ」とは何ですか? モデルの学習プロセスで手動で設定されるパラメータ モデルの出力に直接影響を与えるパラメータ データの前処理に使われるパラメータ 推論時に動的に決定されるパラメータ None 15. 次のうち、「時系列データ」として最も適切な例はどれですか? 写真の画像データ 人口分布データ 株価の推移 顧客の購買履歴データ None 16. 次のうち、「ラベル付けされたデータ」を使用するタスクはどれですか? 教師あり学習 教師なし学習 クラスタリング 次元削減 None 17. 1956年に開催された「ダートマス会議」は、AIの歴史において何を示唆した出来事でしたか? AIの正式な誕生 初のAI論文の発表 初のAI企業の設立 人工知能の定義が初めて確立された None 18. データ正規化がパターン認識モデルの精度向上に寄与する理由は何ですか? 特徴量間のスケールを揃えることで、モデルのバイアスを防ぐため データを整数に変換するため 計算コストを低減するため データの次元を削減するため None 19. 「過学習」とは何ですか? モデルがデータを学習できない現象 学習データに対しては高い精度を持つが、新しいデータに対しては性能が低下する現象 学習データに対してモデルが適用できない状態 正解データがない場合に起こる現象 None 20. 次のタスクのうち、「分類問題」に該当するものはどれですか? 家の価格を予測する スパムメールを判定する 顧客のクラスターを見つける 画像からの次元削減を行う None 21. k近傍法(k-NN)の分類アルゴリズムにおいて、kの値が小さすぎるとどのような問題が発生しますか? オーバーフィッティング アンダーフィッティング データの次元が増える ノイズが減る None 22. k-NN法において、データの次元数が多くなると、分類精度が低下する「次元の呪い」が発生する理由は何ですか? 計算速度が遅くなるため データ間の距離が均一化されるため クラス間の分離が悪くなるため 適切なkを選びにくくなるため None 23. パターン認識における「教師あり学習」の特徴として正しいものはどれですか? データにラベルがない 正しい答えをモデルに学習させる モデルは自己組織化によってパターンを見つける クラス分類を行わない None 24. データの「アンダーサンプリング」とは何ですか? 欠損データを補完する手法 データの次元を削減する手法 新しい特徴量を生成する手法 大量のデータから少数のデータをランダムに選んで使用する手法 None 25. 「データの正規分布」とはどのような形の分布を指しますか? ランダムに分散したデータの分布 平均を中心に左右対称なベル型の分布 一方向に偏ったデータの分布 変数間の相関を表す分布 None 26. 畳み込みニューラルネットワーク(CNN)において、プーリング層の主な役割は何ですか? 特徴マップの次元を削減し、重要な特徴を抽出する 重みの学習を高速化する 非線形性を導入する データを正規化する None 27. リッジ回帰において、「L2正則化」の効果として正しいものはどれですか? モデルの全ての重みをゼロに近づける 一部の特徴量を完全に無視する モデルの重みを小さくし、過学習を防ぐ データの次元を削減する None 28. 「損失関数」の役割は何ですか? データを前処理するための関数 モデルの予測と実際の値との誤差を計算するための関数 モデルの構造を決定するための関数 学習率を調整するための関数 None 29. データの「バイアス・バリアンストレードオフ」において、バイアスが大きい場合にモデルが示す傾向は何ですか? 過学習が起こりやすくなる 学習データに対する精度が高くなる モデルが単純化され、訓練データに過剰に適応しない テストデータに対する精度が高くなる None 30. 「勾配消失問題」とはどのような問題ですか? 学習が進むにつれて勾配が0に近づき、重みの更新が停止する問題 データがランダムに分散される問題 モデルが学習できない問題 データが欠損する問題 None Time's up