生成AIパスポート~模擬試験⑤~ 2024年12月9日2024年12月9日 ailearn 1. LLMの課題として最も適切なものを選びなさい。 学習に必要なデータ量が少ない。 単一のタスクにしか対応できない。 文脈を理解する能力が低い。 応答が必ずしも事実に基づかない場合がある。 None 2. AIのレベル別分類における「特化型AI(Narrow AI)」の特徴として正しいものはどれか。 あらゆる分野で汎用的に使用できる 特定のタスクに特化して設計されている 自律的に意思決定を行う 人間の知能を完全に再現する None 3. 転移学習が自然言語処理(NLP)で広く利用される理由として正しいものはどれか。 言語モデルが文法や単語の一般的な特徴を学習できるため 言語データが常に小規模であるため 出力層が全タスクに共通であるため 学習済みモデルを直接再利用することが禁止されていないため None 4. インターネット上の匿名性が犯罪行為に悪用されるリスクを軽減するために、最も効果的な対策はどれか。 インターネット利用者全員に実名登録を義務付ける すべてのユーザーが匿名での投稿を禁止される サービス提供者がコンテンツの監視と違法行為の報告を強化する 監視カメラをオンラインサービスと連携する None 5. 「LM(Language Model)」とは何ですか? 人間の言語を理解し、生成するAIモデル AIのトレーニングデータを生成するアルゴリズム ハードウェアを制御するためのAIモジュール AIシステムの物理構造設計の手法 None 6. Whisperを使用した音声認識プロジェクトで、認識精度が低下する可能性が高いケースとして最も適切なものはどれか。 高度な騒音除去が行われたクリアな音声環境 標準的なアクセントのスピーチを使用する場合 音声データが短時間で区切られている場合 トレーニングデータに含まれていない特定の方言が使用される場合 None 7. LLMが長文の文脈を処理する際、どのような技術的な制約が発生しやすいですか? 応答が短くなりすぎる。 計算負荷が高まり、メモリ制限に達する可能性がある。 短い文脈では動作しない。 文脈の最初の部分しか処理しない。 None 8. 以下のうち、LLMが活用される典型的な用途として正しいものを選びなさい。 画像分類 音声信号処理 物理データの解析 文章要約と質問応答 None 9. 転移学習で「特徴抽出(Feature Extraction)」が行われる主な理由として正しいものはどれか。 トレーニングデータのサイズを減らすため 事前に学習されたモデルの一般的な特徴を利用するため モデルの出力層を固定するため 学習速度を低下させるため None 10. 特化型AIが汎用型AIよりも広く採用されている理由として最も適切なものはどれか。 特化型AIは開発が容易でコストが低いため 汎用型AIの技術はすでに陳腐化しているため 特化型AIは常に汎用型AIより高性能であるため 汎用型AIはトレーニングに長い時間がかかるため None 11. 転移学習の成功に必要な「ソースドメイン」と「ターゲットドメイン」の関係性として適切なものはどれか。 完全に独立していることが理想である ソースドメインがターゲットドメインより複雑である必要がある ある程度の類似性が必要である ターゲットドメインがソースドメインを上回る性能を持つ必要がある None 12. 以下の文章に対して、LLMが最適な応答を生成するための工夫として正しいものを選びなさい。 「私は昨日ケーキを作りました。それから友達とそれを食べました。」 文脈を分割して個別に処理する。 文章全体の文脈を保持し、話題の流れに基づいて応答を生成する。 最初の文だけを処理して応答を生成する。 次の単語をランダムに選んで応答を生成する。 None 13. AIのレベル別分類で、「強いAI(Strong AI)」が目指すものとして正しいものはどれか。 特定のタスクにおいて人間を上回る能力を持つ 機械学習モデルを効率的に訓練すること 現実の物理システムを模倣すること 人間の知能や意識を再現すること None 14. 転移学習を利用している際に、モデルの「過学習」を防ぐために適切なアプローチとして正しいものはどれか。 学習率を極端に低く設定する トレーニングデータを増やさずに、より複雑なモデルを使用する すべての層を同時に再訓練する 最終層のみを再訓練し、低次層を凍結する None 15. LLMが偏った学習データを利用している場合、応答にどのような影響が出る可能性がありますか? 応答は完全に中立になる。 応答がすべて正確な情報になる。 学習データの偏りは応答に影響を与えない。 偏見や特定の視点が反映された応答を生成する可能性がある。 None 16. ディープフェイクが生成するコンテンツの法的規制が必要とされる主な理由はどれか。 技術の進化を阻害するため トレーニングコストを削減するため 社会的混乱やプライバシー侵害を防ぐため 個人が自由に利用できる技術にするため None 17. Whisperのデメリットとして最も適切なものはどれか。 高解像度画像生成には対応していない 音声認識モデルとして、騒音環境で精度が低下する場合がある 特定の言語に対する認識精度が低い場合がある 潜在空間の操作が不可能である None 18. LMが次に来る単語を予測する際に基づいているものは何ですか? 画像データのピクセル値 音声信号の周波数 AIエンジンのハードウェア性能 過去の文脈と単語の出現確率 None 19. フィッシング詐欺を防ぐための最善策はどれか。 すべてのメールに返信する メールアドレスを頻繁に変更する 公共Wi-Fiを利用する 不審なメール内のリンクや添付ファイルを開かない None 20. GANを基盤としたディープフェイク技術の改良点として考えられるアプローチとして正しいものはどれか。 モード崩壊を防ぐための正則化手法を導入する ジェネレータとディスクリミネータを廃止する 潜在空間を完全に削除する 時系列データを中心にトレーニングする None 21. ディープフェイクによって生成される動画の特徴として正しいものはどれか。 元の映像を完全に削除して生成される 人間が識別できないレベルでリアルに見える 必ず低解像度で生成される 特定の顔のみを使用することができない None 22. 転移学習を使用している場合、学習済みモデルの初期層(低次層)を再訓練することが適切な場面として正しいものはどれか。 新しいタスクが元のタスクと完全に異なる場合 新しいタスクのデータが少ない場合 新しいタスクが元のタスクと高度に類似している場合 モデルの計算コストを削減したい場合 None 23. LLMが学習するために主に使用されるデータは何ですか? 画像データ 音声データ 膨大な量のテキストデータ 物理シミュレーションデータ None 24. あるLMが次の文章を処理するとします。「私は朝パンを食べました。それから、牛乳を飲みました。」この文脈を考慮した場合、次に出力される可能性が最も高いのはどれですか? 「その後、私は公園を散歩しました。」 「次の日はパンケーキを作りました。」 「夕食はカレーでした。」 「牛乳は冷たくて美味しかったです。」 None 25. インターネットで個人情報を保護するために最も重要なことは何か。 同じパスワードを複数のサービスで使用する 不要な情報をネットに公開しない すべてのウェブサイトでクッキーを受け入れる 公共Wi-Fiを利用してパスワードを送信する None 26. 「強いAI(Strong AI)」が特化型AIと異なる点として正しいものはどれか。 強いAIは人間のように意識を持つ 強いAIは特定のタスクに特化して設計されている 強いAIは必ずしも人間を超える性能を持つ 強いAIは単純な問題を解決できない None 27. インターネット上で公開される情報が誤情報である可能性を検証する最適な方法として正しいものはどれか。 公的機関や信頼性の高い情報源と照らし合わせる SNSの拡散状況を確認する 情報の出所を気にせず、内容をそのまま利用する コメント欄の意見数を基準に信頼性を判断する None 28. 特化型AI(Narrow AI)が日常生活で使用されている例として最も適切なものはどれか。 自動運転車 医療診断システム 自然言語処理を用いたチャットボット 以上すべて None 29. LMはどのように動作しますか? 音声データを入力し、画像を出力する。 テキストデータを学習し、次に来る単語を確率的に予測する。 AIの物理的動作を制御する。 テキストデータを使わずに直接応答を生成する。 None 30. あるLMが、ニュース記事を学習データとして用いています。このデータに偏りがある場合、どのような影響が最も考えられますか? LMの応答は中立的なものだけになる。 偏った視点や意見を反映した応答を生成する可能性がある。 LMは必ず正確な情報を生成する。 偏りのあるデータはLMに影響を与えない。 None 31. LMの出力品質を向上させるために最も効果的な手法はどれですか? 学習データを増やし、多様性を確保する。 プロンプトを簡潔にするが、詳細な指示は与えない。 トレーニングデータセットを変更せずにモデルのサイズを減らす。 モデルのトレーニングを停止し、既存の状態を維持する。 None 32. トランスフォーマーを基盤としたLMが長文を処理する場合、どのような技術的工夫が最も効果的でしょうか? 長い文脈を一度に全て処理しようとする。 文脈を適切に分割し、それぞれの部分を順次処理する。 文脈の長さに関係なく処理するため、追加の工夫は不要。 長い文脈は無視し、短い部分のみを利用する。 None 33. インターネットでの適切なコミュニケーションとは何か。 他者を尊重し、攻撃的な言動を避けること すべての意見に賛同すること 匿名であれば自由に意見を述べること 感情的な表現を多用すること None 34. LLMが応答を生成する際に行う基本的なプロセスはどれですか? テキストデータを画像データに変換して処理する。 文脈に基づき次に来る単語を確率的に予測して生成する。 ランダムに単語を選んで文を構成する。 事前に固定されたテンプレートから回答を選択する。 None 35. LMの進化に最も影響を与えた技術として正しいものを選びなさい。 画像処理アルゴリズム トランスフォーマー(Transformer)アーキテクチャ 物理的制御システム 周波数分析ツール None 36. 転移学習の「凍結層(Frozen Layers)」の役割として正しいものはどれか。 モデル全体の計算負荷を増加させる 学習済みモデルの一部を固定し、新しいデータに対して再訓練しないようにする トレーニングデータを削減する モデルの汎化性能を低下させる None 37. 「弱いAI(Weak AI)」の特徴として正しいものはどれか。 人間のように自律的に考える能力を持つ 自然言語処理を完全に理解する 特定の目的に特化して設計されている 他のAIシステムを管理する能力を持つ None 38. LLMを運用する際の主な制約の1つとして正しいものを選びなさい。 データ量が少なくなると性能が向上する。 大規模な計算資源が必要であり、運用コストが高い。 専用のハードウェアが不要であるため制約が少ない。 モデルサイズが小さいため複雑なタスクには向かない。 None 39. LLMが基盤としている主要なアーキテクチャはどれですか? リカレントニューラルネットワーク(RNN) 畳み込みニューラルネットワーク(CNN) トランスフォーマー(Transformer) サポートベクターマシン(SVM) None 40. GPTが持つデメリットとして正しいものはどれか。 長文入力に対してコンテキストを保持し続けることが難しい 画像生成タスクに特化しているためテキスト生成が苦手 トレーニングデータが固定され、更新が不要 音声認識機能が搭載されていない None 41. 安全なパスワードを作成するための重要なポイントはどれか。 短いが覚えやすい単語を使用する 名前や誕生日を含める 大文字、小文字、数字、記号を組み合わせる すべてのアカウントで同じパスワードを使う None 42. ChatGPTが特定の業務(例:医療分野)に応用される際に考慮すべきデメリットとして正しいものはどれか。 トレーニングデータに基づく偏りが応答に影響を与える可能性がある テキスト生成速度が遅すぎて業務に適さない 画像や音声データを直接処理できない 文法的誤りを含む応答しか生成できない None 43. 特化型AI(Narrow AI)から汎用型AI(General AI)への進化を実現するために必要な技術的要件として最も適切なものはどれか。 訓練データ量を無制限に拡大する 異なるタスク間での知識共有を可能にするアーキテクチャの開発 モデルのサイズを極端に縮小する 特定のタスクでの性能向上を優先する None 44. 以下のうち、LMが活用される応用分野として適切なものを選びなさい。 自動翻訳 物理シミュレーション 画像認識 ロボット制御 None 45. LM(Language Model)の主要な構成要素として適切なものを選びなさい。 画像データとピクセル処理モデル 音声データと周波数分析モデル テキストデータと確率計算モデル 物理センサーと信号処理モデル None 46. SNS上での情報共有において注意すべき点はどれか。 すべてのフォロワーに自分の住所を公開する 知らない人からのメッセージには必ず返信する 投稿する前にプライバシー設定を確認する 位置情報を常に公開する None 47. DALL-EとStyleGANの生成プロセスの違いに関連する説明として正しいものはどれか。 DALL-Eは潜在空間を操作して画像を生成し、StyleGANはテキスト指示に基づいて画像を生成する DALL-Eはテキスト入力に基づいて画像を生成し、StyleGANは潜在空間を操作して画像を生成する DALL-EとStyleGANはどちらも動画生成を専門としている DALL-EはGANアーキテクチャを使用し、StyleGANはトランスフォーマーを基盤としている None 48. ディープフェイクが主に利用される分野として適切でないものはどれか。 映画やエンターテインメントでの特殊効果 教育や研究分野でのシミュレーション 偽情報の作成や詐欺行為 音声データのリアルタイム翻訳 None 49. インターネット上の著作権を守るために重要な行動はどれか。 他人の著作物を無断でコピーして使用する フリー素材のみを使用するが、著作者のクレジットは不要 すべての素材を自分で作成する 著作物を使用する際に権利者に許可を求める None 50. GPTの主なメリットとして最も適切なものはどれか。 テキスト生成における柔軟性と文脈理解能力が高い ノイズ耐性に優れている 動画生成に最適化されている 特定のトピックに限定されている None 51. LMの主な役割として最も適切なものを選びなさい。 AIのハードウェア設計を最適化すること 自然言語の理解と生成を行うこと AIのデータ収集プロセスを管理すること 機械学習アルゴリズムの改良を行うこと None 52. ChatGPTのデメリットとして正しいものはどれか。 応答が完全にランダムに生成される トレーニングデータ以降の最新情報に対応できない 音声認識機能が搭載されていない 動画生成能力が制限されている None 53. DALL-Eのメリットとして最も適切なものはどれか。 高解像度画像を生成する能力に優れている マルチモーダル処理で動画生成が可能 テキストの翻訳に特化している 音声認識と画像認識を同時に行う None 54. ディープフェイク技術の主な基盤となるアルゴリズムはどれか。 GAN(生成的敵対ネットワーク) Transformer RNN(リカレントニューラルネットワーク) CNN(畳み込みニューラルネットワーク) None 55. ディープフェイク動画を識別する際に、特定のディスクリミネータが検出しやすい特徴として適切なものはどれか。 動画の色調が均一である 背景が動かない場合が多い 動画内の音声と画像が完全に同期している 瞬きのパターンが非現実的である None 56. LLMの特徴として正しいものを選びなさい。 少量のデータで学習し、単一のタスクに特化する。 膨大なパラメータ数を持ち、多様なタスクに対応できる。 特定分野の専門知識だけを学習する。 データなしで動作するAIモデルである。 None 57. 各種生成AIの共通のデメリットとして最も適切なものはどれか。 トレーニングに必要なデータ量が膨大である 環境に優しい設計がされている タスクごとに専用のモデルを作成する必要がある 完全に教師なし学習である None 58. 汎用型AI(General AI)が特化型AIと比較して、医療分野において特に効果を発揮すると考えられる場面として適切なものはどれか。 画像診断や薬剤設計のような個別のタスクに特化した業務 トレーニングデータが限定的である新薬開発業務 医療データの収集と記録の効率化 異なる専門分野(例:内科と外科)間での知識を統合して診断を行う業務 None 59. 転移学習(Transfer Learning)の主な目的として正しいものはどれか。 モデルの計算速度を向上させる 学習済みモデルを活用して新しいタスクを効率よく学習する モデルのサイズを削減する モデルの複雑さを制限する None 60. 転移学習を行う際に「凍結層を増やす」ことの主なメリットとして正しいものはどれか。 モデル全体の再訓練が容易になる 計算コストを削減し、過学習のリスクを軽減できる 出力層のパフォーマンスを向上させる 新しいデータへの適応能力を最大化できる None Time's up