【IT未経験】G検定の一発合格を狙う最重要問題集！丁寧な解説付き（3）

問題を解く前に、試験の全体像や学習ロードマップを確認したい方は、こちらの記事を先にチェックしてみてください！

「AIの知識ゼロからG検定に受かる？」そんな不安を解決！文系・IT未経験から最短で一発合格するためのスケジュールと勉強法をまとめました。効率的なテキストの使い方から、当日の時間配分のコツまで合格に必要なノウハウを凝縮。

第11問

ディープラーニングモデルの軽量化・高速化技術の一つであり、学習済みのモデルから、予測精度への影響が少ない（値がゼロに近いなど重要度の低い）ニューラルネットワークの結合（ウェイト）を削除することで、モデルのサイズを削減する手法として、最も適切なものはどれか。

A. 蒸留（Distillation）
B. 量子化（Quantization）
C. プルーニング（枝刈り）
D. アップサンプリング
E. ファインチューニング

正解： C

解説：

A：不適切。 蒸留は、巨大で高精度なモデル（教師モデル）の知識を、より小さなモデル（生徒モデル）に継承させて軽量化する手法であり、結合を直接「削除」する技術ではありません。
B：不適切。 量子化は、重みパラメータの数値の精度（例：32bit浮動小数点から8bit整数へ変換）を落とすことでメモリを削減する手法であり、結合そのものを削除するわけではありません。
C：適切。 プルーニング（Pruning）は日本語で「枝刈り」を意味し、不要なネットワークの繋がりを物理的にカットしてモデルをスリムにする技術です。計算量とメモリを削減できるため、スマホなどのエッジデバイスへの実装で非常に重視されます。
D：不適切。 アップサンプリングは、画像の解像度を上げたり、データのサンプリング数を増やしたりする処理のことで、モデルの軽量化技術ではありません。
E：不適切。 ファインチューニングは、学習済みモデルの一部を特定のタスク向けに再学習させて微調整する手法であり、モデルのサイズを削減する目的の手法ではありません。

第12問

機械学習やディープラーニングにおける「アンサンブル学習（複数のモデルを組み合わせて予測精度を向上させる手法）」の代表的なアプローチ、およびモデルの組み合わせ手法に該当するものを、次の選択肢の中から【3つ】選べ。

A. バギング（Bagging）
B. ブースティング（Boosting）
C. スタッキング（Stacking）
D. バックプロパゲーション（誤差逆伝播法）
E. 正則化（Regularization）

正解： A, B, C

解説：

A：適切。 複数の独立したモデルを並列に学習させ、多数決や平均をとるアンサンブル手法です（例：ランダムフォレスト）。
B：適切。 前のモデルの予測ミスを、次のモデルが重点的に学習するプロセスを直列に繰り返して強化していくアンサンブル手法です（例：LightGBM）。
C：適切。 複数の異なるモデルの予測結果を、さらに別のモデル（メタモデル）の入力として学習・予測させる高度なアンサンブル手法です。
D：不適切。 バックプロパゲーションは、ニューラルネットワークの重みを更新（学習）させるための勾配計算アルゴリズムであり、複数のモデルを組み合わせる手法ではありません。
E：不適切。 正則化は、過学習を防ぐために損失関数にペナルティ項を加えるアプローチであり、モデルをアンサンブルさせる技術ではありません。

第13問

時系列データを扱うRNN（再帰型ニューラルネットワーク）の学習において、時間の経過（過去への遡り）とともに勾配が爆発的に大きくなる、または消失してしまう問題を回避するために、時間軸を一定の長さに区切って（制限して）誤差逆伝播を行う手法はどれか。

A. BPTT（Backpropagation Through Time）
B. Truncated BPTT
C. スキップコネクション
D. ストライディング

正解： B

解説：

A：不適切。 BPTTは、RNNにおいて時間軸を過去に遡って誤差を伝える基本的なアルゴリズムですが、過去に遡りすぎると勾配消失・爆発が起きる原因になります。
B：適切。 Truncated BPTTは、長すぎる過去への遡りを一定のステップ数で「切り捨てる（Truncate）」ことで、計算量を抑えつつ勾配の問題を回避する現実的な手法です。
C：不適切。 スキップコネクションは、ResNetなどで層をまたいで入力を後ろの層へ直接足し合わせることで勾配消失を防ぐ、画像認識系によく使われる技術です。
D：不適切。 ストライディング（ストライド）は、CNNの畳み込み処理においてフィルターを何ピクセルずつ動かすかという移動幅のことです。

第14問

製造業や医療、自動運転などの分野で注目されている「異常検知（アノマリー検知）」タスクにおいて、正常データのみを学習させて「正常とは異なるパターン（外れ値）」を検出するために用いられる、教師なし（または半教師あり）学習の手法を、次の選択肢の中から【2つ】選べ。

A. One-Class SVM（ワンクラス・サポートベクターマシン）
B. オートエンコーダー（自己符号化器）
C. ロジスティック回帰
D. 決定木（デシジョンツリー）
E. 線形回帰

正解： A, B

解説：

A：適切。 正常データのみの境界線を学習し、その外側を異常として検知する代表的な手法です。
B：適切。 正常データの特徴（復元パターン）を学習させ、異常データが入力された際の「復元誤差の大きさ」を利用して異常を検知する手法です。
C：不適切。 ロジスティック回帰は、正常・異常（陽性・陰性）のラベルが最初から揃っていることを前提とした「教師あり学習」の2クラス分類手法であり、正常データのみから学習することはできません。
D：不適切。 決定木も、データを条件分岐で分類する「教師あり学習」の手法です。異常ラベルがない状態での異常検知には適していません。
E：不適切。 線形回帰は、数値データを直線（または超平面）で予測する「教師あり学習」の回帰手法であり、未知のパターンを弾く異常検知タスクとは目的が異なります。

第15問

生成AIの技術において、モデル（LLMなど）の内部パラメーターを直接再学習（ファインチューニングなど）させることなく、外部の信頼できるデータベースや検索エンジンから最新・正確な情報をリアルタイムに取得し、それをプロンプトに組み込んで回答を生成させる仕組み（検索拡張生成）の略称はどれか。

A. RAG
B. RLHF
C. MLOps
D. API

正解： A

解説：

A：適切。 RAG（Retrieval-Augmented Generation）は、外部の知識ソースから情報を「検索（Retrieval）」し、その情報を付加してLLMに「生成（Generation）」させることで、ハルシネーション（嘘の出力）を大幅に減らす最新の重要技術です。
B：不適切。 RLHF（人間のフィードバックからの強化学習）は、人間の評価を基にAIモデルの出力の安全性や適切さをチューニングする「学習手法」であり、外部知識をリアルタイムに検索する仕組みではありません。
C：不適切。 MLOpsは、機械学習モデルの構築・実装から運用、管理のプロセスを効率的に回すための「開発文化や仕組み」のことであり、特定の生成AI技術を指す言葉ではありません。
D：不適切。 API（アプリケーション・プログラミング・インターフェース）は、ソフトウェアやプログラム同士が機能を共有し連携するための「窓口・仕様」の総称であり、検索拡張生成そのものを指す略称ではありません。

上記問題を解いてみて、手応えはいかがでしたか？「意外と解ける」と思った方もいれば、「もう少し複雑な問題が出たら不安……」と感じた方もいるかもしれません。

実際の試験では、膨大な問題数を制限時間内に処理する「圧倒的なスピード感」や、初見では高確率で迷う「ひっかけパターン」への対策が求められます。本番で焦らないためには、事前にどれだけ多くの問題パターンに触れておくかが合否の分かれ道です。

そこで、IT未経験から独学で一発合格を果たした私が、試験勉強の過程で徹底的に傾向を分析し、自作した「G検定厳選100問・徹底攻略問題集（完全版）」を用意しました。