AI・ディープラーニング用語集
G検定に頻出する重要用語をわかりやすく解説します
該当する用語が見つかりません
AI基礎
- 人工知能(AI)Artificial Intelligence
- 人間の知的活動(学習、推論、判断など)をコンピュータで実現する技術の総称。「強いAI」(汎用人工知能)と「弱いAI」(特化型人工知能)に分類される。現在実用化されているのは主に弱いAI。 頻出
- チューリングテストTuring Test
- アラン・チューリングが1950年に提案した、機械が知的かどうかを判定するテスト。人間の審査員がテキストベースで会話し、相手が人間か機械かを判別できなければ、その機械は知的であるとみなす。 頻出
- シンギュラリティ(技術的特異点)Singularity
- AIが人間の知能を超え、自己改善を繰り返すことで爆発的に進化する転換点のこと。レイ・カーツワイルは2045年頃に到来すると予測している。
- エキスパートシステムExpert System
- 専門家の知識をルールベースで記述し、推論エンジンで判断を行うシステム。第二次AIブーム(1980年代)の中心的技術。知識獲得のボトルネックが課題となった。
- フレーム問題Frame Problem
- AIが行動を起こす際に、関係のある事柄だけを取り出して判断することが困難であるという問題。現実世界の無数の情報の中から、必要な情報だけを効率よく選択することが難しい。
- シンボルグラウンディング問題Symbol Grounding Problem
- 記号(シンボル)とその意味を結びつけることが困難であるという問題。コンピュータは文字列「りんご」を処理できるが、実際のりんごの概念を理解しているわけではない。
- 中国語の部屋Chinese Room
- ジョン・サールが提唱した思考実験。中国語のマニュアルに従って正しく返答できても、中国語を「理解」しているとは言えないという議論。強いAIの実現可能性に対する反論。
機械学習
- 機械学習Machine Learning
- データからパターンやルールを自動的に学習するアルゴリズムの総称。教師あり学習、教師なし学習、強化学習の3つに大別される。 頻出
- 教師あり学習Supervised Learning
- 入力データと正解ラベル(教師データ)のペアを用いてモデルを学習する手法。分類(カテゴリを予測)と回帰(数値を予測)の2種類がある。 頻出
- 教師なし学習Unsupervised Learning
- 正解ラベルなしでデータの構造やパターンを発見する手法。クラスタリング(データのグループ分け)や次元削減(データの圧縮)などがある。 頻出
- 強化学習Reinforcement Learning
- エージェントが環境と相互作用しながら、報酬を最大化する行動方針(方策)を学習する手法。AlphaGoやロボット制御などに応用されている。 頻出
- 過学習(オーバーフィッティング)Overfitting
- 訓練データに対して過度に適合し、未知のデータに対する汎化性能が低下する現象。データの増加、正則化、ドロップアウトなどで対策する。 頻出
- 交差検証Cross Validation
- データを複数のグループに分割し、一部を訓練データ、残りをテストデータとして繰り返し評価する手法。モデルの汎化性能をより正確に評価できる。k分割交差検証が代表的。
- 決定木Decision Tree
- 条件分岐を木構造で表現し、データを分類・予測するモデル。結果の解釈がしやすいのが利点。ランダムフォレストや勾配ブースティングの基礎となる。
- ランダムフォレストRandom Forest
- 複数の決定木を組み合わせたアンサンブル学習手法。各決定木がランダムにサンプリングしたデータと特徴量で学習し、多数決で最終予測を行う。過学習に強い。
- サポートベクターマシン(SVM)Support Vector Machine
- データを分離する最適な境界(超平面)を見つけるアルゴリズム。マージン最大化により高い汎化性能を持つ。カーネルトリックにより非線形分類にも対応。
- アンサンブル学習Ensemble Learning
- 複数のモデルを組み合わせて予測精度を向上させる手法の総称。バギング(ランダムフォレスト)、ブースティング(XGBoost、LightGBM)、スタッキングなどがある。
深層学習(ディープラーニング)
- ディープラーニング(深層学習)Deep Learning
- 多層のニューラルネットワークを用いた機械学習手法。特徴量の設計を人間が行う必要がなく、データから自動的に特徴を学習できる。画像認識、自然言語処理などで革新的な成果を上げている。 頻出
- ニューラルネットワークNeural Network
- 人間の脳の神経回路を模倣した数理モデル。入力層、隠れ層(中間層)、出力層から構成される。各層のニューロン(ノード)が重み付きの結合で接続されている。 頻出
- CNN(畳み込みニューラルネットワーク)Convolutional Neural Network
- 画像認識に特化したニューラルネットワーク。畳み込み層でフィルターを適用して特徴を抽出し、プーリング層でデータを圧縮する。VGG、ResNet、Inceptionなどが代表的。 頻出
- RNN(再帰型ニューラルネットワーク)Recurrent Neural Network
- 時系列データや自然言語のような順序のあるデータを処理するためのネットワーク。過去の情報を内部状態として保持する。長期の依存関係を学習するのが困難(勾配消失問題)。 頻出
- LSTMLong Short-Term Memory
- RNNの勾配消失問題を解決するために開発されたアーキテクチャ。ゲート機構(入力ゲート、忘却ゲート、出力ゲート)により、長期的な情報の保持と忘却を制御する。 頻出
- GAN(敵対的生成ネットワーク)Generative Adversarial Network
- 生成器(Generator)と識別器(Discriminator)の2つのネットワークを競わせて学習する手法。リアルな画像生成やデータ拡張に応用。イアン・グッドフェローが2014年に提案。 頻出
- Transformerトランスフォーマー
- 自己注意機構(Self-Attention)に基づくアーキテクチャ。RNNと異なり並列処理が可能で、長い系列も効率よく扱える。BERT、GPTなどの大規模言語モデルの基盤技術。 頻出
- 活性化関数Activation Function
- ニューラルネットワークの各ニューロンで、入力の総和を非線形に変換する関数。ReLU(ランプ関数)、Sigmoid、tanh、Softmaxなどがある。ReLUが最も広く使われている。
- 勾配降下法Gradient Descent
- 損失関数の勾配(微分)を計算し、パラメータを少しずつ更新して最適解を探索するアルゴリズム。確率的勾配降下法(SGD)、Adam、RMSpropなどのバリエーションがある。
- 誤差逆伝播法Backpropagation
- ニューラルネットワークの学習において、出力層から入力層に向かって誤差を伝播し、各層の重みを更新する手法。連鎖律(チェインルール)を利用して効率的に勾配を計算する。
- ドロップアウトDropout
- 学習時にニューロンをランダムに無効化(ドロップ)する正則化手法。過学習を防ぎ、モデルの汎化性能を向上させる。テスト時には全ニューロンを使用する。
- 転移学習Transfer Learning
- あるタスクで学習済みのモデルの知識を、別のタスクに応用する手法。大量のデータで事前学習したモデルを、少量のデータでファインチューニングすることで、効率よく高精度なモデルを構築できる。 頻出
- オートエンコーダAutoencoder
- 入力データを圧縮(エンコード)し、復元(デコード)するネットワーク。次元削減、ノイズ除去、異常検知などに応用。変分オートエンコーダ(VAE)は生成モデルとしても使われる。
数学・統計
- 正則化Regularization
- モデルの複雑さにペナルティを課して過学習を防ぐ手法。L1正則化(Lasso)はスパースな解を得られ、L2正則化(Ridge)は重みを小さくする。
- 損失関数Loss Function
- モデルの予測と正解の差(誤差)を数値化する関数。回帰には平均二乗誤差(MSE)、分類にはクロスエントロピー誤差が一般的に使われる。
- 精度・適合率・再現率・F値
- 分類モデルの評価指標。精度(Accuracy)は全体の正解率。適合率(Precision)は陽性予測の正確さ。再現率(Recall)は実際の陽性をどれだけ検出できたか。F値はPrecisionとRecallの調和平均。 頻出
- 次元の呪いCurse of Dimensionality
- 特徴量の次元が増えると、データが高次元空間で疎になり、機械学習アルゴリズムの性能が低下する現象。次元削減やFeature Selectionで対処する。
- 主成分分析(PCA)Principal Component Analysis
- データの分散が最大になる方向(主成分)を見つけて、高次元データを低次元に射影する次元削減手法。教師なし学習の代表的手法の一つ。
AI倫理・法律
- 説明可能なAI(XAI)Explainable AI
- AIの判断根拠を人間が理解・説明できるようにする技術。ブラックボックス化しがちなディープラーニングの意思決定プロセスを透明化する取り組み。LIME、SHAPなどの手法がある。 頻出
- AIバイアスBias / Fairness
- 学習データに含まれる偏りがAIの判断に反映される問題。性別、人種、年齢などに基づく不公平な結果を生む可能性がある。公平性を確保するための技術・ガイドラインの策定が進んでいる。 頻出
- 個人情報保護とAI
- AIが個人データを学習・利用する際の法的・倫理的課題。EUのGDPR、日本の個人情報保護法などが規制を定めている。プロファイリングの透明性、データの匿名化などが重要。
- AI原則・AIガバナンス
- AIの開発・利用における倫理的ガイドライン。日本の「人間中心のAI社会原則」やOECDの「AI原則」などがある。公平性、透明性、安全性、プライバシーの保護などが主な原則。 頻出
AI活用
- 自然言語処理(NLP)Natural Language Processing
- 人間が日常的に使う言語(自然言語)をコンピュータで処理する技術。機械翻訳、文書分類、感情分析、質問応答システムなどに応用。BERT、GPTなどの大規模言語モデルが革新をもたらした。 頻出
- 画像認識Computer Vision
- 画像や映像の内容をコンピュータが認識・理解する技術。物体検出、セグメンテーション、顔認証、医療画像診断などに応用。CNNの発展により精度が飛躍的に向上した。 頻出
- 自動運転Autonomous Driving
- AIを活用して車両を自動的に運転する技術。レベル0(運転支援なし)からレベル5(完全自動運転)まで6段階に分類される。画像認識、センサー融合、経路計画などの技術を統合して実現。
- 大規模言語モデル(LLM)Large Language Model
- 大量のテキストデータで事前学習された大規模なニューラルネットワーク。GPT、BERT、LLaMAなどが代表的。文章生成、翻訳、要約、プログラミング支援など幅広いタスクに対応。 頻出
- エッジAIEdge AI
- クラウドではなく端末(エッジデバイス)側でAI処理を行う技術。低遅延、プライバシー保護、通信コスト削減などのメリットがある。スマートフォン、IoT機器、自動運転車などで活用。