AI用語集

LLM・RAG・MCPなど、AIニュースを読む上で必須の用語をカテゴリ別に解説します。

基礎概念

AGI （エージーアイ）: Artificial General Intelligence（汎用人工知能）の略。特定タスクに特化した現在のAIとは異なり、人間と同等かそれ以上に多様な知的タスクをこなせるとされる仮想的なAI。達成時期については研究者間でも意見が分かれている。
LLM （エルエルエム）: Large Language Model（大規模言語モデル）の略。膨大なテキストデータで学習した大規模なAIモデルで、文章生成・質問応答・翻訳など幅広い言語タスクをこなす。GPT-4やClaudeなどが代表例。
幻覚（ハルシネーション）（かんかく（はるしねーしょん））: AIが事実と異なる内容を自信を持って生成してしまう現象。存在しない論文の引用や誤った統計など、もっともらしい嘘を生み出す問題として知られる。RAGや検索拡張によって軽減が試みられている。
コンテキストウィンドウ（こんてきすとういんどう）: LLMが一度に扱えるトークンの最大量。この範囲内のテキストしか「記憶」として参照できない。GPT-4oは128K、Claude 3.5 Sonnetは200Kトークンなど、モデルごとに上限が異なる。
トークン（とーくん）: LLMがテキストを処理する際の最小単位。単語・文字・句読点などをまとめた「かたまり」で、日本語では1〜2文字程度に相当することが多い。モデルの処理コストや文脈長はトークン数で計算される。
マルチモーダル（まるちもーだる）: テキストだけでなく画像・音声・動画など複数のデータ形式を統合的に扱えるAIの能力。GPT-4oやGemini 1.5などが代表的なマルチモーダルモデル。

技術手法

RLHF （アールエルエイチエフ）: Reinforcement Learning from Human Feedback（人間のフィードバックによる強化学習）の略。人間の評価者が回答の良し悪しを評価し、その結果でモデルを強化学習する手法。ChatGPTの開発でも用いられた。
埋め込み（エンベディング）（うめこみ（えんべでぃんぐ））: テキストや画像などのデータを数値ベクトルに変換する技術。意味的に近いものが近い位置にマッピングされ、RAGやセマンティック検索の基盤として使われる。
MCP （エムシーピー）: Model Context Protocol の略。Anthropicが策定したオープン標準で、AIモデルが外部ツール・データソース・APIと連携するための共通プロトコル。USBのように「一度対応すれば使い回せる」仕組みを目指す。
ファインチューニング（ふぁいんちゅーにんぐ）: 事前学習済みのモデルを特定の用途やドメインのデータで追加学習させること。プロンプトだけでは難しいスタイルや専門知識の定着が可能になるが、計算コストがかかる。
プロンプトエンジニアリング（ぷろんぷとえんじにありんぐ）: AIに対する指示（プロンプト）を工夫することで、出力の品質や精度を高める技術。Chain-of-Thought（CoT）、Few-shot prompting、ロールプレイなど多様な手法がある。
RAG （ラグ）: Retrieval-Augmented Generation（検索拡張生成）の略。外部のナレッジベースや文書を検索し、その結果をプロンプトに組み込んでLLMに回答させる手法。最新情報への対応やハルシネーション低減に有効。

モデル・アーキテクチャ

拡散モデル（かくさんもでる）: ノイズを段階的に除去することで画像などを生成するモデル。Stable DiffusionやDALL-E 3などの画像生成AIの多くが採用している。
Transformer （とらんすふぉーまー）: 2017年にGoogleが発表した深層学習アーキテクチャ。「Attention is All You Need」論文で提案され、現代のほぼすべてのLLMの基盤となっている。自己注意機構（Self-Attention）によって長距離の依存関係を効率的に学習できる。

応用・サービス

AIガバナンス（えーあいがばなんす）: AIの開発・利用に関するルールや倫理基準、規制の枠組み全般。EU AI Actをはじめ各国・地域で法整備が進んでおり、企業にもリスク管理体制の整備が求められている。
AIコーディングアシスタント（えーあいこーでぃんぐあしすたんと）: プログラミング作業を支援するAIツール。コードの自動補完・バグ修正・ドキュメント生成などを行う。GitHub Copilot、Cursor、Claude Codeなどが代表例。
エージェントAI （えーじぇんとえーあい）: 自律的に計画を立て、ツールや外部サービスを使いながら複数ステップにわたるタスクを実行できるAIシステム。人間が逐一指示しなくても、目標達成に向けて行動を連鎖させる。
ベクトルデータベース（べくとるでーたべーす）: エンベディング（数値ベクトル）を効率よく保存・検索するためのデータベース。RAGシステムの中核コンポーネントとして利用され、Pinecone・Weaviate・pgvectorなどが有名。