AI

AIを触っているとよく聞く横文字を、自分なりに整理してみた【後編】

こんにちは!
フロントエンドエンジニアのあまんちゅです。

最近よく聞くようになったAIまわりの横文字を、「定義は分かっても、なぜ必要なのかが見えてこない」と感じたため、自分なりに整理してみるシリーズの後編です。

前編(LLM・Token・RAG・API)はこちら ↓

https://gmo-miyazaki-creators.com/ai/ai-words-part1/

後編では CLI・Prompt・MCP・Agent の4つを扱います。
前編よりも「AIをどう操作するか・どう動かすか」という話が中心になります。

CLI(Command Line Interface)── 「黒い画面」

CLIはCommand Line Interface、日本語にすると「コマンドラインインターフェース」の略です。

Claudeに聞いたらこう説明してくれました。

「テキストでコンピューターに命令を入力して操作するインターフェースです」

CLIという言葉だけ聞くとピンとこないかもしれませんが、いわゆる「黒い画面」、Macならターミナル、Windowsならコマンドプロンプトと呼ばれるもののことです。

私も普段の開発で使ってはいるのですが、「CLI」という呼び方とちゃんと結びついたのは、実はわりと最近でした。

なぜ、CLIを知っておく必要があるのか。

普段パソコンを使うとき、アイコンをクリックしたりボタンを押したりして操作しますよね。
これはGUI(グラフィカルユーザーインターフェース)と呼ばれる操作方法です。

CLIは、こうした画面上の操作ではなく、すべてをテキストで操作します。
たとえば「このファイルを移動して」という操作も、クリックではなく文字を打って実行します。

理由はいくつかありますが、大きいのは細かい指示を正確に伝えられるという点です。
ボタンやメニューで表現できる操作には限界がありますが、テキストなら細かい条件や手順を一行で指定できます。

最近のAIツール、たとえばClaude CodeやGitHub Copilot CLIのように、CLI上で使うことを前提にしたツールもあります。

CLIが選ばれる理由として、2つ考えられます。

  • 開発作業の現場がCLIにあるから:ファイル操作、git、ビルド、テストなど、開発のコマンドの多くはCLI上で実行されるので、AIも同じ場所にいた方が連携しやすい
  • AIがコマンドを直接実行できるから:CLI上ならAIが「テストを実行して結果を確認する」といった作業を自分で進められる

つまりCLIは、AIにとって「実際に作業する場所」として都合がいいのです。

CLIは、AIを「使いこなす」ための入口のひとつとも言えます。
次のPromptの話も、CLIで操作する場面を想像しながら読むと、より実感が持ちやすいと思います。

ちなみに、「黒い画面」と書いていますが、私は「白い画面」のターミナルを使っています😆

Prompt(プロンプト)── 「AIへの指示文」

「プロンプト」は、AIを使ったことがある人なら一度は聞いたことがあるのではないでしょうか。
「プロンプトが大事」「プロンプト次第で結果が変わる」など、AIの話題では必ずと言っていいほど出てくる言葉です。

Claudeに聞いたらこう説明してくれました。

「AIへの指示文のことです」

説明としてはシンプルですが、ただの文章とどう違うのか。
今でこそ「プロンプトが大事」というのは実感としてあるので、なぜそれほど重要なのかを整理してみます。

なぜ、Promptに工夫が必要なのか。

LLMは「次のTokenを予測し続ける」仕組みです(前編参照)。
つまり、入力されたテキストの続きを生成しようとします。

ここで重要なのが、LLMは入力されたものをそのまま「文脈」として受け取るという点です。

たとえばこう伝えるとします。

「この文章を要約して」

LLMはこれを受け取って、「要約して」という言葉の続きとして自然な返答を生成しようとします。
でも「どのくらいの長さで」「誰向けに」「どんな形式で」が伝わっていないと、期待と違う結果になることがあります。

一方でこう伝えると変わります。

「以下の文章を、エンジニア以外の人にも分かるように、3行以内で要約してください」

同じLLMでも、入力の仕方で出力の質が大きく変わります。
これが「プロンプトエンジニアリング」と呼ばれる技術の背景にある考え方です。

Promptは「ただの入力」ではなく、「LLMに対してどういう状況で・何を・どんな形で答えてほしいかを設計するもの」です。

たとえばPromptの中に「あなたはXXのプロです」「ステップごとに考えてから答えてください」といった指示を入れると、出力の方向性が安定しやすくなります。こうした工夫は今でも有効です。
一方で、最近のAIは賢くなってきたので、細かい指示がなくても、ある程度きちんと答えてくれることも増えています。
それでも、誰向けに・どんな形式で答えてほしいかを伝えると結果が安定しやすいので、伝え方を工夫する大切さは変わりません。

AIそのものを変えなくても、Promptの伝え方ひとつで出力が変わる、というのは面白いなと思いました。

「指示文」と聞くと、なんでもいいのかなと思いがちですよね。
でも同じAIでも、どう伝えるかで全然違う結果になるのが、使い込んでみて気づいたことでした。

MCP(Model Context Protocol)── 「共通規格」

MCPはModel Context Protocol、日本語にすると「モデルコンテキストプロトコル」の略です。
2024年末に登場し、2025年ごろから特に話題になり始めた、比較的新しい言葉です。

Claudeに聞いたらこう説明してくれました。

「AIとツールを接続するための規格です」

最近よく聞く言葉ですが、正直最初はよく分かっていませんでした。
「規格」と言われても、なんとなく何かをつなぐもの、というぼんやりしたイメージを持ったのが最初でした。

なぜ、MCPが必要なのか。

前編のAPIで「窓口」の話をしました。APIがあれば、サービスとサービスはつなげます。
では、AIが複数のサービスとつながろうとするとどうなるか。

SlackのAPIにつなぐコード、Google DriveのAPIにつなぐコード、NotionのAPIにつなぐコード……
それぞれ書き方が違うので、つながるサービスが増えるたびに新しい実装が必要になります。

人間でも、SlackやGoogle Drive、Notionをそれぞれ使いこなそうとすると、操作方法を一から覚えるのはなかなか大変ですよね。
AIにとっても同じで、サービスごとにつなぎ方がバラバラだと、その分だけ開発コストがかかっていきます。

そこで考え出されたのが、「AIとツールの接続方法を共通化しよう」というアプローチだそうです。
つまり「こういう形でやりとりする」と揃えておけば、AIがMCP対応のツールやデータと連携しやすくなります。

MCPはAIそのものを賢くする技術ではなく、
「AIが外のツールとスムーズに付き合えるようにするための共通語」のような仕組みです。

USB規格が「形さえ合えばどのデバイスでもつながる」を実現したように、
MCPは、接続方法を共通化することで、さまざまなツールと連携しやすくすることを目指したもの、というイメージです。

Agent(エージェント)── 「自律的なAI」

Agentは日本語では「エージェント」と呼ばれます。
「AI Agent」「AIエージェント」という形で使われることが多いです。

Claudeに聞いたらこう説明してくれました。

「自律的に行動するAIです」

これを読んで、映画に出てくる「自分の意思を持ったロボット」みたいなものを想像してしまい、ついにAIに乗っ取られる日が来るのでは……と、ちょっと怖い気持ちにもなりました。
でも実際はそういう話ではなかったので、最初に抱いたイメージとだいぶズレていました。

なぜ、Agentという考え方が出てきたのか。

エージェントがよく使われるようになる以前のAIの使い方は、基本的に「質問して、答えてもらう」という1往復でした。
「この文章を要約して」と送ったら、要約が返ってきます。それで終わりです。

でも現実の仕事は、1往復では終わりません。
「アンケート結果を分析して、グラフを作って、考察を書いて、最終的にレポートにまとめる」といった、複数のステップが連続する作業があります。

これを毎回人間が「次はこれをやって」と指示していたら、手間が変わりません。

そこで出てきた考え方が、「AIに目標だけ渡して、やり方は自分で判断させる」というものです。
「アンケート結果からレポートを作って」と伝えたら、AIが自分で「まず結果を分析しよう」「次はグラフにしよう」と考えながら進めていく。

これが、Agentの基本的なイメージです。

ここまで整理してきた用語が、実はAgentの中に全部登場します。

  • AIの中心にある頭脳が LLM
  • テキストを読み書きする単位が Token
  • 必要な情報を外から補うのが RAG
  • 外のサービスと接続するのが API
  • その接続を共通化するのが MCP
  • AIを操作する環境が CLI
  • 何を指示するかを設計するのが Prompt

こうした技術は、Agent的な仕組みを支える要素として組み合わされることがあります。

AIそのものが変わったわけではなく、使い方と組み合わせのパターンが変わった、というのが実態に近い気がします。

とはいえ、実際に使ってみると「勝手にどんどん動いてくれる」という感覚の方が強いです。仕組みとしては組み合わせの話でも、体感としてはやっぱり「自律的」と呼びたくなるな、というのが正直なところだと思いました。

まとめ

前編・後編を通じて整理した8つの用語です。

用語 正式名称 一言でいうと 本質のイメージ
LLM Large Language Model 次の言葉を予測する 予測できるようになるために、言語の構造を学び込んだ
Token AIが読む言葉の単位 文字でも単語でもない、AIが決めた独自の区切り方
RAG Retrieval-Augmented Generation 検索してから答える LLMの弱点を、外から情報を渡すことで補う仕組み
API Application Programming Interface 窓口 中身を隠しながら、決まった形でやりとりできる約束事
CLI Command Line Interface 黒い画面 テキストで細かく正確に指示を出せる操作環境
Prompt プロンプト AIへの指示文 同じAIでも、どう伝えるかで出力が変わる設計の話
MCP Model Context Protocol 共通規格 AIが外のツールと付き合いやすくするための共通語
Agent 自律的なAI 複数ステップを自分で判断して目標に向かって動く使い方

用語の定義を覚えることより、「なぜそれが必要になったのか」を理解する方が、話が頭に入ってきやすいと感じています。

Agentのまとめで書いたように、これらの用語はバラバラに存在しているわけではなく、実は全部つながっています。一つ理解すると次が入ってきやすくなるので、気になった用語から読み返してもらえると嬉しいです!

また気になる用語が出てきたら、その都度今回のように整理してみたいと思っています。

前編はこちら ↓

https://gmo-miyazaki-creators.com/ai/ai-words-part1/

この記事を気に入ったら

この記事を書いた人

あまんちゅ

あまんちゅ

2023年夏入社です。 海の上の橋を渡るのが好きです。

この人が書いた記事を見る >>