AIは「合格者レベル」になったのか ー試験をAIが解けたという事実を、正しく読む

第1部 何が起きたのか(一次情報のみ)
司法試験 短答式で合格点に到達した研究
2026年1月、慶應義塾大学の研究者による論文
Self-Verification is All You Need To Pass The Japanese Bar Examination
が公開された。
この研究は、日本の司法試験の短答式試験を対象に、大規模言語モデルを評価したものだ。
問題形式や採点ルールは変更せず、実際の試験と同じ条件で解かせた結果、2024年の司法試験短答式において、合格基準点93点を上回るスコアに到達したと報告している。
研究の特徴は、自己検証と呼ばれる仕組みを推論過程に組み込み、回答の矛盾や誤りを減らした点にある。
なお、この結果は司法試験全体への合格を意味するものではなく、あくまで短答式試験に限定された成果である。
参照
https://arxiv.org/pdf/2601.03144
https://ledge.ai/articles/llm_japanese_bar_exam_self_verification
共通テストで9科目が満点だった検証
2026年1月、AIベンチャー LifePrompt が、大学入学共通テスト2026年分を最新の大規模言語モデルに解かせた検証結果を公開した。
検証では、問題文をAIが扱いやすい形式に変換し、採点可能な形で解答を生成している。
その結果、15科目中9科目で満点を記録した。
満点だったと確認されている科目は以下の9科目である。
数学1A
数学2BC
公共 政治 経済
化学
物理基礎
化学基礎
地学基礎
生物基礎
情報1
一方で、国語の読解問題や、図形の視覚的把握を伴う設問では誤答も確認されている。
参照
https://note.com/lifeprompt/n/nb87edfb2e7ca
https://news.denfaminicogamer.jp/news/260120g
https://news.tv-asahi.co.jp/news_economy/articles/000480115.html
第2部 この事実は、人間にとって何を意味するのか
ここからは解釈の話になる。
問いはシンプルだ。
AIが解けるところは、人間としてこれから伸ばす価値が低い能力なのか。
AIが解けないところにこそ、人間の価値があるのか。
結論から言えば、この問いを二択で考えること自体が、現実を正確に捉えていない。
AIが解ける能力は、価値が低いのか
まず、AIが解ける能力が「価値が低い能力」になったわけではない。
司法試験短答式や共通テストでAIが高得点を取れたのは、
- ルールが明確
- 正解が一意に定まる
- 問題形式が安定している
こうした条件が揃っている領域だった。
これらの能力は、社会にとって今も必要だ。
法律、医療、会計、技術、安全管理。
どれも正確さと一貫性がなければ成立しない。
ただし、意味が変わった。
AIが同じことをできるようになったことで、
それだけをできる人の希少性が下がった
という変化が起きた。
これは、能力が不要になったのではなく、
単独では評価されにくくなった
という話である。
では、AIが解けないところだけが人間の価値なのか
これも正しくない。
AIが苦手な領域として、よく挙げられるのは、
- 曖昧な状況での判断
- 価値や倫理の選択
- 前提そのものを疑うこと
- 人間の感情や関係性の扱い
確かに、ここには人間の強みがある。
しかし、これらの能力には共通点がある。
- 評価が主観的
- 成果が安定しにくい
- 教えるのが難しい
- 責任の所在が曖昧になりやすい
つまり、
AIが解けないからといって、それだけで社会的価値が高くなるわけではない。
本当の分かれ目はどこにあるのか
分かれ目は、
AIが解けるか、解けないか
ではない。
分かれ目は、次の一点にある。
AIが解けることを使って、
より良い判断や結果に変換できるか。
試験合格の意味はどう変わったのか
これまで、試験合格はこう受け取られてきた。
合格している
つまり、その分野の能力がある。
しかし、AIが合格点を取れるようになった今、意味は変わる。
合格している
つまり、その分野のルールと基礎を理解している。
合格は、能力の最終証明ではなく、
共通のスタートライン
に近づいた。
人間に残された役割は何か
これから人間に強く求められるのは、次のような能力だ。
- AIの出力をそのまま信じず、疑う
- 前提条件を整理し、見落としを探す
- 複数の選択肢から選び、理由を説明する
- 判断の結果に責任を持つ
- 間違えたときに修正する
これらは、
- AIだけでは完結しない
- しかしAIなしでは現実的でない
人間とAIの境界にある能力だ。
結論
AIが試験を解けた、合格した。
それは、AIが人間と同じになったという意味ではない。
それは、
人間が「合格」だけで自分の価値を説明できなくなった
という意味だ。
これから問われるのは、
どれだけ正確に答えられるか
ではなく
その答えを使って、何を判断し、
何に責任を持つのか
その一点である。
参照情報一覧
https://arxiv.org/pdf/2601.03144
https://ledge.ai/articles/llm_japanese_bar_exam_self_verification
https://note.com/lifeprompt/n/nb87edfb2e7ca
https://news.denfaminicogamer.jp/news/260120g
https://news.tv-asahi.co.jp/news_economy/articles/000480115.html


