AIは「合格者レベル」になったのか　ー試験をAIが解けたという事実を、正しく読む

2026年1月22日 2026年1月21日

susumoooon

第1部　何が起きたのか（一次情報のみ）

司法試験短答式で合格点に到達した研究

2026年1月、慶應義塾大学の研究者による論文
Self-Verification is All You Need To Pass The Japanese Bar Examination
が公開された。

この研究は、日本の司法試験の短答式試験を対象に、大規模言語モデルを評価したものだ。
問題形式や採点ルールは変更せず、実際の試験と同じ条件で解かせた結果、2024年の司法試験短答式において、合格基準点93点を上回るスコアに到達したと報告している。

研究の特徴は、自己検証と呼ばれる仕組みを推論過程に組み込み、回答の矛盾や誤りを減らした点にある。
なお、この結果は司法試験全体への合格を意味するものではなく、あくまで短答式試験に限定された成果である。

参照
https://arxiv.org/pdf/2601.03144
https://ledge.ai/articles/llm_japanese_bar_exam_self_verification

共通テストで9科目が満点だった検証

2026年1月、AIベンチャー LifePrompt が、大学入学共通テスト2026年分を最新の大規模言語モデルに解かせた検証結果を公開した。

検証では、問題文をAIが扱いやすい形式に変換し、採点可能な形で解答を生成している。
その結果、15科目中9科目で満点を記録した。

満点だったと確認されている科目は以下の9科目である。

数学1A
数学2BC
公共政治経済
化学
物理基礎
化学基礎
地学基礎
生物基礎
情報1

一方で、国語の読解問題や、図形の視覚的把握を伴う設問では誤答も確認されている。

参照
https://note.com/lifeprompt/n/nb87edfb2e7ca
https://news.denfaminicogamer.jp/news/260120g
https://news.tv-asahi.co.jp/news_economy/articles/000480115.html

第2部　この事実は、人間にとって何を意味するのか

ここからは解釈の話になる。
問いはシンプルだ。

AIが解けるところは、人間としてこれから伸ばす価値が低い能力なのか。
AIが解けないところにこそ、人間の価値があるのか。

結論から言えば、この問いを二択で考えること自体が、現実を正確に捉えていない。

AIが解ける能力は、価値が低いのか

まず、AIが解ける能力が「価値が低い能力」になったわけではない。

司法試験短答式や共通テストでAIが高得点を取れたのは、

ルールが明確
正解が一意に定まる
問題形式が安定している

こうした条件が揃っている領域だった。

これらの能力は、社会にとって今も必要だ。
法律、医療、会計、技術、安全管理。
どれも正確さと一貫性がなければ成立しない。

ただし、意味が変わった。

AIが同じことをできるようになったことで、
それだけをできる人の希少性が下がった
という変化が起きた。

これは、能力が不要になったのではなく、
単独では評価されにくくなった
という話である。

では、AIが解けないところだけが人間の価値なのか

これも正しくない。

AIが苦手な領域として、よく挙げられるのは、

曖昧な状況での判断
価値や倫理の選択
前提そのものを疑うこと
人間の感情や関係性の扱い

確かに、ここには人間の強みがある。

しかし、これらの能力には共通点がある。

評価が主観的
成果が安定しにくい
教えるのが難しい
責任の所在が曖昧になりやすい

つまり、
AIが解けないからといって、それだけで社会的価値が高くなるわけではない。

本当の分かれ目はどこにあるのか

分かれ目は、
AIが解けるか、解けないか
ではない。

分かれ目は、次の一点にある。

AIが解けることを使って、
より良い判断や結果に変換できるか。

試験合格の意味はどう変わったのか

これまで、試験合格はこう受け取られてきた。

合格している
つまり、その分野の能力がある。

しかし、AIが合格点を取れるようになった今、意味は変わる。

合格している
つまり、その分野のルールと基礎を理解している。

合格は、能力の最終証明ではなく、
共通のスタートライン
に近づいた。

人間に残された役割は何か

これから人間に強く求められるのは、次のような能力だ。

AIの出力をそのまま信じず、疑う
前提条件を整理し、見落としを探す
複数の選択肢から選び、理由を説明する
判断の結果に責任を持つ
間違えたときに修正する

これらは、

AIだけでは完結しない
しかしAIなしでは現実的でない

人間とAIの境界にある能力だ。

結論

AIが試験を解けた、合格した。
それは、AIが人間と同じになったという意味ではない。

それは、
人間が「合格」だけで自分の価値を説明できなくなった
という意味だ。

これから問われるのは、

どれだけ正確に答えられるか
ではなく

その答えを使って、何を判断し、
何に責任を持つのか

その一点である。

参照情報一覧

https://arxiv.org/pdf/2601.03144
https://ledge.ai/articles/llm_japanese_bar_exam_self_verification
https://note.com/lifeprompt/n/nb87edfb2e7ca
https://news.denfaminicogamer.jp/news/260120g
https://news.tv-asahi.co.jp/news_economy/articles/000480115.html

＼最新情報をチェック／

カテゴリー: technology、人

AIは「合格者レベル」になったのか　ー試験をAIが解けたという事実を、正しく読む

第1部　何が起きたのか（一次情報のみ）

司法試験短答式で合格点に到達した研究

共通テストで9科目が満点だった検証

第2部　この事実は、人間にとって何を意味するのか

AIが解ける能力は、価値が低いのか

では、AIが解けないところだけが人間の価値なのか

本当の分かれ目はどこにあるのか

試験合格の意味はどう変わったのか

人間に残された役割は何か

結論

参照情報一覧

防衛と軍事テックはどこへ向かっているのか　ー世界の最新動向から見える七つの構造変化

AIを診療現場のOSにするという選択　ーアフリカが選んだ、世界で最もラディカルな医療AIの実装モデル

第1部 何が起きたのか（一次情報のみ）

司法試験 短答式で合格点に到達した研究

共通テストで9科目が満点だった検証

第2部 この事実は、人間にとって何を意味するのか

AIが解ける能力は、価値が低いのか

では、AIが解けないところだけが人間の価値なのか

本当の分かれ目はどこにあるのか

試験合格の意味はどう変わったのか

人間に残された役割は何か

結論

参照情報一覧

防衛と軍事テックはどこへ向かっているのか ー世界の最新動向から見える七つの構造変化

AIを診療現場のOSにするという選択 ーアフリカが選んだ、世界で最もラディカルな医療AIの実装モデル

第1部　何が起きたのか（一次情報のみ）

司法試験短答式で合格点に到達した研究

第2部　この事実は、人間にとって何を意味するのか

防衛と軍事テックはどこへ向かっているのか　ー世界の最新動向から見える七つの構造変化

AIを診療現場のOSにするという選択　ーアフリカが選んだ、世界で最もラディカルな医療AIの実装モデル