AIは数学の未解決問題を解いたのか――エルデシュ問題#728とGPT-5.2 Proの実力

はじめに:「未解決問題を解いた」の本当の意味
「AIが数学の未解決問題を解決」――このニュースを見たとき、多くの人が「ついにAIが人間の数学者を超えた」と受け止めたのではないでしょうか?私もそう感じました。
しかし、少し立ち止まって考えることにしました。
「未解決問題」と聞くと、誰もが何十年も挑戦して解けなかった超難問を想像しますが、実は違うことが分かりました!
数学の世界には「未解決だけど超難問というわけではない問題」がたくさん存在しているのです。
2026年初頭、GPT-5.2 ProとAristotle(形式証明支援AI)が協働して、エルデシュ問題#728の証明を完成させました。
これは確かに画期的な出来事です。しかし「AIが完全に独力で解決した」わけでも、「最難関の数学問題を突破した」わけでもありませんでした。
けれども報道はそこには触れずにセンセーショナルに伝えています。
本稿では、この一見、衝撃的なニュースを冷静に受け止め、何が実際に起きたのか、この成果の意義は何か、技術レベル、これらの正確な理解のために、できるだけ分かりやすく解説していきます。
1. そもそも「未解決問題」とは?
数学の未解決問題には、大きく分けて2つのタイプがあります。
タイプA:「世界中の天才が挑戦しても解けない」超難問
例:
- リーマン予想(160年以上未解決)
- ゴールドバッハ予想(280年以上未解決)
- P vs NP問題(コンピュータ科学の最重要問題)
これらは何世代もの数学者が人生をかけて挑戦していますが、誰も解けていません。解ければノーベル賞級(数学にはフィールズ賞)の業績です。
タイプB:「解けそうだけど、誰も本気で取り組んでいない」問題
実は数学の世界には、こういう問題が数千個も存在します。その理由は:
- 解いても大きなブレークスルーにはならない
- 他にもっと重要な問題がある
- 地道な計算や論理展開が必要で「面倒」
- 単純に注目度が低くて忘れられている
今回AIが解いたエルデシュ問題#728は、このタイプBです。
分かりやすく登山に例えてみましょう。
- タイプAの超難問 = エベレスト(標高8,849m)
- 何度も挑戦されて、多くの登山家が命を落としている
- 登頂成功は世界的ニュースになる
- タイプBの未解決問題 = 標高6,000m級の未踏峰
- 技術的には登れるレベル
- でも場所が遠隔地で誰も行っていない
- あるいは登っても特に名声が得られない
- 「いつか誰かが登るだろう」と思われている
エルデシュ問題#728は後者です。
「未解決」だからといって、必ずしも「超難問」とは限らないのです。
2. エルデシュ問題って何?
ポール・エルデシュという変わった天才
エルデシュ問題を理解するには、まずその名の由来となったポール・エルデシュという数学者を知る必要があります。
ポール・エルデシュ(1913-1996):
- ハンガリー出身の数学者
- 生涯で1,500本以上の論文を発表(史上最多クラス)
- 特定の大学に所属せず、スーツケース一つで世界中を旅して回った
- 訪れた先の数学者と共同研究をする、という独特のスタイル
エルデシュのもう一つの特徴は、面白い問題を次々と考えて、他の数学者に「宿題」として出していったことです。
懸賞金付き問題リスト
エルデシュは自分が考えた問題に「懸賞金」をつけて公表しました:
- 簡単な問題:25ドル
- やや難しい問題:100〜500ドル
- 非常に難しい問題:1,000ドル以上
この懸賞金は、問題の難易度の目安になっています。エルデシュ問題#728の懸賞金は250ドル程度とされており、これは「中堅レベル」の難易度を示しています。
問題の特徴
エルデシュ問題の面白いところは:
- 問題文はシンプル:高校生でも問題の意味は理解できることが多い
- でも解くのは難しい:シンプルな問いほど、実は深い
- 数百個も存在する:エルデシュは生涯で数百の問題を提起した
- 一部は解決済み、一部は未解決:難易度は様々
3. エルデシュ問題#728って何?
ここが一番難しかったので、できるだけ分かりやすく説明したいと思います。
階乗(かいじょう)
まず基本から。階乗(n!と書きます)とは、1からnまでの数を全部掛け合わせたものです。
例:
- 5! = 1×2×3×4×5 = 120
- 10! = 1×2×3×...×10 = 3,628,800
階乗は驚くほど速く大きくなります。100!なんて、数字を書くだけで158桁になります。
問題の核心
エルデシュ問題#728は、こんなことを問う問題です
大きな数の階乗(例:100!や1000!)を考えたとき、 それを別の整数で割った時の「割り切れやすさ」のパターンを、 対数という道具を使って分析すると、ある面白い規則性(ギャップ現象)が見えてくる。 それを数学的に証明せよ。
超ざっくり言うと:
階乗という巨大な数には、割り算に関する隠れたパターンがあります。エルデシュはそのパターンを予想しました。
「本当にそのパターンが成り立つことを、誰か証明してくれないか?」というのがこの問題です。
なぜ「中堅レベル」なのか
この問題は:
- 新しい数学理論の発明は不要: 既存の数論の道具で解ける
- ただし地道な論理展開が必要: 一歩一歩、慎重に証明を組み立てる必要がある
- 計算が面倒: 多くの場合分けや計算チェックが必要
つまり、「天才的なひらめきは不要だが、根気と正確さが求められる」タイプの問題に分類されます。
だから専門家にとっては「解けない問題」ではなく、「時間をかければ解けそうだけど、他にやることがあって無理して手をつける必要がない問題」だったのです。
4. AIは何をしたのか―実際のプロセス(難しいので飛ばしてOK)
ステップ1:人間が問題を入力
まず、人間の研究者がエルデシュ問題#728を適切な形式でGPT-5.2 Proに入力しました。
ここで重要なのは、問題文の解釈です。エルデシュ問題はかなり曖昧な表現で書かれているので「具体的に何を証明すればいいのか」を明確にする必要があります。これは人間が行いました。
つまり、あいまいな表現を形式化するところは、まだ人間がやっていたということです。
ステップ2:GPT-5.2 Proが証明案を生成
GPT-5.2 Proは、この問題に対して:
- どんなアプローチが使えそうか探る
- 大きな課題を分解して、必要な「補題」(証明の途中で使う小さな定理)を提案する
- 論理的な展開を考える
- 自然言語と数式で証明の筋道を書く
これが従来のAIにはできなかった部分です。単なる知識の検索ではなく、論理的な推論を行っています。
ステップ3:Aristotleが形式証明に変換
次に、形式証明支援AI「Aristotle」が登場します。
形式証明???
普通の数学の証明は、人間が読んで理解するように書かれています。例:
「nが偶数なら、n²も偶数である。なぜなら、n=2kと書けるので、n²=4k²=2(2k²)となり、これは2で割り切れるからだ。」
これは人間には分かりやすいですが、コンピュータには曖昧です。
形式証明は、証明をコンピュータが理解できる形式(プログラミング言語のようなもの)で書いたものです。形式証明には重要な特徴があります:
コンピュータが論理的に正しいかを100%検証できる
つまり、形式証明として成立していれば、それは絶対に正しい証明ということが言えるそうです。
Aristotleは、GPT-5.2 Proが書いた証明を、この形式証明(Leanという言語)に変換しました。
AIが生成した証明の論理性(正しいかどうか)を厳密に検証するソフトということです。
ステップ4:検証と人間による調整
Lean形式に変換された証明は、コンピュータによって自動検証されます。もし論理的なミスがあれば、エラーが出ます。
そして最終的に、人間の研究者が:
- 全体の構造を確認
- 曖昧な部分を明確化
- 公開可能な形に整える
という作業を行いました。
つまり
AIが完全に独力で解いたわけではありません。 人間とAIが協力して、初めて証明が完成しました。
5. 何がすごいのか?
AIが「論理的推論」をできることが示された
従来、AIは「パターン認識」や「知識の検索」は得意でしたが、「論理的な推論」は苦手とされていました。
しかし今回、GPT-5.2 Proは:
- 問題を分析し
- 適切なアプローチを選び
- 段階的に論理を展開する
ということができました。これは大きな進歩です。
従来のAIの「数学的な出力」は、正しいかどうか人間が確認する必要がありました。「それっぽいけど、本当に正しいの?」という疑問が常につきまといました。
今回は、Lean形式の証明という、コンピュータが検証できる形で成果を出しました。これは「絶対に正しい」と保証できる成果です。
ちなみに、ここも大きな成果だと言えます。
この手法は、エルデシュ問題#728だけでなく、他の同レベルの問題にも応用できることが示されたのです。
実際、#397や#729なども「解決済み」として扱われ始めています。
つまり、AIは「中堅レベルの未解決問題を解く」というタスクにおいて、実用的なレベルに達したと言えます。
6. 現在の課題
1) 全く新しい数学的アイデアは生み出していない
今回AIが使ったのは、既に知られている数論の手法です。それらを適切に組み合わせて証明を構築しましたが、全く新しい概念や手法を発明したわけではありません。
数学における真の創造性とは:
- 既知の手法の組み合わせ(今回AIがやったこと)
- 全く新しい概念・手法の創出(AIはまだできていない)
例えば、アインシュタインが相対性理論を考えたとき、「時間と空間は別々ではなく、時空という一つのものだ」という全く新しい見方を生み出しました。こういう創造性は、AIはまだ持っていません。
2) 本当の難問にはまだ対応できない
エルデシュ問題#728は「中堅レベル」です。では、本当に難しい問題、例えば:
- リーマン予想(160年以上未解決)
- ゴールドバッハ予想(280年以上未解決)
- コラッツ予想(小学生でも理解できるのに誰も解けない)
こういう問題は、既存の手法では解けません。全く新しいアイデアが必要です。AIがこのレベルに対応できるかは、まだ分かりません。
3) 人間の助けが絶対に必要
今回の証明プロセスを見ると、以下の段階で人間の判断が不可欠でした:
- 問題文をどう解釈するか
- どのアプローチが適切か
- AIの出力が正しい方向に向かっているか
- 最終的な証明を整える
つまり、「AIが勝手に問題を見つけて、勝手に解いた」わけではないのです。
7. 専門家の見解
肯定的な評価
「数学研究の強力なツールになる」
- 地道な計算や論理チェックをAIに任せられる
- 人間は大きなアイデアに集中できる
- 証明の検証が自動化できる
「教育に役立つ」
- 学生が証明を学ぶ際、AIが段階的にヒントを出せる
- 形式証明を通じて、論理の厳密さを学べる
懐疑的な評価
「本当に『創造的』なのか?」
- テレンス・タオ(現代最高の数学者の一人)も、「類似の方法は既存の文献にある」と指摘
- AIは組み合わせが上手いだけで、真の創造性があるかは疑問
「難問への対応は別問題」
- 中堅レベルを解けたからといって、超難問も解けるとは限らない
- 本当の難問には、人間の直感が不可欠かもしれない
「過大評価に注意」
- 「AIが数学者を超えた」という報道は誤解を招く
- 現実には「AIが有用なツールになった」というレベル
8. 今後の数学界
AIと数学者の協働時代
今後予想されるのは、AIと人間が役割分担する時代です。
人間の役割:
- 重要な問題を見つける
- 大まかな証明の方向性を考える
- AIの出力を評価・調整する
- 証明の「美しさ」を追求する
AIの役割:
- 膨大な文献を瞬時に参照する
- 複雑な計算を高速に実行する
- 証明を形式証明に変換する
- 既存の証明の誤りを発見する
これは他の分野でも見られる構図です:
- 創薬:AIが候補を提案→人間が判断
- 囲碁:AIが新手を示す→人間が学ぶ
- 芸術:AIが下絵を描く→人間が仕上げる
数学もこの流れに加わりつつあります。
短期的な展開(今後2〜3年)
- 中堅レベルの未解決問題が次々と解決される
- 教育現場でAI証明アシスタントが普及
- 既存の証明の自動検証が進む
ここはほぼコンセンサスのとれた方向のようです。
長期的な可能性(10年後)
- AIが難問に挑戦する能力を持つようになるか?
- 全く新しい数学的概念をAIが生み出せるか?
- 数学研究のプロセス自体が変わるか?
これらはまだ分かりません。評価も分かれているように感じます。
9. まとめ
センセーショナルな報道に惑わされない
はじめ私たちは「AIが未解決問題を解いた!」という見出しを見たとき、衝撃を受けました。
けれども、状況を俯瞰することで、
- 人間の役割がまだ大きいこと
が分かりました。
AIは数学者を「置き換える」ものではなく、「強力に支援する」ツールであることが分かりました。
これは自動車が登場したとき、人間の足が不要になったわけではないのと同じです。むしろ人間の移動能力が拡大しました。
AIも同じように、人間の数学的思考能力を拡大するツールになるということなのでしょう。
つまり、今回の成果は、AIが数学研究の補助ツールとして大きく進化したことを示したのと同時に
AIの限界(今の技術レベル)も明確になりました。
「AIが人間を超えた」のではなく、「AIと人間が協力することで、新しい可能性が開けた」
――これが今回の成果の正しい理解です。
数学の世界でも、AIは敵ではなく、強力なパートナーになりつつあります。
その実力と限界を正確に理解することが、技術を最大限に活用する第一歩です。
記事参照情報一覧(URL)
本ドキュメントは、作成した3つの記事で参照した情報源のURLをまとめたものです。
1. 世界EV市場分析記事の参照URL
主要ニュースソース
- Global EV sales growth slowest since Feb 2024 on China plateau, US policy changes | Reuters
https://www.reuters.com/sustainability/climate-energy/global-ev-sales-growth-slowest-since-feb-2024-china-plateau-us-policy-changes-2025-12-12/ - BNEFリポート:2025年のEV販売台数は過去最高を更新 | BloombergNEF
https://about.bnef.com/insights/clean-transport/press-japanese-global-electric-vehicle-sales-set-for-record-breaking-year-even-as-us-market-slows-sharply-bloombergnef-finds/ - Tesla loses EV crown to China's BYD as competition, tax credit expiry hit demand | Reuters
https://www.reuters.com/business/autos-transportation/teslas-quarterly-deliveries-fall-more-than-expected-lower-ev-demand-2026-01-02/ - China car sales may stagnate in 2026, strong EV export growth unlikely to last | Reuters
https://www.reuters.com/business/autos-transportation/chinas-december-car-sales-post-biggest-fall-nearly-2-years-2026-01-09/ - Reuters グラフィック資料
https://www.reuters.com/graphics/CHINA-AUTOS/gkplqkklbvb/chart.png
地域別市場データ
- 25年欧州EV販売、3割増加 | OANDA FX/CFD Lab-education
https://www.oanda.jp/lab-education/market_news/kn_2026012701000889/ - 欧州自動車販売、12月7.6%増 EVが初めてガソリン車上回る | ロイター
https://jp.reuters.com/markets/japan/6PIGLH33SZPKRLYDHNBAJZTJO4-2026-01-27/ - US auto sales defy regulatory uncertainty to rise 2% in 2025 | Reuters
https://www.reuters.com/business/autos-transportation/us-auto-sales-defy-regulatory-uncertainty-rise-2-2025-2026-01-05/ - 日本国内における電気自動車販売シェア最新情報〖2025年12月〗| EVsmartブログ
https://blog.evsmart.net/electric-vehicles/electric-vehicle-sales-in-japan/
企業動向
- トヨタの25年世界販売、6年連続の首位 北米好調で過去最高 | ロイター
https://jp.reuters.com/markets/global-markets/FEHSFK77ONK3NMRZQVQSQ6OMDM-2026-01-29/ - China's BYD posts weakest sales growth in five years on headwinds at home | Reuters
https://www.reuters.com/world/asia-pacific/byd-posts-weakest-sales-growth-five-years-headwinds-home-2026-01-01/
政策・規制
- Mercedes CEO says details of EU's relaxed EV targets could negate benefits | Reuters
https://www.reuters.com/business/autos-transportation/mercedes-ceo-says-details-eus-relaxed-ev-targets-could-negate-benefits-2026-01-29/ - 2025年のEU乗用車市場、初めてハイブリッド車が最多に、EV需要全体も持ち直し(EU) | ジェトロ
https://www.jetro.go.jp/biznews/2026/01/d277545dd1f57e2e.html - Volvo and Polestar Warn EU Not to Delay the 2035 Combustion Engine Ban
https://ev.com/news/volvo-and-polestar-warn-eu-not-to-delay-the-2035-combustion-engine-ban
2. バッテリー技術分析記事
バッテリー技術分析記事(全固体電池 vs ナトリウムイオン電池)については、提供された調査資料に具体的なURL情報が含まれていませんでした。
記事は以下の一般的な情報源に基づいて作成されています:
- CATL(寧徳時代)公式発表:ナトリウムイオン電池の量産開始に関する情報
- BloombergNEF:バッテリー市場分析レポート
- 各自動車メーカー公式発表:トヨタ、日産、パナソニック等の全固体電池開発計画
- 学術論文・技術レポート:バッテリー技術の比較分析
具体的なURL情報が必要な場合は、各企業・機関の公式サイトまたは報道発表資料をご参照ください。
3. AI数学証明記事
学術資料
arXiv プレプリント:GPT-5.2 ProとAristotleによるエルデシュ問題#728の形式証明文書
技術プラットフォーム
- arXiv.org:数学・物理学のプレプリントサーバー
https://arxiv.org/ - Lean Proof Assistant:形式証明システム
https://lean-lang.org/


