AIは数学の未解決問題を解いたのか――エルデシュ問題#728とGPT-5.2 Proの実力

はじめに:「未解決問題を解いた」の本当の意味

「AIが数学の未解決問題を解決」――このニュースを見たとき、多くの人が「ついにAIが人間の数学者を超えた」と受け止めたのではないでしょうか?私もそう感じました。

しかし、少し立ち止まって考えることにしました。
「未解決問題」と聞くと、誰もが何十年も挑戦して解けなかった超難問を想像しますが、実は違うことが分かりました!

数学の世界には「未解決だけど超難問というわけではない問題」がたくさん存在しているのです。

2026年初頭、GPT-5.2 ProとAristotle(形式証明支援AI)が協働して、エルデシュ問題#728の証明を完成させました。

これは確かに画期的な出来事です。しかし「AIが完全に独力で解決した」わけでも、「最難関の数学問題を突破した」わけでもありませんでした。

けれども報道はそこには触れずにセンセーショナルに伝えています。

本稿では、この一見、衝撃的なニュースを冷静に受け止め、何が実際に起きたのか、この成果の意義は何か、技術レベル、これらの正確な理解のために、できるだけ分かりやすく解説していきます。


1. そもそも「未解決問題」とは?

数学の未解決問題には、大きく分けて2つのタイプがあります。

タイプA:「世界中の天才が挑戦しても解けない」超難問

例:

  • リーマン予想(160年以上未解決)
  • ゴールドバッハ予想(280年以上未解決)
  • P vs NP問題(コンピュータ科学の最重要問題)

これらは何世代もの数学者が人生をかけて挑戦していますが、誰も解けていません。解ければノーベル賞級(数学にはフィールズ賞)の業績です。

タイプB:「解けそうだけど、誰も本気で取り組んでいない」問題

実は数学の世界には、こういう問題が数千個も存在します。その理由は:

  • 解いても大きなブレークスルーにはならない
  • 他にもっと重要な問題がある
  • 地道な計算や論理展開が必要で「面倒」
  • 単純に注目度が低くて忘れられている

今回AIが解いたエルデシュ問題#728は、このタイプBです。


分かりやすく登山に例えてみましょう。

  • タイプAの超難問 = エベレスト(標高8,849m)
    • 何度も挑戦されて、多くの登山家が命を落としている
    • 登頂成功は世界的ニュースになる
  • タイプBの未解決問題 = 標高6,000m級の未踏峰
    • 技術的には登れるレベル
    • でも場所が遠隔地で誰も行っていない
    • あるいは登っても特に名声が得られない
    • 「いつか誰かが登るだろう」と思われている

エルデシュ問題#728は後者です。
「未解決」だからといって、必ずしも「超難問」とは限らないのです。


2. エルデシュ問題って何?

ポール・エルデシュという変わった天才

エルデシュ問題を理解するには、まずその名の由来となったポール・エルデシュという数学者を知る必要があります。

ポール・エルデシュ(1913-1996):

  • ハンガリー出身の数学者
  • 生涯で1,500本以上の論文を発表(史上最多クラス)
  • 特定の大学に所属せず、スーツケース一つで世界中を旅して回った
  • 訪れた先の数学者と共同研究をする、という独特のスタイル

エルデシュのもう一つの特徴は、面白い問題を次々と考えて、他の数学者に「宿題」として出していったことです。

懸賞金付き問題リスト

エルデシュは自分が考えた問題に「懸賞金」をつけて公表しました:

  • 簡単な問題:25ドル
  • やや難しい問題:100〜500ドル
  • 非常に難しい問題:1,000ドル以上

この懸賞金は、問題の難易度の目安になっています。エルデシュ問題#728の懸賞金は250ドル程度とされており、これは「中堅レベル」の難易度を示しています。

問題の特徴

エルデシュ問題の面白いところは:

  1. 問題文はシンプル:高校生でも問題の意味は理解できることが多い
  2. でも解くのは難しい:シンプルな問いほど、実は深い
  3. 数百個も存在する:エルデシュは生涯で数百の問題を提起した
  4. 一部は解決済み、一部は未解決:難易度は様々

3. エルデシュ問題#728って何?

ここが一番難しかったので、できるだけ分かりやすく説明したいと思います。

階乗(かいじょう)

まず基本から。階乗(n!と書きます)とは、1からnまでの数を全部掛け合わせたものです。

例:

  • 5! = 1×2×3×4×5 = 120
  • 10! = 1×2×3×...×10 = 3,628,800

階乗は驚くほど速く大きくなります。100!なんて、数字を書くだけで158桁になります。

問題の核心

エルデシュ問題#728は、こんなことを問う問題です

大きな数の階乗(例:100!や1000!)を考えたとき、 それを別の整数で割った時の「割り切れやすさ」のパターンを、 対数という道具を使って分析すると、ある面白い規則性(ギャップ現象)が見えてくる。 それを数学的に証明せよ。

超ざっくり言うと:

階乗という巨大な数には、割り算に関する隠れたパターンがあります。エルデシュはそのパターンを予想しました。
「本当にそのパターンが成り立つことを、誰か証明してくれないか?」というのがこの問題です。

なぜ「中堅レベル」なのか

この問題は:

  • 新しい数学理論の発明は不要: 既存の数論の道具で解ける
  • ただし地道な論理展開が必要: 一歩一歩、慎重に証明を組み立てる必要がある
  • 計算が面倒: 多くの場合分けや計算チェックが必要

つまり、「天才的なひらめきは不要だが、根気と正確さが求められる」タイプの問題に分類されます。

だから専門家にとっては「解けない問題」ではなく、「時間をかければ解けそうだけど、他にやることがあって無理して手をつける必要がない問題」だったのです。


4. AIは何をしたのか―実際のプロセス(難しいので飛ばしてOK)

ステップ1:人間が問題を入力

まず、人間の研究者がエルデシュ問題#728を適切な形式でGPT-5.2 Proに入力しました。

ここで重要なのは、問題文の解釈です。エルデシュ問題はかなり曖昧な表現で書かれているので「具体的に何を証明すればいいのか」を明確にする必要があります。これは人間が行いました。
つまり、あいまいな表現を形式化するところは、まだ人間がやっていたということです。

ステップ2:GPT-5.2 Proが証明案を生成

GPT-5.2 Proは、この問題に対して:

  • どんなアプローチが使えそうか探る
  • 大きな課題を分解して、必要な「補題」(証明の途中で使う小さな定理)を提案する
  • 論理的な展開を考える
  • 自然言語と数式で証明の筋道を書く

これが従来のAIにはできなかった部分です。単なる知識の検索ではなく、論理的な推論を行っています。

ステップ3:Aristotleが形式証明に変換

次に、形式証明支援AI「Aristotle」が登場します。

形式証明???

普通の数学の証明は、人間が読んで理解するように書かれています。例:

「nが偶数なら、n²も偶数である。なぜなら、n=2kと書けるので、n²=4k²=2(2k²)となり、これは2で割り切れるからだ。」

これは人間には分かりやすいですが、コンピュータには曖昧です。

形式証明は、証明をコンピュータが理解できる形式(プログラミング言語のようなもの)で書いたものです。形式証明には重要な特徴があります:

コンピュータが論理的に正しいかを100%検証できる

つまり、形式証明として成立していれば、それは絶対に正しい証明ということが言えるそうです。

Aristotleは、GPT-5.2 Proが書いた証明を、この形式証明(Leanという言語)に変換しました。
AIが生成した証明の論理性(正しいかどうか)を厳密に検証するソフトということです。

ステップ4:検証と人間による調整

Lean形式に変換された証明は、コンピュータによって自動検証されます。もし論理的なミスがあれば、エラーが出ます。

そして最終的に、人間の研究者が:

  • 全体の構造を確認
  • 曖昧な部分を明確化
  • 公開可能な形に整える

という作業を行いました。

つまり

AIが完全に独力で解いたわけではありません。 人間とAIが協力して、初めて証明が完成しました。


5. 何がすごいのか?

AIが「論理的推論」をできることが示された

従来、AIは「パターン認識」や「知識の検索」は得意でしたが、「論理的な推論」は苦手とされていました。

しかし今回、GPT-5.2 Proは:

  • 問題を分析し
  • 適切なアプローチを選び
  • 段階的に論理を展開する

ということができました。これは大きな進歩です。

従来のAIの「数学的な出力」は、正しいかどうか人間が確認する必要がありました。「それっぽいけど、本当に正しいの?」という疑問が常につきまといました。

今回は、Lean形式の証明という、コンピュータが検証できる形で成果を出しました。これは「絶対に正しい」と保証できる成果です。

ちなみに、ここも大きな成果だと言えます。

この手法は、エルデシュ問題#728だけでなく、他の同レベルの問題にも応用できることが示されたのです。
実際、#397や#729なども「解決済み」として扱われ始めています。

つまり、AIは「中堅レベルの未解決問題を解く」というタスクにおいて、実用的なレベルに達したと言えます。


6. 現在の課題

1) 全く新しい数学的アイデアは生み出していない

今回AIが使ったのは、既に知られている数論の手法です。それらを適切に組み合わせて証明を構築しましたが、全く新しい概念や手法を発明したわけではありません。

数学における真の創造性とは:

  • 既知の手法の組み合わせ(今回AIがやったこと)
  • 全く新しい概念・手法の創出(AIはまだできていない)

例えば、アインシュタインが相対性理論を考えたとき、「時間と空間は別々ではなく、時空という一つのものだ」という全く新しい見方を生み出しました。こういう創造性は、AIはまだ持っていません。

2) 本当の難問にはまだ対応できない

エルデシュ問題#728は「中堅レベル」です。では、本当に難しい問題、例えば:

  • リーマン予想(160年以上未解決)
  • ゴールドバッハ予想(280年以上未解決)
  • コラッツ予想(小学生でも理解できるのに誰も解けない)

こういう問題は、既存の手法では解けません。全く新しいアイデアが必要です。AIがこのレベルに対応できるかは、まだ分かりません。

3) 人間の助けが絶対に必要

今回の証明プロセスを見ると、以下の段階で人間の判断が不可欠でした:

  • 問題文をどう解釈するか
  • どのアプローチが適切か
  • AIの出力が正しい方向に向かっているか
  • 最終的な証明を整える

つまり、「AIが勝手に問題を見つけて、勝手に解いた」わけではないのです。


7. 専門家の見解

肯定的な評価

「数学研究の強力なツールになる」

  • 地道な計算や論理チェックをAIに任せられる
  • 人間は大きなアイデアに集中できる
  • 証明の検証が自動化できる

「教育に役立つ」

  • 学生が証明を学ぶ際、AIが段階的にヒントを出せる
  • 形式証明を通じて、論理の厳密さを学べる
懐疑的な評価

「本当に『創造的』なのか?」

  • テレンス・タオ(現代最高の数学者の一人)も、「類似の方法は既存の文献にある」と指摘
  • AIは組み合わせが上手いだけで、真の創造性があるかは疑問

「難問への対応は別問題」

  • 中堅レベルを解けたからといって、超難問も解けるとは限らない
  • 本当の難問には、人間の直感が不可欠かもしれない

「過大評価に注意」

  • 「AIが数学者を超えた」という報道は誤解を招く
  • 現実には「AIが有用なツールになった」というレベル

8. 今後の数学界

AIと数学者の協働時代

今後予想されるのは、AIと人間が役割分担する時代です。

人間の役割:

  • 重要な問題を見つける
  • 大まかな証明の方向性を考える
  • AIの出力を評価・調整する
  • 証明の「美しさ」を追求する

AIの役割:

  • 膨大な文献を瞬時に参照する
  • 複雑な計算を高速に実行する
  • 証明を形式証明に変換する
  • 既存の証明の誤りを発見する

これは他の分野でも見られる構図です:

  • 創薬:AIが候補を提案→人間が判断
  • 囲碁:AIが新手を示す→人間が学ぶ
  • 芸術:AIが下絵を描く→人間が仕上げる

数学もこの流れに加わりつつあります。

短期的な展開(今後2〜3年)
  • 中堅レベルの未解決問題が次々と解決される
  • 教育現場でAI証明アシスタントが普及
  • 既存の証明の自動検証が進む

ここはほぼコンセンサスのとれた方向のようです。

長期的な可能性(10年後)
  • AIが難問に挑戦する能力を持つようになるか?
  • 全く新しい数学的概念をAIが生み出せるか?
  • 数学研究のプロセス自体が変わるか?

これらはまだ分かりません。評価も分かれているように感じます。


9. まとめ

センセーショナルな報道に惑わされない

はじめ私たちは「AIが未解決問題を解いた!」という見出しを見たとき、衝撃を受けました。

けれども、状況を俯瞰することで、

  • 人間の役割がまだ大きいこと

が分かりました。

AIは数学者を「置き換える」ものではなく、「強力に支援する」ツールであることが分かりました。

これは自動車が登場したとき、人間の足が不要になったわけではないのと同じです。むしろ人間の移動能力が拡大しました。

AIも同じように、人間の数学的思考能力を拡大するツールになるということなのでしょう。

つまり、今回の成果は、AIが数学研究の補助ツールとして大きく進化したことを示したのと同時に

AIの限界(今の技術レベル)も明確になりました。

「AIが人間を超えた」のではなく、「AIと人間が協力することで、新しい可能性が開けた」

――これが今回の成果の正しい理解です。

数学の世界でも、AIは敵ではなく、強力なパートナーになりつつあります。

その実力と限界を正確に理解することが、技術を最大限に活用する第一歩です。


記事参照情報一覧(URL)

本ドキュメントは、作成した3つの記事で参照した情報源のURLをまとめたものです。


1. 世界EV市場分析記事の参照URL

主要ニュースソース

  1. Global EV sales growth slowest since Feb 2024 on China plateau, US policy changes | Reuters
    https://www.reuters.com/sustainability/climate-energy/global-ev-sales-growth-slowest-since-feb-2024-china-plateau-us-policy-changes-2025-12-12/
  2. BNEFリポート:2025年のEV販売台数は過去最高を更新 | BloombergNEF
    https://about.bnef.com/insights/clean-transport/press-japanese-global-electric-vehicle-sales-set-for-record-breaking-year-even-as-us-market-slows-sharply-bloombergnef-finds/
  3. Tesla loses EV crown to China's BYD as competition, tax credit expiry hit demand | Reuters
    https://www.reuters.com/business/autos-transportation/teslas-quarterly-deliveries-fall-more-than-expected-lower-ev-demand-2026-01-02/
  4. China car sales may stagnate in 2026, strong EV export growth unlikely to last | Reuters
    https://www.reuters.com/business/autos-transportation/chinas-december-car-sales-post-biggest-fall-nearly-2-years-2026-01-09/
  5. Reuters グラフィック資料
    https://www.reuters.com/graphics/CHINA-AUTOS/gkplqkklbvb/chart.png

地域別市場データ

  1. 25年欧州EV販売、3割増加 | OANDA FX/CFD Lab-education
    https://www.oanda.jp/lab-education/market_news/kn_2026012701000889/
  2. 欧州自動車販売、12月7.6%増 EVが初めてガソリン車上回る | ロイター
    https://jp.reuters.com/markets/japan/6PIGLH33SZPKRLYDHNBAJZTJO4-2026-01-27/
  3. US auto sales defy regulatory uncertainty to rise 2% in 2025 | Reuters
    https://www.reuters.com/business/autos-transportation/us-auto-sales-defy-regulatory-uncertainty-rise-2-2025-2026-01-05/
  4. 日本国内における電気自動車販売シェア最新情報〖2025年12月〗| EVsmartブログ
    https://blog.evsmart.net/electric-vehicles/electric-vehicle-sales-in-japan/

企業動向

  1. トヨタの25年世界販売、6年連続の首位 北米好調で過去最高 | ロイター
    https://jp.reuters.com/markets/global-markets/FEHSFK77ONK3NMRZQVQSQ6OMDM-2026-01-29/
  2. China's BYD posts weakest sales growth in five years on headwinds at home | Reuters
    https://www.reuters.com/world/asia-pacific/byd-posts-weakest-sales-growth-five-years-headwinds-home-2026-01-01/

政策・規制

  1. Mercedes CEO says details of EU's relaxed EV targets could negate benefits | Reuters
    https://www.reuters.com/business/autos-transportation/mercedes-ceo-says-details-eus-relaxed-ev-targets-could-negate-benefits-2026-01-29/
  2. 2025年のEU乗用車市場、初めてハイブリッド車が最多に、EV需要全体も持ち直し(EU) | ジェトロ
    https://www.jetro.go.jp/biznews/2026/01/d277545dd1f57e2e.html
  3. Volvo and Polestar Warn EU Not to Delay the 2035 Combustion Engine Ban
    https://ev.com/news/volvo-and-polestar-warn-eu-not-to-delay-the-2035-combustion-engine-ban

2. バッテリー技術分析記事

バッテリー技術分析記事(全固体電池 vs ナトリウムイオン電池)については、提供された調査資料に具体的なURL情報が含まれていませんでした。

記事は以下の一般的な情報源に基づいて作成されています:

  • CATL(寧徳時代)公式発表:ナトリウムイオン電池の量産開始に関する情報
  • BloombergNEF:バッテリー市場分析レポート
  • 各自動車メーカー公式発表:トヨタ、日産、パナソニック等の全固体電池開発計画
  • 学術論文・技術レポート:バッテリー技術の比較分析

具体的なURL情報が必要な場合は、各企業・機関の公式サイトまたは報道発表資料をご参照ください。


3. AI数学証明記事

学術資料

arXiv プレプリント:GPT-5.2 ProとAristotleによるエルデシュ問題#728の形式証明文書

技術プラットフォーム

\ 最新情報をチェック /