ヒューマノイドは誰のためにあるのか
目次
- はじめに 見えていない問いを立てること
- 第1章 ロボットが生活に入ってくる日
- 第2章 人型である必要はあるのか
- 第3章 すでに存在するロボットの現実
- 第4章 「何でもできる」という誤解
- 第5章 ロングテールと汎用ロボットの成立条件
- 第6章 AIにとっての「身体」という問題
- 第7章 ヒューマノイドという選択の意味
- 第8章 データとしての現実世界
- 第9章 データをめぐる競争構造
- 第10章 国家レベルでの競争構造
- 第11章 競争構造の中での位置取り
- 第12章 選択という問題の再定義
- 第13章 ヒューマノイドは何のためにあるのか
- おわりに 問いを持ち続けること
はじめに 見えていない問いを立てること
2023年のCES(コンシューマー・エレクトロニクス・ショー)会場。Teslaのブースに展示されていたのは車ではなく、二本足で立ち、人間そっくりの身体を持つロボット、Optimus(オプティマス)だった。人々はスマートフォンを掲げ、その動きを撮影し、驚嘆の声を上げていた。映像はSNSで瞬く間に拡散され、数千万回再生された。同年、Amazon、Boston Dynamics、Figure AI、Agility Roboticsといった企業が、相次いでヒューマノイドの試験導入や大型資金調達を発表した。
この光景をイメージしたとき、あなたはどう感じただろうか。「すごい」「未来が来た」「これで家事が楽になる」。おそらくそのような興奮が先に来たはずだ。だが少し立ち止まって考えてみると、奇妙な問いが浮かんでくる。
なぜ、このロボットは人の形をしているのだろうか。
工場の溶接ロボットは人の形をしていない。Amazonの倉庫を縦横に走り回るKivaロボットも、人には似ていない。床を掃除するルンバも、空を飛ぶドローンも、人型ではない。それなのに、なぜ「家庭や生活に入ってくるロボット」は、わざわざ人間の形をしていなければならないのか。そしてそもそも、私たちはそのようなロボットを本当に必要としているのか。
本書は、そんな問いから始まる。ロボット技術の解説書ではない。特定の企業や製品を評価するものでもない。この本が追うのは、もっと根本的な疑問だ。ヒューマノイドをめぐる「当然そうなる」という前提の中に、どれほどの「実は疑っていなかった仮定」が紛れ込んでいるのか。そして、その仮定が何によって支えられているのか。
ここからは、一つの問いから別の問いへと順番に進んでいく構成になっている。最初は「便利な未来」という身近なビジョンから出発し、徐々に、その背後にある技術的・経済的・地政学的な構造へと視点を広げていく。
重要なのは、各章で提示する論点が、先に進む論点の土台になっているという点だ。順序を飛ばして読むと、後半の議論が飛躍に見える可能性がある。実際には、丁寧に積み上げた土台の上に後半の結論が成立している。そのため、できれば第1章から順番に読み進めてほしい。
また、本書はヒューマノイドに「反対」する本ではない。技術への賛否よりも、その前提を問い直すことが目的だ。読み終えたとき、あなたがヒューマノイドに対してどのような立場を取るかは問わない。ただ、その立場が「よく考えた上での選択」であってほしいと思っている。
第1章 ロボットが生活に入ってくる日

「便利な未来」という共有ビジョン
2030年代には、家庭用ロボットが一般家庭に普及するという予測が複数の調査機関から出されている。Goldman Sachsのレポート(2023年)は、ヒューマノイドロボットの市場規模が2035年までに60億ドル規模に達すると試算した。Morgan Stanleyは同時期に380億ドルという、さらに大きな数字を提示している。
(出典:Goldman Sachs Global Investment Research, "Humanoid Robots: A Revolution in the Making" 2023年; Morgan Stanley Research, "Humanoid Robots: The Next Transformational Technology" 2023年)
Elon MuskはOptimus量産を念頭に「将来的には一台あたり2万ドルを切る価格で提供できる」と語り、Figureという新興企業はBMWとの工場試験導入を2024年3月に発表した。Agiliy Roboticsは同年、Amazonの物流倉庫への試験的な導入を始めた。日本でも、川崎重工やホンダが次世代型ヒューマノイドの開発を加速させている。
こうした文脈の中で、ある種の「共有ビジョン」が形成されつつある。それは「ロボットが家事を担い、人間は労働から解放され、日常の煩雑な作業から自由になる社会」というイメージだ。このビジョンは、テレビのニュース、ビジネス誌の表紙、SNSの話題を通じて、私たちの脳裏に少しずつ刻み込まれている。
そして多くの場合、このビジョンは疑われることなく受け入れられている。問題は、その「疑われなさ」にある。
技術革新と「楽になること」の歴史
振り返れば、技術は一貫して人間の負担を減らす方向に進んできた。1851年に登場したミシンは、衣類の製造を劇的に効率化した。1946年には電子レンジが家庭に入り込み、料理の時間を短縮した。1990年代のインターネット普及は、情報収集と意思決定の速度を桁違いに高めた。スマートフォンの普及は、移動中にすらあらゆる作業を可能にした。
この歴史を眺めると、「より楽になること=進歩」という等式が自明に見えてくる。ロボットによる家事の代替も、この延長線上にあるものとして理解されやすい。「技術的に可能なら、実現すべきだ」という暗黙の前提が、そこにはある。
けれどもここで、この感覚そのものは実は疑う必要があるのである。
洗濯機のパラドックス という言葉を聞いたことがある人もいるのではないだろうか。経済学者の Ruth Schwartz Cowan が、1983年の著書「More Work for Mother」の中で、驚くべき事実を提示した。洗濯機の普及後、女性が洗濯に費やす時間は減るどころか、増加したというのだ。なぜか。
洗濯機が登場する以前、衣類を洗うのは大変な労働だったため、着替える頻度は低かった。しかし洗濯機によって洗濯のコストが下がると、「毎日着替えるのが当然」という新たな社会規範が生まれた。さらに、洗濯物を業者に出す代わりに自宅で洗うようになり、むしろ家庭内の洗濯量は増えた。技術が負担を減らしたのではなく、技術が新たな規範を作り出し、別の形で負担を生み出したのだ。
(出典:Ruth Schwartz Cowan, "More Work for Mother: The Ironies of Household Technology from the Open Hearth to the Microwave," 1983年)
これは特異は事例ではない。自動車の普及は移動の自由をもたらしたが、同時に「遠くのスーパーや学校に車で行くことが普通」という前提も作った。その結果、徒歩や公共交通で行ける範囲での生活設計は難しくなり、自動車なしでは暮らせない郊外が生ま、移動にかかる時間は減らなかった。インターネットは情報収集を容易にしたが、同時に「常時接続が当然」というプレッシャーを生み、かえって休む時間を削った。
技術が生活の負担を純粋に減らすという前提は、歴史的に見て必ずしも成り立たない。技術は負担を変形させるのであって、消去するわけではない。この視点を持った上で、「ロボットが家事をしてくれる未来」を再考する必要がある。
「楽になること」は本当に望まれているのか?
これが本質的な問いである。
心理学者のミハイ・チクセントミハイは、代表作「フロー体験」(1990年)の中で興味深い現象を指摘している。人間は単に「楽なこと」よりも、「適度な難しさを伴う達成感のある活動」に、より深い満足を覚えるというのだ。このとき人は「フロー状態」と呼ばれる没入体験に入り、最も充実感を感じる。
(出典:Mihaly Csikszentmihalyi, "Flow: The Psychology of Optimal Experience," 1990年)
料理が面倒だと感じながらも、完成した料理を家族が喜んで食べるとき、その満足は「楽さ」から来ていない。庭の草むしりは苦労を伴うが、きれいになった庭を眺める喜びが確かにある。趣味の手作業、子育てに伴う煩雑な作業、さらには家事そのものが「生活の主体者である」という感覚を与えることは、心理学的に広く認められている。
これは「だから家事を自動化してはいけない」といっている訳ではない。問いたいのは、「すべての作業が削減されることが望ましい」という前提が、本当に普遍的に成立するのかということだ。人間は多様性の生き物である。ある人にとって家事は純粋な苦痛で、ぜひ自動化してほしいと感じるだろう。別の人にとって家事は生活の一部であり、それを奪われることへの抵抗感を持つかもしれない。
一方で、多くの人が共通にもつ感覚もある。
介護や重労働は例外なく大変だ。それを自動化することへの異論はないはず。確かにその通りだろう。介護の身体的負担は深刻で、介護者の健康被害や介護離職などは社会問題となっている。工場の危険作業、農業の重労働、炎天下での建設作業。これらは確かに、自動化への強い需要を持つ。
しかし、ここで注意が必要となる。
「特定の作業には強い自動化需要がある」だから「汎用的なヒューマノイドが必要だ」と直結するのか?
ここは、明らかに論理的に直結していない。
介護の重労働を支援するためのロボットは、必ずしも人型である必要はないかもしれないし、家事全般をこなす汎用ロボットである必要もない。
需要の存在と、特定の技術の正当性は別の問題だ。
この区別は重要なはずなのに、ほとんど議論がされずに、ヒューマノイド必要論に直結してしまっている現実がある。
これを念頭に、次の問いに進んでいく。
こうした未来像を語るとき、なぜか必ずヒューマノイドロボットが登場する。人型の身体を持ち、二足歩行し、両腕を器用に動かす存在。このイメージは非常に強力だ。なぜなら「人間がやっていることをそのままやれる」という直感的な理解を、見た瞬間に与えてくれるからだ。
確かにその直感は正しいのだろう。
だが、この「人型ロボット」の必然性はまだ証明されていない。
掃除のためなら床を這う円形のロボットで十分だ。実際、iRobotのRoombaは世界で4000万台以上販売されており、掃除という機能において爆発的に普及している。荷物の搬送なら、タイヤで走る台車型の機械が圧倒的に効率的だ。
それなのに、なぜわざわざ人間の形に似せる必要があるのか。
この問いが、本書の核心的な謎の一つだ。次章では、この「人型であること」を徹底的に疑ってみよう。
第2章 人型である必要はあるのか

形状と機能の大原則
工学の世界には、シンプルだが強力な原則がある。
「形は機能に従う」(Form follows function)という私も好きな考え方である。
この言葉は建築家のルイス・サリバンが19世紀末に定式化したが、その含意は工学全般に広く及ぶ。航空機の翼が曲線を描くのは、揚力を生み出すためだ。流線型の自動車は空気抵抗を減らすための形だ。カニの鋏は獲物を捕らえるための形だ。自然界も工学も、目的に対して形を最適化してきた。
この原則に照らすと、「ロボットは人の形をしている」という前提は、実は例外的だ。
産業用ロボットを見てほしい。ファナック(FANUC)やKUKAが製造する工場用ロボットは、人間の腕には似ていない。関節の数も、可動域も、力の入れ方も、人間の解剖学とは無関係に、特定の工程に合わせて最適化されている。溶接に使うロボットアームは、溶接のためだけに存在する。それ以外のことはできないし、する必要もない。ドローンは空を飛ぶために最適化されており、足はない。深海探査機は深海の水圧に耐える球形をしている。
なぜ人型なのか?
この問いに対して、一般的に提示されている理由は主に以下の2つであると言われている。
理由1:環境適合性
第一の理由は、環境適合性だ。私たちが暮らす空間は人間の身体に合わせて設計されている。ドアの取っ手の高さは床から100センチ前後、階段の段差は18センチ前後、コップの持ち手は人の手の大きさに合わせ、キーボードのキー配置は人間の指の動きに最適化されている。この環境をそのまま使おうとすれば、人型の身体が有利というわけだ。
この説明は一定の説得力を持つ。しかしよく考えると、重要な前提が隠れている。「既存の環境を変えない」という前提だ。
歴史を振り返ると、強力な技術が登場したとき、むしろ環境の方が変わってきた事例は多い。自動車が普及したとき、道路が整備された。車いすが社会に認知されたとき、バリアフリー設計が広まった。スマートフォンが普及したとき、多くの物理的なキーボードが画面上のボタンに変わった。工場にロボットが入ったとき、ラインのレイアウト自体が再設計された。
「不気味の谷(アンキャニーバレー)」という未解決の問題
つまり、「環境が人型に合わせて作られているから人型が必要」という論理は、「技術が環境に適応する」場合には成り立つが、「環境が技術に適応する」場合には成立しない。どちらが起きるかは、その技術の影響力と、環境変更のコストに依存する。人型ロボットが本当に強力なら、家のドアの高さや棚の配置が変わっていく可能性もある。したがってこの理由は、人型を選ぶ十分条件ではなく、一つの参考要因に過ぎない。
理由2:汎用性の確保
第二の理由は、汎用性だ。人間は一つの身体で、料理も掃除も修理も運搬もこなす。同じ構造を持つロボットなら、ソフトウェアを変えるだけで様々な作業に対応できるはずだという論理だ。
この議論も一見もっともらしい。だが、「人型の身体が多様な作業への対応を可能にする」という命題と、「人型が最も多様な作業に対応しやすい形だ」という命題は別物だ。前者は正しいかもしれないが、後者は検証が必要なのではないだろうか?(ここはあまり議論されない。。。。)
たとえば四本腕であれば、より多くの作業に同時対応できる可能性がある。あるいは、腰から下はホイールで移動し、腕だけ人型というハイブリッドの方が、特定の用途では合理的かもしれない。「人型」が汎用性の最大化になっているかどうかは、必ずしも自明ではない。
人型ロボットには、技術的な問題とは別に、心理的な問題が存在する。「不気味の谷」と呼ばれる現象だ。
ロボット工学者の森政弘が1970年に発表したこの概念によると、ロボットが人間に近づくほど好感度が上がるが、ある程度を超えると逆に強い嫌悪感が生まれる。「ほぼ人間だが、少し違う」という状態が最も不気味に感じられるのだ。
(出典:森政弘「不気味の谷」、Energy誌、1970年)
この現象は、多くの実験で確認されている。2011年にKarl MacDormanらが行った実験では、被験者は完全に機械的なロボットよりも、「人間に近いが完全ではないロボット」に対して、より強い不快感を示した。人型ロボットが、展示では注目を集めながらも、いざ家庭への導入となると抵抗感が持たれやすいのは、この「谷」が影響している可能性があると言われている。
つまり、「人型ロボットは親しみやすい」という直感は、必ずしも正確ではない。ある程度の人型は親しみやすいが、高度に人間に近い人型は逆に不気味になりうる。この問題を乗り越えるのは技術的・デザイン的に極めて難しく、現在の多くのヒューマノイドがこの谷のどこかに位置している。
「理解しやすさ」と「合理性」を混同するリスク
人型ロボットが広く受け入れられているもう一つの理由として、認知的な親しみやすさ(理解しやすさ)がある。人間は他人の考えや感情を読み取るために進化してきたと言われる。人型の存在を見ると、自動的に「この存在が何をしようとしているか」を理解しやすくなる。これは心理学で「心の理論(Theory of Mind)」と呼ばれる能力の自然な働きだ。
つまり、ヒューマノイドが好まれる理由の一部は、「合理的に最適だから」ではなく、「直感的に理解しやすいから」という側面があるのだ。理解のしやすさは、普及において重要な要素だ。だが「わかりやすい」ことと「最善の設計である」「合理的である」ことは、全く別の話だということを忘れてはいけない。
これらの区別を意識せずにいると、私たちは「なんとなく人型がよさそう」という直感に引きずられて、より本質的な問いを見逃してしまう。
次章では、実際の現場でロボットがどのように使われているかを見ることで、この議論をもっと地に足ついたものにしていきたい。
第3章 すでに存在するロボットの現実

工場という「最先端の現場」
ロボット導入が最も積極的に進んでいる場所は、工場だ。国際ロボット連盟(IFR)の2023年の報告によると、世界の製造業に稼働する産業用ロボットは390万台を超え、過去最高を更新した。自動車産業では、完成車一台の製造に数百台のロボットが関わる工程もある。韓国は人口1万人の製造業従事者に対して1000台以上のロボットを導入しており、世界最高の「ロボット密度」を誇る。
(出典:International Federation of Robotics (IFR), "World Robotics 2023: Industrial Robots")
そこでヒューマノイドロボットは使われているか。答えはほぼノーだ。
工場で活躍するのは、スポット溶接専用ロボット、塗装専用ロボット、ボルト締め専用ロボット、部品搬送専用AGV(自動搬送車)だ。それぞれが特定の役割に完全に特化し、その役割において人間を大幅に超える精度とスピードを実現している。
Amazonの倉庫で起きていること
物流の現場も同様だ。Amazonは2012年にKiva Systemsを7.75億ドルで買収し、その技術をAmazon Roboticsとして発展させた。2023年時点で、Amazonの倉庫には75万台以上のロボットが稼働している。これは、ロボット大国ドイツの産業用ロボット総稼働台数(約25万台)の3倍を上回る数字だ。
これらのロボットは、人型ではない。棚ごと移動させるオレンジ色の台車型ロボット(Kiva)、ベルトコンベア上を流れる荷物を仕分けするロボット、商品を棚から取り出すアーム型ロボット(Sparrow)。それぞれが特化した役割を持ち、連携することで驚異的な効率を実現している。(出典:Amazon Robotics Press Release 2023年; IFR Country Data Germany 2022年)
さらに2024年、Amazonはヒューマノイドへの取り組みとして、Agility RoboticsのDigitを物流倉庫に試験導入した。しかしこれは高度なパイロットテストであり、大規模な置き換えとは全く異なる。むしろAmazonの姿勢は「特定の難作業にのみ補完的に使う可能性を探っている」段階で、主力の75万台は引き続き非人型の専用ロボットだ。
専用化が生む圧倒的な効率
なぜ専用ロボットなのか?という疑問に対しては、以下の3つの理由に整理できる。
理由1:作業性能の最大化
特定の作業に特化したロボットは、その作業においてほぼ「最高の存在」になれる。スポット溶接専用ロボットは、熟練溶接工が一日かけてこなす量を数時間でやり遂げ、かつ0.1ミリ以下の精度を維持する。これは疲労しないこと、休憩が不要なこと、環境変数に動じないことから来る。汎用的な構造を持つロボットは、この専門化した卓越性を発揮できない。なぜならその構造が、多様な動きを可能にする反面、特定の動きへの最適化を妨げるからだ。
理由2:並列処理と時間の効率
分業が生む最大の恩恵は、複数の作業を同時並行で進められることだ。工場のラインでは、複数の専用ロボットが各工程を独立して同時に処理している。時計の製造ラインを想像してほしい。ねじ締めロボット、接着剤塗布ロボット、検査ロボットが、それぞれの工程を同時に行うことで、ライン全体の生産量は劇的に上がる。一台の汎用ロボットがこれを順番にこなすとすれば、1日分の作業量が最低でも工程数倍の時間を要する。この差は、量産規模になると致命的だ。
理由3:故障リスクとメンテナンスコスト
機械の世界には「複雑さはコスト」という原則がある。自由度の高い関節、バランスを保つためのセンサー群、多様な作業に対応するためのアクチュエーター。これらを一台に詰め込むと、故障の確率が上がり、故障した際の診断と修理も複雑になる。
対照的に、単機能ロボットの構造はシンプルだ。可動部が少なく、設計が明快で、故障したとき何が悪いかが即座にわかる。工場の稼働率は命綱だ。一台のロボットが止まれば、ライン全体が止まる可能性がある。そのため産業現場では、「複雑で壊れやすいロボット」よりも「シンプルで信頼性の高いロボット」が圧倒的に好まれる。
「使われていない」という事実の重み
ロボット導入が最も積極的に進む工場や物流の現場で、ヒューマノイドはほとんど使われていない。これは決して「まだ技術が未熟だから」という説明で終わらせていい問題ではない。
「でも今は試験段階で、技術が成熟すれば使われるようになるはずだ」という反論があるだろう。
これは部分的に正しい。確かに技術は進歩する。しかし重要なのは、技術が成熟した暁に「なぜ人型でなければならないのか」という問いへの答えを、今から持っておく必要があるということだ。もし専用機の方が効率的で信頼性が高いという構造的な理由が変わらないなら、技術が成熟しても専用機への優位性の逆転は起きないかもしれない。
この事実が示唆するのは、
「ヒューマノイドには、既存のロボット化の文脈では見えない別の論理が働いている可能性」
だ。それは何か。次章以降で、「汎用性」という概念そのものを解剖することで、その輪郭を追ってみよう。
第4章 「何でもできる」という誤解
汎用性のトレードオフ
スイスのアーミーナイフを知っているだろうか。ナイフ、ハサミ、栓抜き、ドライバー、ピンセットが一本に収まった万能ツールだ。旅行のお供には便利だが、プロの料理人はスイスアーミーナイフで刺身を作らない。大工はそれで木材を切らない。専門家は専用の道具を使う。なぜなら、スイスアーミーナイフのナイフは、専用の包丁に切れ味で勝てないからだ。万能性と専門性はトレードオフの関係にある。
汎用性とは、「複数のことができること」だ。それは「すべてのことで最高の性能を発揮すること」とは全く違う。この区別は、ヒューマノイドの議論において決定的に重要だ。
経済学が250年前から知っていたこと
アダム・スミスは1776年の「国富論」の冒頭で、ピン工場の事例を詳しく描いた。1人の職人がピン製造の全工程をこなすよりも、10人がそれぞれの工程に特化した方が、生産量が240倍以上にもなるというのだ(スミスの推計では1人が1日1〜20本しか作れないのが、10人の分業で4万8000本になる)。
(出典:Adam Smith, "An Inquiry into the Nature and Causes of the Wealth of Nations," 1776年)

比較優位の原則として知られるこの考え方は、19世紀初めにデヴィッド・リカードが国際貿易の文脈でさらに精密化した。「各主体が相対的に得意なことに特化し、交換することで、全体の生産性は最大化される」という原理だ。これは250年後の今も産業ロボットの世界で実証され続けている。
ヒューマノイド一台が「何でもできる」という設計思想は、この分業の原理と真っ向から対立するのではないだろうか?
経済学が長年積み上げてきた知見に対する問いかけでもある。
「汎用」は並列を直列に変えてる
家の中では、洗濯、掃除、料理、育児が同時に進行している。現代の多くの家庭では、洗濯機が洗濯を自動でこなしている間に、電子レンジが食品を温め、ルンバが床を掃除している。これらは「専用機の並列処理」だ。それぞれが独立して動くことで、複数の作業が同時に前進する。
一台のヒューマノイドロボットがこれらをすべて引き受けるとしたら、どうなるか。洗濯が終わるまで掃除が待ち、掃除が終わるまで料理が待つ。これは並列処理を直列処理に変換することだ。効率の観点では、明らかに後退することになる。
この問題は、作業が増えるほど深刻になってしまう。作業数が10個あり、それぞれ1時間かかるとしよう。10台の専用機なら1時間で全部終わる。1台の汎用機なら10時間かかる。これは極端な例だが、考え方としては正しい。
「何でもできる1台」は、「それぞれに特化した複数台」に対して、時間効率で原理的に不利になるのはないだろうか?
万能機が抱える3つの制約
汎用ロボットには、さらに3つの根本的な制約がある。
制約1:複雑性のコスト
何でもできる構造を一つのシステムに詰め込むことは、必然的に複雑化を招いてしまう。複雑なシステムは故障しやすく、修理も難しい。これはソフトウェア工学でも「複雑さはバグの温床」として知られており、機械工学でも不具合の温床となる。
人型ロボットは、移動のための二足歩行機構、物をつかむための多関節アーム、環境を認識するためのセンサー群、バランスを保つための制御システムを一つに統合する必要がある。これらはそれぞれが高度に複雑で、互いに干渉し合う可能性がある。
制約2:最適性の限界
1つの身体で100のことができるということは、それぞれのことで「ある程度の妥協」をしているとになる。
床の掃除に最適な高さと姿勢は、棚の上の物を取るのに最適な高さと姿勢とは異なる。キーボードを打つのに最適な指先の構造と、重い物を持ち上げるのに最適な握力の構造は、両立が難しい。何でもできるために、どこも「最高」になれない。
制約3:信頼性と稼働率のジレンマ
専用機は単機能だから、壊れたとしても他の専用機が別の作業を続けられる。一台が止まっても、他が動いている。しかし一台の汎用機がすべてをカバーしている場合、その一台が壊れると、すべての機能が止まる。家庭に一台の汎用ロボットが入り込み、すべての家事を担うようになったとして、そのロボットが突然故障したとき、生活は成り立つだろうか。
では、汎用性に価値はないのか?というとそれも早急である。
価値はある。ただしそれは「最高のパフォーマンス」ではなく「切り替えの柔軟性」である。事前に定義できないような多様な状況に対応できること。特に、頻度は低いが起きると困る「例外的な状況」への対応においては、汎用性が輝く。
だが問題は、その柔軟性がコアな価値になる場面がどれほど存在するのかという点だ。高頻度で繰り返される定型作業においては、専用機が圧倒的に有利だ。低頻度で多様な対応が必要な作業においては、汎用性が意味を持つ。この「低頻度・多様」な領域のことをロングテールと呼んだりする。
次章では、このロングテール領域に踏み込んでいく。
第5章 ロングテールと汎用ロボットの成立条件

ロングテールとは何か
インターネットビジネスの世界で「ロングテール」という概念が注目されたのは、2004年だ。Wiredのクリス・アンダーソンが提唱したこの考え方によると、ネット書店Amazonでは、上位少数のベストセラーよりも、低売上の多数の「マイナー書籍」の合計売上の方が大きいという。物理的な棚スペースの制約のある実店舗では並べられないロングテールの商品が、ネット上では無限に展開できる。
この概念をロボットに転用してみる。
すると、作業の世界にも同様の構造が見えてくる。高頻度で繰り返される作業(例えば溶接、組み立て、仕分け)は、すでにロボット化されている。問題は低頻度で多様な「ロングテール」の作業だ。
病院の廊下で点滴用スタンドを移動する作業、老人ホームの食堂で食事を配膳する作業、ホテルの客室でタオルを折りたたむ作業、個人宅の散らかった台所を片付ける作業。これらは無数にある作業だが、すべて頻度が少なく、環境が毎回異なり、作業内容が多様だという特徴を持つ。
なぜロングテールは自動化されなかったのか
これらの領域がロボット化されなかったのは「技術的に不可能だったから」ではない。経済的に成立しなかったからだ。
例えば、ある特定の病院の廊下のレイアウトに特化した搬送ロボットを設計するとする。開発費用、製造コスト、設置コスト、保守費用を含めると、投資回収には数十年かかるかもしれない。しかも病院が増築や改装をすれば、そのロボットは使えなくなる。需要が限定的な上に、環境の変化に対応できないため、経済的な合理性が成立しない。
ロングテール領域のロボット化を阻んでいたのは、技術的な壁よりも、この経済的な壁の方が大きかった。
ヒューマノイドが提示するコスト構造の変化
ここで、ヒューマノイドロボットの意義が初めて明確に見えてくる。
汎用ロボットは、一台のハードウェアを共通基盤にして、ソフトウェアを切り替えることで多様な作業に対応できるとすれば、個別の専用機を作る必要がなくなる。病院用、ホテル用、老人ホーム用という縦割りの専用機設計ではなく、一つのハードウェアを多くの用途に展開できれば、ハードウェア開発コストが分散される。
スマートフォンが良い例だ。
iPhoneは電話でもあり、カメラでもあり、地図でもある。これはハードウェアを共通化し、アプリ(ソフトウェア)で機能を追加するというモデルだ。ヒューマノイドも同じ論理で、共通のハードウェアに異なる「作業ソフトウェア」を載せることで、様々な環境に展開できる可能性がある。
この点において、ヒューマノイドロボットは単なる非効率な機械ではなく、「ロングテール領域への経済的成立条件を変化させうる技術」として位置づけることができる。これは重要な認識だ。
「可能になること」と「必要であること」の区別
しかしここでも、慎重になることが必要だ。
「技術的に可能になること」と「社会が強く必要としていること」は、必ずしも一致しない。この区別は本書全体を通じての根幹的な問いだ。
ロングテール領域の作業を改めて見てみよう。確かに面倒だ。しかし、それぞれの作業について問い直してほしい。その作業は、一人の人間がどれくらいの時間をかけているか。代替手段はあるか。それが自動化されたとして、生活はどれほど変わるか。
病院の配膳は、看護補助スタッフが担っている。これは効率化の余地があるかもしれないが、同時に「患者との声かけ」「食欲の観察」「転倒リスクの把握」といった付随的な観察の機会でもある。ロボットがこれを代替するとき、効率は上がるかもしれないが、失われる情報もある。ホテルの客室清掃は、人間のスタッフが忘れ物に気づいたり、異常を発見したりする機会でもある。
「できるようになる」と「必要だ」の間には、多くの場合、相当な距離がある。そしてその距離は、作業の種類によって大きく異なる。
需要の強度をどう測るか
つまり、ここに「どうすれば需要の強度がわかるのか」という問いが生まれる。これは難しい問題だが、いくつかの手がかりがある。
一つ目は、人々が自発的に支払う価格だ。ルンバは発売当初から数万円の価格で売れ続けた。それは床掃除という作業に対する確かな需要を示している。一方で、「皿洗いロボット」はこれほど普及していない。家庭用食洗機は普及したが、皿を取り出して片付けるロボットへの需要は、床掃除ほど明確ではないということがわかる。
二つ目は、労働市場の動向だ。深刻な人手不足が起きている領域は、自動化への強い需要が存在することを示す。日本の介護分野は慢性的な人手不足であり、これは需要の強さを示す指標になる。一方で、家事全般に対する「ロボットを雇う」という発想が、現時点でどれほどの価格まで許容されるかは、まだ不明だ。
重要なのは、「技術的に可能かどうか」の議論だけでは、ヒューマノイドの必要性を正当化できないという点だ。需要の実態を丁寧に見る必要がある。この問いを念頭に置きながら、次章で視点を大きく転換してみよう。
第6章 AIにとっての「身体」という問題

AIに必要なものとは
前章までは、「人間にとってヒューマノイドは必要か」という問いを追ってきた。本章からは、視点を大きく転換する。「AIにとって、ヒューマノイドは何の意味を持つか」という問いだ。
現代のAI、特にchatGPTやGeminiのような大規模言語モデル(LLM)の能力は、学習データの質と量に決定的に依存している。これはAI業界ではコンセンサスとなっている。
例えば、OpenAIのGPT-3は4500億トークン(約3000億単語に相当)のテキストデータで学習した。GPT-4はその数十倍規模のデータと、それに加えて大量の人間のフィードバック(RLHF: 人間フィードバックを用いた強化学習)で訓練されたとされる。Google DeepMindのGeminiも、テキスト、画像、音声、動画を組み合わせたマルチモーダルなデータで学習している。「データが多いほど賢くなる」は、現在のAIの基本原理だ。
(出典:OpenAI, "Language Models are Few-Shot Learners (GPT-3)" NeurIPS 2020; OpenAI Technical Report GPT-4, 2023年)
インターネットデータが届かない世界
しかし、インターネット上のデータには、明確な限界がある。それは「人間が記録したもの」しか含まないという点だ。
ウェブ上のテキストは、人間が考えたこと、感じたこと、経験したことを言語化したものだ。画像は、人間が見て価値があると判断した瞬間を切り取ったものだ。動画は、人間が撮影する価値があると思ったシーンを記録したものだ。これらはすべて、現実世界の「選択的な記録」であり、「完全な記録」ではない。
そして決定的に欠けているものがある。身体を通じた物理的な相互作用の情報だ。
コップを持ち上げるという動作を考えてみよう。どれくらいの力を指にかければよいか。コップが磁器か紙コップかによって、どれくらい力を変えるか。濡れているときの滑りやすさへの対応。水が入っていて、傾けたときの重心の変化。倒れそうになったとき、0.1秒以下の反射でどう補正するか。これらの情報は、コップについての文章をどれほど大量に読んでも、習得できない。体で経験することによってのみ、理解できる。
「語れない知識」の存在
この問題を最初に鋭く指摘したのは、哲学者のマイケル・ポランニーだそうだ。1958年の著書「個人的知識」の中で、彼は「私たちは語れる以上のことを知っている(We can know more than we can tell)」という有名な命題を提示した。言語化できない「暗黙知(tacit knowledge)」の存在だ。
(出典:Michael Polanyi, "Personal Knowledge: Towards a Post-Critical Philosophy," 1958年)
自転車の乗り方を言葉で説明できるか。「ペダルを漕ぎながら、ハンドルで向きを変え、バランスを保つ」。この説明が完璧でも、それを読んだだけで誰も自転車に乗れるようにはならない。体で繰り返し練習して初めて習得できる。
溶接の名人は、何千時間もの経験から培った感覚で電流の微妙な加減を調整する。しかし、その感覚を完全に言語化することはほぼ不可能だ。陶芸家の土の感触、医師の触診の微妙さ、大工の水平感覚。これらはいずれも、言葉やデータには収まりきらない知識だ。
現在のAIは、テキストと画像という「記述された知識」の世界では驚異的な能力を発揮している。しかし「経験によって得られる知識」の世界には、まだほとんど踏み込めていない。この限界は、学習データの性質に起因する構造的な問題だ。
身体化された認知
認知科学の分野では、「身体なしに知性は完成しない」という考え方が、1990年代から急速に発展してきた。「身体化された認知(Embodied Cognition)」と呼ばれるこの分野は、知性が脳だけでなく、身体と環境との相互作用によって形成されるという立場だ。
フランスの哲学者モーリス・メルロ・ポンティは「知覚の現象学」(1945年)の中で、「私たちは世界を、身体を通じて理解する」と論じた。腕を失った人が、義肢を通じて世界との関わり方を再学習するように、身体の構造は認知の構造に直結している。
(出典:Maurice Merleau-Ponty, "Phénoménologie de la perception," 1945年)
より実証的な研究として、心理学者のTanya Chartrandらが1999年に発表した実験がある。人間は他者の動作を無意識に模倣することで、その意図をより深く理解するという「カメレオン効果」だ。身体的な模倣が認知の深さに影響するという点で、身体と知性が不可分であることを示している。
こうした研究が示唆するのは、身体を持たないAIは、現実世界に対する理解において、根本的な限界を持つ可能性があるのではないかということだ。
身体があって初めて生まれるデータ
では、AIが現実世界を真に理解するためには何が必要か。
答えは、現実世界で行動し、その結果を記録したデータだ。
ロボットの腕が物体に触れたとき、力センサーが感じる圧力のデータ。重い物を持ち上げようとして失敗したとき、どのような信号のパターンが発生したか。不整地を歩こうとして姿勢を崩したとき、どのように重心を移動して回復したか。これらの「行動とその結果のフィードバックのペア」が、現実世界に関するデータの本質だ。このデータは、カメラの映像や、センサーの受動的観測では代替できない。物理的な身体を持ち、環境に能動的に働きかけることによってのみ、生成できる。
ここでようやく一つの仮説が成立する。
ロボットは人間の作業を代替するための機械だ、と私たちは思っている。しかし別の角度から見ると、ロボットは現実世界のデータを生成するための装置でもあり得る。
この2つの見方は矛盾しない。だが見ている観点が全く違う。
前者は人間の利便性を中心に置く。
後者はAIの学習という目的を中心に置く。
もし後者の視点が正しければ、ロボット開発を加速させる力は「人間が便利になりたい」という欲求だけではなく、「AIが賢くなるためのデータが必要だ」という要請からも来ている可能性がある。
第7章 ヒューマノイドという選択の意味

身体が必要なら、なぜ人型なのか
前章の議論から、AIには身体を通じた行動データが必要だという仮説が導かれた。
しかし、身体が必要だとしても、なぜ人型でなければならないのか。この問いをまず検証する。
腕が四本あってもいい。車輪で移動してもいい。タコ型でも、蜘蛛型でも、理論上はデータ収集は可能だ。なぜ人型が選ばれるのか。
ここで登場するのが、「行動空間の網羅性(Covering of Action Space / Action Coverage)」という考え方だ。
行動空間という概念
人間が日常生活の中で行う動作を列挙してみると、その多様さに驚く。物を押す、引く、持ち上げる、回転させる、組み立てる、解体する、書く、食べる、歩く、走る、ジャンプする、座る、しゃがむ、腕を伸ばす、手を差し伸べる、つまむ、握る、こする、叩く。これらすべての動作は、人間の身体構造がカバーする「行動空間」の中にある。
もしAIが現実世界のあらゆる状況でデータを取得しようとするなら、その行動空間を最大限にカバーする身体が必要だ。
特定の工程だけをこなすロボットアームでは、その工程のデータしか取れない。車輪で移動するだけのロボットは、段差や階段でのデータを取得できない。
しかし人型の身体を持つロボットは、人間がいる場所ならどこでも、人間がやることならほとんど何でも、データを取得できる可能性がある。人間の生活空間は人型に合わせて設計されているのだから、人型ロボットはその空間のほぼすべてにアクセスできる。
この観点では、人型は「人間の作業を真似るため」ではなく、「人間が関わるすべての状況でデータを取り続けるための最大公約数」として選ばれている可能性がある。
スマートフォンモデルとの類比
もう一つ重要な構造がある。ハードウェアとソフトウェアの分離だ。
スマートフォンがわかりやすい。iPhoneは一台で、電話、カメラ、地図、音楽プレーヤー、ゲーム機、健康管理ツールになれる。これはハードウェア(共通の基盤)の上にソフトウェア(アプリ)を乗せることで実現される。新しいカメラ機能を追加したいなら、アプリをダウンロードすればよい。iPhoneの形を変える必要はない。
ヒューマノイドも同じ論理で設計されている。身体というハードウェアは共通化し、その上でソフトウェアを入れ替えることで、異なる作業に対応する。Figure AIは「将来的には新しい作業スキルをソフトウェアアップデートで追加できる」という展望を語っている。これはまさにApp Storeモデルのヒューマノイド版だ。
このとき何が価値の中心になるか。
ハードウェア(身体そのもの)ではなく、ソフトウェア(行動の知識)だ。どのような作業をどの精度でできるかを規定する「行動知識」が、ビジネスの核心になる。iPhoneよりもApp Storeの方がAppleの利益の大きな源泉であることと、構造的に同じだ。
プラットフォーム経済学とヒューマノイド
経済学者のジャン・ティロールとジャン・シャルル・ロシェが2003年に発表した「プラットフォーム経済学」の理論によると、プラットフォームビジネスは「2つ以上の異なるグループを媒介することで価値を生む」という構造を持つ。
(出典:Jean-Charles Rochet and Jean Tirole, "Platform Competition in Two-Sided Markets," Journal of the European Economic Association, 2003年)
ヒューマノイドの文脈に当てはめると、身体(ハードウェア)は「作業の依頼者(事業者やユーザー)」と「作業ソフトウェアの開発者」を媒介するプラットフォームになり得る。作業の依頼者は身体を通じてサービスを受け、開発者は身体上でソフトウェアを展開する。身体の製造者は、このプラットフォームを所有することで、両側から価値を引き出せる。
つまり、この視点で考えると、ヒューマノイドのビジネスモデルは「作業代行サービス」よりも「プラットフォーム経済」に近いと言える。
そして、プラットフォームの価値は利用者数とともに指数的に高まる(ネットワーク効果)。多くのロボットが多くのデータを集めることで、より賢いソフトウェアが開発され、より多くの利用者を引き寄せる。この循環が成立すれば、プラットフォームを先行して確立した企業が、圧倒的な優位を持つ。
人型には複数の理由が重なっている
ここまでの話を整理してみる。ヒューマノイドが人型である理由は、1つではない。
・人間の生活環境への適合性。
・人間の行動空間を広くカバーするための網羅性。
・ソフトウェアによって機能を拡張できるプラットフォームとしての役割。
・人型の直感的な親しみやすさによるマーケティング上の利点。(前章)
これらが重なった結果として、人型という形が選ばれている。
そして重要なのは、この「重なり」の中に、人間の便利さとは別の論理が紛れ込んでいることだ。
AIのデータ収集手段としての側面は、表面的な宣伝・謳い文句には現れにくいが、ビジネスとして極めて重要な目的となる。
次章では、ロボットが生成するデータの性質と価値をさらに掘り下げる。
第8章 データとしての現実世界

データには本質的な階層がある
私たちは「データ」という言葉を何気なく使うが、すべてのデータが同じ性質を持つわけではない。データには、その生成過程と性質によって、はっきりとした階層がある。
第1の階層は、人間が言語化・記録した情報だ。テキスト、画像、音声、動画がこれに当たる。これらは人間の認知と表現を通じて生成されており、すでにある程度の構造と意味を持っている。インターネット上に膨大に存在し、取得コストは比較的低い。
第2の階層は、センサーによる受動的観測データだ。気象センサーが記録する温度と湿度、交通カメラが記録する車の通過数、工場の機械が記録する稼働ログがこれだ。これらは構造は持つが、意味の解釈は人間が別途行う必要がある。
第3の階層は、身体的行動を通じた能動的な相互作用データだ。ロボットがある物体に触れ、力を加え、その反応を記録するデータ。この階層のデータは、他の二つとは本質的に異なる。取得するには身体を通じて環境に働きかけなければならず、受動的な観測では得られない。
AIは第1・第2の階層のデータを大量に学習してきた。しかし第3の階層のデータは、まだほとんど取得されていない。ここに、現実世界のデータが持つ本質的な希少性がある。
行動によってのみ生まれる知識
なぜ行動データが特別なのかを、もう少し具体的に考えてみよう。
卵をフライパンに割り入れる動作を考える。殻を適度な力でたたいて、白身と黄身を傷つけずに分離する。力が弱すぎると割れない。強すぎると殻が砕けて混入する。どのくらいの力が適切かは、その卵のサイズ、鮮度、温度によって微妙に異なる。この「適切な力」は、言語では正確に記述できない。「中程度の力で」と言っても何の助けにもならない。何百回も実際に卵を割ることで、体に刷り込まれていく知識だ。
ロボットがこの動作を習得するためには、実際に何百回、何千回と卵を割り、その都度「力のかけ方」「結果(うまくいった・失敗した)」「修正」のサイクルを繰り返す必要がある。このサイクルを通じて蓄積されるデータが、第3の階層のデータだ。
このデータの特徴は、行動なしには生まれないという点だ。人間が卵を割る映像を1000時間学習しても、力の微妙な加減はわからないだろう。ロボット自身が卵を割る経験を積むことでのみ、この知識は獲得できる。
希少性と価値の経済学
経済学的な観点から、第3の階層のデータを分析してみよう。
価値の源泉は、希少性と有用性だ。
例えば、空気は有用だが、無限にあるため市場価格がつかない。金は有用かつ希少だから価値がある。
インターネット上のテキストや画像のデータは、膨大にあり、複製コストはほぼゼロだ。ある主体がそれを持っていても、別の主体も同様に取得できる。これも希少性が低い。
一方、現実世界の行動データは、物理的な装置と時間と場所を通じてしか取得できない。同じ状況を再現することは難しく、バッチで大量生産もできない。しかも、このデータを大規模に取得するためには、多数のロボットを多くの環境に展開するというコストのかかる投資が必要だ。これは、希少性と取得コストの両面から、高い価値を持ちうる資源だ。
さらに重要なのは、このデータの価値が「蓄積によって増加する」という性質だ。物理データを1000件持つよりも、100万件持つ方が、学習できるパターンの深さと広さが桁違いに増す。これは情報財の一般的な性質だが、行動データにおいてはその効果が特に顕著だ。
自己強化サイクルと先行者優位
また注目すべきは、データの蓄積が自己強化的なサイクルを生み出すという点だ。
多くのデータを持つ主体は、より優れたモデルを構築できる。優れたモデルを持つロボットは、より複雑な作業をこなせるため、より多くの環境に展開される。多くの環境に展開されることで、さらに多くのデータが集まる。このサイクルが回り続ければ、先行者の優位は時間とともに自己強化される。
この構造は、GAFAMがインターネット時代に積み上げた競争優位と本質的に同じだ。Googleは検索データを独占的に蓄積することで、広告のターゲティング精度を高め、それが収益を生み、その収益でさらに多くのデータを集める技術に投資した。Amazonは購買データを蓄積することで、レコメンデーションの精度を高め、それがさらなる購買を促した。
1990年代後半に検索エンジン市場でGoogleと競っていた企業(AltaVista、Excite、AskJeevesなど)の多くは、今やほとんど忘れられている。Googleのデータ優位が固まった後、追いつくことは困難だった。フィジカル世界のデータにおいて、同様の「固定化」が起きるとしたら、その時点を過ぎた後から参入しても、根本的に不利だ。
今はそれが更に過激になり、全世界を掌握するAGI(Artificial General Intelligence)と呼ばれる人工汎用知能(人間が行えるあらゆる知的作業を、人間と同等かそれ以上にこなすことができるAI)の獲得競争が行われている。AGIを最初に獲得したものは、他社を圧倒的に引き離す世界を作れると言われているのである。
ロボットの役割が二重になる
ここまでの議論を踏まえると、ロボットの役割が二重に見えてくる。
表面的な役割は、作業の代替だ。掃除をする、荷物を運ぶ、組み立てる。この役割は人間の側から見た価値だ。
構造的な役割は、データ生成の手段だ。行動を通じて現実世界のデータを継続的に収集し、AIの学習資源として蓄積する。この役割はAIと、そのAIを管理する組織の側から見た価値だ。
これらは同時に成立し、矛盾しない。
しかし、どちらの役割を主として設計するかによって、ロボットの仕様、展開の論理、評価の基準が変わってくる。そしてこの「二重の役割」の存在が、ロボット開発の論理を、純粋な「人間の便利さ」とは異なるところに押し上げる可能性がある。
第9章 データをめぐる競争構造

データが戦略的資源になった経緯
2017年、著名な経済誌Economistが「世界で最も価値ある資源は石油ではなくデータだ(The world's most valuable resource is no longer oil, but data)」という表紙を掲げた。それから8年、この認識はもはや常識となった。
(出典:The Economist, "The world's most valuable resource is no longer oil, but data," May 6, 2017年)
検索エンジン、ソーシャルメディア、ECプラットフォーム。これらのビジネスモデルの核心は、データの独占的な蓄積と活用だ。Googleはユーザーの検索行動から広告を最適化し、Amazonは購買履歴から次の需要を予測し、Metaはソーシャルグラフから人々の関心を解析する。データは、単なる副産物ではない。データそのものが競争優位の源泉であり、事業の本質になった。
インターネット領域の「植民地化」
インターネット上のデータという戦場は、すでに大勢が決しつつある。
テキスト、画像、検索行動、購買履歴、ソーシャルグラフ。これらの領域では、GAFAM(Google, Apple, Facebook, Amazon, Microsoft)が圧倒的なデータ基盤を持っている。検索市場でのGoogleのシェアは世界で約90%。SNS利用者の多くはMeta傘下のFacebook、Instagram、WhatsAppに集まっている。中国ではBATH(Baidu, Alibaba, Tencent, Huawei)が同様の地位を占める。
新規参入者がゼロから同じ規模のデータ基盤を構築しようとしても、数十年分の蓄積を短期間で埋め合わせることは、現実的ではない。Googleが1998年から積み上げた検索ログ、Amazonが1994年から積み上げた購買データ。この蓄積の差は、資本力だけでは埋められない。この領域は、ある意味で「植民地化済み」の状態だ。
新しいフロンティア:フィジカル世界
だが現実世界、つまりフィジカル領域のデータは違う。この領域のデータ収集は、まだ本格的には始まっていない。
製造現場、物流倉庫、医療機関、家庭、公共空間。これらの場所で、人間の体が行う無数の動作と、その結果生まれる物理的な変化。このデータは、誰もまだ大規模に収集できていない。なぜなら、そのためには物理的な装置を多くの環境に展開するという、インターネットデータの収集とは桁違いにコストのかかる投資が必要だからだ。
これはインターネットが普及する以前の1990年代前半と、構造的に似た状況かもしれない。1993年頃のウェブは、学術機関や研究者が細々と使う世界だった。しかし、AOL(接続環境)やNetscape(ブラウザ)、そしてGoogleやAmazonはそこに途方もない価値を見出し、先行して収集・活用するインフラを構築した。フィジカル世界のデータをめぐる競争は、今まさにその「1993年」に相当する段階にあるかもしれない。
競争の加速メカニズム:囚人のジレンマ構造
この競争には、個別の意思とは独立した加速構造がある。
それはゲーム理論の「囚人のジレンマ」として知られる構造だ。
二人の囚人が別々の部屋で尋問される。互いに黙秘すれば、ともに軽い刑で済む。しかし一方が裏切って自白し、他方が黙秘すると、自白した方は釈放され、黙秘した方は重罪になる。この状況では、「裏切る」ことが個人にとって合理的な選択になり、結果として二人とも裏切り、二人とも重罪になるという最悪の結果に終わる。
フィジカルデータ競争を同じ構造で考えてみよう。企業Aがロボット展開を強化してデータ収集を始めると、企業Bは相対的に遅れを取る。Bにとって最悪のシナリオは、Aが大量のデータを蓄積した後で市場参入することだ。そのリスクを回避するために、BはAの動きに追随してロボット展開を進める。その結果として、全体の競争が加速する。
誰も「競争を激化させたい」と思っているわけではない。しかし個別に合理的な行動の積み重ねが、全体として競争を加速させる。これは兵器開発における軍拡競争と同じ論理だ。どの国も核戦争を望んでいないのに、「他国が持つなら自国も」という論理が核拡散を生んだ。
フィジカルデータ競争において、参加者たちが全員「このまま競争が加速してよいのか」という問いを持っていたとしても、構造的に競争が進んでしまう可能性がある。
ロボット展開の本当の評価軸
この文脈で見ると、ロボットの評価軸が変わる。
従来の評価軸(いまの世間の認識)は「どれだけ効率的に作業を行えるか」だ。この軸では、専用ロボットが汎用ロボットより有利であることが多い。しかし、「どのようなデータをどれだけ取得できるか」という評価軸を加えると、話は変わる。専用ロボットは特定の環境の特定のデータしか取れないが、汎用ロボットは多様な環境で多様なデータを取れる可能性がある。
この二つの評価軸が存在することで、ロボット開発の目的が「単なる作業効率の最適化」から、「データ資源の確保」へとシフトしてしまう。そしてこのシフトは、誰かが意図的に設計したものではなく、競争構造から自然に生み出されてしまうのである。
プラットフォーム戦争の予兆
2007年、Appleがiphone を発表したとき、それはただの「電話」ではなかった。iOSというオペレーティングシステム、App Storeというアプリ流通プラットフォーム、そして開発者エコシステムを含む、一つの「経済圏」の立ち上げだった。
Googleが翌年にAndroidを無償公開したのは、この競争構造への対応だ。Appleがハードウェアとソフトウェアを垂直統合してプラットフォームを支配しようとしたのに対し、Googleはソフトウェアを無償で広め、多くのデバイスメーカーを引き込み、水平展開でエコシステムを作った。この二つの戦略は今も続いており、スマートフォン市場は基本的にこの二つのプラットフォームに二分されている。
既存プレイヤーはどうなったか。BlackBerryはQWERTYキーボードという独自性にこだわり、スマートフォンの時代の流れに乗り遅れ、2016年に自社製端末の製造を終了した。Nokiaは高い市場シェアを持ちながら、ソフトウェアエコシステムの重要性を過小評価し、シェアを失った。MicrosoftはWindows Phoneで参入したが、アプリ不足で普及せず、2017年に撤退した。
この歴史が示すのは、プラットフォーム競争では「ハードウェアの優秀さ」よりも「エコシステムの先行確立」が勝敗を決するという事実だ。ヒューマノイドが「ロボットのスマートフォン」になるとすれば、OSに当たるプラットフォームを誰が確立するかが、最大の競争軸になる。
ROS:ロボットOSの既存プラットフォーム
ロボットの世界には、すでに「OS」の候補が存在する。ROS(Robot Operating System)は2007年にStanford大学のAI研究所で始まり、現在はOpen Robotics(非営利団体)が管理するオープンソースのロボット用ミドルウェアだ。世界中の研究機関や企業がROSを基盤としてロボットを開発しており、「事実上の標準」になりつつある。(出典:Open Robotics, "ROS: Robot Operating System," https://www.ros.org; Quigley, M. et al., "ROS: an open-source Robot Operating System," ICRA Workshop, 2009年)
しかし産業用途での信頼性や、リアルタイム処理の要求に応えるためにROS2が開発され、現在は移行期にある。
ここで重要なのは、ROSがオープンソースであることだ。スマートフォンのAndroidと同様に、誰でも無償で使えるオープンなプラットフォームとして普及することで、多くのロボットメーカーがROS上に蓄積した知識とデータが共有財産になる可能性がある。一方で、TeslaやFigure AIのような企業が独自のロボットOSを開発するとすれば、そこに蓄積されるデータと知識は、その企業の独占的な資産になる。
誰がロボットのプラットフォームを握るか
ヒューマノイドの覇権競争は、以下の3つの層で同時に争われている。
第1の層は、ハードウェアだ。
関節の精度、センサーの質、バッテリーの容量、耐久性。これは伝統的な製造業の土俵だ。日本、ドイツ、韓国の製造業が強みを持つ領域だ。
第2の層は、ソフトウェアプラットフォームだ。
どの「ロボットOS」を採用するか、誰がアプリケーションを開発できるか、データがどこに蓄積されるか。これはソフトウェアエンジニアリングとAIの土俵だ。米国の大手テック企業、Googleの親会社Alphabetが投資するBoston Dynamics、Microsoftが投資するFigure AI、NVIDIAがプラットフォーム化を進めているAIロボット開発環境。これらは第二の層での優位を争っている。
第3の層は、データだ。
多くのロボットが多くの環境で稼働するほど、より多様で豊富な行動データが蓄積される。このデータを持つ主体が、最も賢い制御AIを開発できる。第3の層での優位は、長期的には第2の層での優位をも規定する可能性がある。
日本がハードウェアでの強みを持ちながら、ソフトウェアとデータで遅れたインターネット時代の悲劇を、ロボット時代に繰り返さないためには、第2・第3の層への意識的な投資が必要なのだろう。しかし現時点で、日本企業のロボット戦略の多くは第1の層(ハードウェア)に集中してしまっているのが現実である。
第10章 国家レベルでの競争構造

技術覇権の歴史が示すもの
技術と国家の優位性は、歴史を通じて密接に結びついてきた。
18世紀後半、蒸気機関の先行開発と応用によりイギリスは産業革命を主導し、19世紀を通じて「世界の工場」としての地位を確立した。20世紀前半には内燃機関と電気技術、後半には半導体とソフトウェアが、国家間の力関係を規定する重要な変数になった。日本が1960〜80年代に半導体と自動車で経済大国の地位を確立したのも、特定の技術領域での先行優位によるものだ。
AIとデータは、21世紀の技術覇権争いの主戦場だ。これは比喩ではない。
2022年10月、米国商務省は先端半導体の中国への輸出を事実上禁止した。この措置は、AI開発に不可欠なNVIDIAのA100やH100チップの対中供給を遮断することを主な目的としていた。半導体規制が「経済問題」ではなく「安全保障問題」として処理された事実は、技術と覇権の関係が、もはや観念的な議論ではないことを示している。
(出典:U.S. Department of Commerce, Bureau of Industry and Security, Export Control Regulations, October 2022年; Chip War, Chris Miller, 2022年)
AIが他の技術と異なる理由:横断的影響力
AIが過去の基盤技術と比べて特別な点は、その横断的な影響力だ。
核兵器は軍事にしか使えない。石油は特定の産業に不可欠だが、他の産業への影響は間接的だ。しかしAIは、医療診断、新素材開発、物流最適化、農業の収穫予測、金融取引の判断、軍事システムの制御、教育コンテンツの個別化、気候変動のシミュレーション、すべての領域に横断的に影響を与える。
つまり、AIの基盤となるデータを誰が持つかは、単一の産業の問題ではなく、経済・社会・軍事のすべての競争力に直結する。この認識は、各国政府の戦略に明確に反映されている。
米国の「国家AI戦略(National AI Initiative Act, 2020年)」は、AIを安全保障の核心問題として位置づけた。中国の「新一代人工智能発展計画(2017年)」は、2030年までにAI分野で世界のリーダーになることを国家目標に掲げた。EUの「AI法(AI Act, 2024年)」は、規制と産業育成の両面からAI主権を確保しようとするものだ。日本もAI戦略2022を策定し、AI研究とデータ基盤の整備を国家的課題とした。
(出典:National AI Initiative Act, U.S. Public Law 116-283, 2020年; 中国国務院「新一代人工智能発展規画」2017年; EU AI Act, 2024年; 日本AI戦略2022)
フィジカル領域は次の主戦場
先述のとおり、インターネット上のデータに関しては、すでに競争の構造が決まりつつある。Googleが検索、Metaがソーシャル、Amazonがeコマース、Microsoftがビジネスソフト、Appleがモバイルを押さえた。中国では国内プラットフォームが対応する地位を占めている。
しかし、フィジカル世界のデータは別だ。製造ライン、物流ネットワーク、医療現場、農地、建設現場、家庭の中。これらの場所で人間が行う作業を通じて生まれる物理的なデータは、まだ誰も大規模に独占していない。
この「空白」に各国が注目している。米国では、DARPAがロボットと行動データに関する研究プログラムに多額の投資をしている。中国では、「製造業のデジタル化」という国家戦略のもと、工場へのロボット展開を国家補助で推進している。2021年、中国は製造業への新規ロボット導入台数で初めて世界1位になり、以降その差を広げている。
(出典:IFR, "World Robotics 2023: Industrial Robots," China became No.1 in robot installations 2021年)
日本はどこにいるのか
日本の立場を評価してみよう。
インターネット時代、日本はプラットフォーム競争に乗り遅れた。GAFAMに匹敵するグローバルプラットフォームを生み出せず、データ経済の恩恵の多くを外資系企業に渡した。この「遅れ」は、検索、SNS、クラウドコンピューティング、スマートフォンOSのすべてで顕著だ。
しかし、フィジカル世界において日本には固有の強みがある。ファナックやYASKAWA(安川電機)は、世界の産業用ロボット市場で主導的な地位を持つ。日本の製造業の現場には、数十年にわたって積み上げた「熟練の技」がある。QCDサイクル(品質・コスト・納期)に対する徹底したこだわりが生む、高品質な生産ラインのデータは、他国が短期間で模倣できるものではない。
問題は、この強みが次の競争に繋がるかどうかだ。産業用ロボットのハードウェアを作る強みと、ヒューマノイドのデータ競争を制する強みは、同じではない。前者はメカトロニクスの精度と信頼性の問題だ。後者はデータ収集とAI学習という、ソフトウェアとデータサイエンスの問題だ。日本が前者で強くても、後者でも強いかどうかは、別の問いだ。
先日(2026年3月初頭)、GTC2026という世界最大級の技術カンファレンスにおいて、産業用ロボットにおける世界の主要各社が、ソフトウェアをNVIDIAで統一するという発表があった。これは、これまで強いとされていた産業用ロボット領域においても、第2(ソフト)、第3(データ)の領域を日本が失うことを意味しているのである。
競争は個人の意思を超えて進む
ここで強調しておきたいのは、この国家間競争が個別の意思決定者の選択を超えたレベルで進んでいるということだ。
ある政府がAI開発を強化すると、他の政府は相対的に遅れを取ることへの危機感から同様の投資を加速させる。企業も政府の後押しを受けて競争に参加する。研究者は競争的な環境の中で特定の方向への開発を進める。個々の意思決定者が「この競争の方向が本当に良いのか」という問いを持っていたとしても、構造的な力が競争を前進させる。
この「構造が選択を規定する」メカニズムを理解することなしに、ヒューマノイドという技術を適切に位置づけることはできない。次章では、この構造の中で各国・各組織がどのように位置取りを行っているかを検討しよう。
第11章 競争構造の中での位置取り

先行者優位と追随のコスト
競争において、先行者と追随者の間には根本的な非対称性がある。これは単なる「早い者勝ち」という話ではなく、経済学的に明確なメカニズムによって説明できる。
先行者は、初期段階でデータと経験の蓄積を始めることで、学習曲線の優位を確保する。学習曲線とは、累積の生産量・経験量が増えるほどコストが低下し、品質が向上するという経験則だ(Boston Consulting Group曲線とも呼ばれる)。先行者は早く学習曲線を上がることで、後発者が追いつけないコスト・品質優位を確立する。
データ競争においてこれは特に顕著だ。前章で見た通り、データの蓄積は自己強化サイクルを生む。10万件のデータを持つモデルと、10億件のデータを持つモデルでは、性能の差は単純な100倍ではなく、非線形に大きくなる。この「データ規模の収穫逓増」が、先行者優位を時間とともに拡大させる。
(出典:Bruce Henderson, BCG, "The Experience Curve," 1968年; Kaplan and Lentini, "Data Network Effects," Stanford Working Paper, 2019年)
Teslaが作った事例
フィジカル世界のデータ先行者優位を、Teslaの事例でみてみる。
Teslaは自動車のセンサーデータを収集するシステムを早期から構築した。2024年時点で、世界の公道を走るTesla車両の累積走行距離は数十億マイルに達し、多様な道路環境、気象条件、運転者の判断のデータが継続的に本社に送られている。他の自動運転システムが試験コースや限定環境でしか蓄積できないデータを、実際の公道走行から大量に集めることができたのである。
竸合他社がTeslaに追いつくためには、同規模のデータ取得できる自動車を行動で走らせ、同量のデータを蓄積するしかない。しかしTeslaはさらにデータを積み上げ続ける。この差は縮まるどころか、広がり続ける。ヒューマノイドでも同じ構造が起きる可能性がある。
「参加しない」という選択肢の実質的不在
ここで一つ、現実を直視しなければならない。この競争構造の中で「参加しない」という選択は実質的に存在しない。ある企業がデータ収集を進めないでいると、その領域は他の企業によって埋められてしまう。
主導権を取られてしまっては、後からルールを変えることが難しくなる。これは、製造業の文脈で言えば、自社のサプライチェーンのデータが、外部企業のプラットフォーム上に蓄積される状況になることを意味する。そのプラットフォーム企業がルールメーカーになれば、自社はその条件に従わざるを得なくなる。
「しかし、だからといって競争に参加することが正しいのか。軍拡競争を例に出したが、軍拡競争に参加しないことで平和を守った事例もある。技術競争においても、意識的に降りることが正しい場合があるのではないか」という反論が考えられる。
これは重要な問いだ。特に今の日本にとって。。。
ただし、ここでの「参加しない」と軍拡競争での「参加しない」は、文脈が異なる。軍拡競争での不参加は、安全保障の問題だ。技術競争での不参加は、依存関係の問題だ。自国・自社が技術開発に参加しないことは、おそらく「平和」を意味しないと思われる。
それは平和ではなく、「技術的な依存」を意味する。技術的依存は、その技術を持つ国・企業に対して交渉力を失うことを意味する。この点において、「参加しない」ことは「主導権を放棄する」ことになってしまうのである。
したがって問題は「やるかやらないか」ではなく「どのようにやるか、何を目的にやるか」だ。この問いこそが、個人にも組織にも、そして社会全体にも突きつけられている。
部分最適という現実的な戦略
すべての領域で先行者を追い抜くことは非現実的だ。しかし特定の領域での独自の優位性を積み上げることは可能かもしれない。これを「部分最適」と呼んでみる。
製造業の文脈での具体例を挙げる。精密な金属加工工程のデータは、日本の金型メーカーや切削加工企業が長年蓄積してきた暗黙知の塊だ。これをデジタル化し、AIで学習可能な形にすることは、汎用的なロボット製造以上に高い参入障壁を持つ可能性がある。特定の業界の「職人技」をデータ化する技術は、その業界の世界展開に直結する。
あるいは、医療・介護の現場のデータも同様だ。日本は世界最速の高齢化を経験しており、高齢者ケアのノウハウと課題が最も蓄積されている国の一つだ。このコンテキストに特化したロボットとデータ基盤は、同様の高齢化に向かう欧州や中国にとって、参照すべきモデルになり得る。
重要なのは「全体で勝てないから諦める」のではなく、「どこで固有の価値を持てるか」を具体的に問い続けることではないだろうか。
世界最速の高齢化が生む需要の現実
少し、視点を変えてみる。
日本の高齢化は、ヒューマノイド議論において、他のどの国とも異なる文脈を作り出している。2023年時点で、日本の高齢化率(65歳以上人口の割合)は29.1%を超え、世界最高水準にある。2040年代には高齢化率が35%を超えると予測されている。(出典:内閣府「令和5年版高齢社会白書」)
この文脈で見ると、介護領域での自動化需要は、他の多くの先進国より明確で切実だ。介護人材の不足は現在進行形の問題で、2025年には介護職員が38万人不足するという試算もある(厚生労働省推計)。ここには確かな「必要性」がある。
しかし、「介護の特定の負担を軽減する補助技術」への需要と、「汎用ヒューマノイドが介護全体を担う」という想定への需要は、これまでの議論でもわかるように同じではない。
重いベッドへの移乗を補助するリフトアシスト、服薬の管理を支援するシステム、認知症患者の見守りセンサー。これらの特化型ソリューションは、すでに現場で使われている。汎用ヒューマノイドが、これらより本当に優れているかどうかは、技術的にも経済的にも、まだ証明されていない。
「現場」の知識が持つ独自の価値
日本の製造業現場には、ロボット化が進んだ今も、人間の熟練が不可欠な工程が多数ある。複雑な形状の部品の組み立て、微妙な感触を必要とする溶接や研磨といった作業工程や品質確認、予期しない問題への即座の対応。これらは「暗黙知」の塊だ。
この暗黙知をデジタルに記録し、AIで再現可能にすることは、日本の製造業が世界に提供できる独自の価値になりうる。しかしそのためには、「ロボットに仕事を奪われる」という受け身の姿勢ではなく、「熟練の知識をロボットを通じて世界に展開する」という積極的な発想の転換が必要だ。
ちなみに、日本は国家戦略として「GENIAC PRIZE」というイニシアチブ等により、この製造業の暗黙知を形式知化することを推進し始める、などの施策を打ってきている状況ではある。
また、例えばトヨタは2023年に「Toyota Research Institute(TRI)」でのヒューマノイド研究を加速させた。その重点は「大規模な行動データ収集」と「熟練者の技をロボットに移転すること」だ。これは「ロボットに人間を置き換えさせる」という発想ではなく、「人間の知識をロボットを通じてスケールさせる」という発想だ。この発想の違いは、戦略的に大きな意味を持つ。(出典:Toyota Research Institute Press Release, "TRI Advances Large Behavior Models for Robots," 2023年)
人口減少と技術:矛盾するように見えて両立する問い
日本では「人口が減るから、ロボットが必要だ」という議論がよく聞かれる。これは一定の論理を持つが、見落としている側面もある。
人口が減ることで労働供給が減り、特定の作業を担う人材が不足する。この文脈でロボットが補完的な役割を果たすことは、理にかなっている。
しかし、ここでも「人手不足だからロボット」という直線的な思考には、いくつかの疑問が生じてしまう。
第1に、すべての人手不足がロボットで解決できるわけではない。ロボットが代替しやすい反復的な身体作業がある一方で、高度なコミュニケーション、感情的なサポート、創造的な判断が必要な仕事は、ロボットでの代替が難しく、むしろ人材育成が先決だ。
第2に、外国人労働者、女性の就労促進、高齢者の活躍、移民政策という別の選択肢との比較が必要だ。ロボット化と人材政策は排他的ではないが、どちらにどれほどの資源を振り向けるかは、政策的な選択だ。
第3に、ロボット化によって生まれた余剰の時間と労働力を、どのような生産的な活動に向けるかの設計が必要だ。「ロボットがやってくれるから人間は何もしなくていい」ではなく、「ロボットが担うことで人間が別のことに集中できる」という積極的なビジョンが必要だ。
ここは、まさに生成AIが引き起こしている課題でもある。これまでエンジニアがやっていた業務をAIが代替するようになり、本来であれば、より高度な仕事や、新規事業創出の様な活動にその時間を使っていく様なシフトが必要なのだが、それが出来ておらず人員余剰がおこっている。
「DXと外国製AIシステム」が示す先行事例
ロボット以前に、すでにAIシステムへの依存は進んでいる。多くの日本企業が、ChatGPT(OpenAI)、Copilot(Microsoft)、Gemini(Google)を業務に活用している。これらはすべて米国企業が開発したシステムであり、企業の業務データは米国のサーバーに送られる可能性がある。
この状況はフィジカルロボットの問題の縮図だ。便利だから使う。しかし使うことで、自社の重要な業務知識・顧客データ・意思決定パターンが、外部のAIシステムに蓄積されていく。これが長期的に何を意味するかを、組織として意識している企業はまだ少ない。
ヒューマノイドが職場に入ってくるとき、同じ構造がより物理的に、より広範な領域に展開される。デジタルデータの問題に今から向き合う経験は、フィジカルデータの問題への準備にもなる。
第12章 選択という問題の再定義

「自由な選択」の前提条件
ロボットが一台、店頭に並んでいたとしよう。価格は手頃で、家事を手伝ってくれる。購入するかしないかは、個人の自由な選択だ。少なくとも、表面上はそう見える。
しかし本書を通じて積み上げてきた議論を踏まえると、この「自由な選択」を別の角度から見ることができる。
そのロボットを購入することは、そのロボットを製造した企業のデータ収集に参加することでもあるかもしれない。家庭内の行動パターン、生活リズム、空間の使い方、家族構成員の動き。これらはロボットのセンサーによって記録され、より高度なAIの学習資源になる可能性がある。
この可能性は「仮定」ではなく、すでに起きている現実だ。スマートスピーカー(Amazon Echo、Google Nest)は、家庭内の音声データを収集している。スマートテレビは視聴習慣を記録している。スマートフォンは位置情報と行動を追跡している。ロボットが家庭に入ることは、この収集の範囲を物理的な行動全般に拡大することを意味する可能性がある。
個人はそのことを知っているだろうか。知った上で選択しているだろうか。
情報の非対称性という構造問題
経済学者のジョージ・アカーロフは1970年の論文「レモンの市場」で、情報の非対称性が市場の機能不全を引き起こすことを示した。中古車市場において、売り手は車の状態を知っているが、買い手は知らない。この非対称性が、良質な車(peach)を市場から駆逐し、欠陥車(lemon)だけが残る現象をもたらすという洞察だ。(出典:George Akerlof, "The Market for Lemons: Quality Uncertainty and the Market Mechanism," Quarterly Journal of Economics, 1970年)
ロボットとデータの問題においても、同種の情報の非対称性が存在する。
企業側は、ロボットがどのようなデータを収集し、それをどのように使うかを知っている(あるいは、まだ決まっていないとしても、将来的な利用可能性を見越して設計している)。消費者側は、プライバシーポリシーの文書を読んでも、その実態を完全には理解できない。この非対称性は、「自由な選択」の前提条件を損なう。
合成の問題:個の合理と全体の帰結
また、よく知られた理論ではあるが、経済学に「合成の問題(Fallacy of Composition)」という概念がある。個人にとって合理的な選択が、全体としては不合理な結果を招くという現象だ。
映画館でみんなが座って映画を見ているとき、一人が立ち上がれば良く見える。しかし全員が立てば、全員が見づらくなる。銀行の取り付け騒ぎも同様だ。一人の預金者が「不安だから引き出そう」と合理的に判断する。しかし全員が同じ判断をすると、銀行は倒産し、誰も得をしない。
ロボットの普及においても、同様の構造が働く可能性がある。各家庭が「より便利な生活のために」ロボットを導入することは、個人レベルでは完全に合理的だ。しかしその集積として、特定の主体への行動データの集中が起き、それが特定企業や国家の交渉力を強化するとすれば、それは個々の意図とは異なる社会的帰結をもたらす。
重要なのは、誰も悪意を持って行動していないという点だ。各人が合理的に行動した結果として、合成の問題が生じる。だからこそ、個別の選択の倫理ではなく、社会全体の制度設計が重要になる。
見えにくい関与の構造
こう言うと、「では使わなければいい」という反論が生まれるかもしれない。しかし現実はそう単純ではない。
スマートフォンを持たない生活を想像してほしい。地図アプリが使えない。電子マネーが使えない。多くのサービスへのログインに認証アプリが必要になる。テレワークが難しくなる。社会参加のコストが劇的に上がる。技術が社会インフラになってしまうと、「使わない」という選択は名目上は自由でも、実質的なコストが高い選択になる。
ロボットも同じ道をたどる可能性がある。介護施設でロボット支援が標準になり、それ前提でスタッフの人員配置が変わる。工場でロボット協調が標準になり、そのシステムに接続しない企業はサプライチェーンから外される。家庭サービスがロボット経由になる。最初は選択肢だったものが、やがてインフラになる。その時点で「参加するかしないか」の選択は、もはや対等ではない。
本当の選択に必要なもの
これから正しい選択をしていくためには、2つの条件が必要なのではないか。
正しい選択肢の存在と、その選択肢が何を意味するかについての十分な理解だ。
前者は今のところ満たされている。ロボットを買うか買わないか、どのロボットを選ぶか、選択肢は複数ある。
問題は後者だ。特定のロボットを選ぶことが、どのようなデータ構造に参加することを意味するのか。そのデータが将来どのように使われる可能性があるのか。その使われ方が社会全体としてどのような帰結を生む可能性があるのか。これらについての理解が、消費者に、市民に、社会に、十分に提供されているかどうか。
もしこの理解が不十分なまま選択が進むとすれば、それは本当の意味で正しい選択、自由な選択をしているとは言えない。
これは「個人の責任」ではない。
それは国力に関わるフィジカルなデータ層をどこに託すのかという選択である。それを個人の責任に帰することは、あまりにも思慮がない。
技術企業は自社のデータ収集の実態を開示する責任を持つ。規制当局はその開示が意味を持つ形で行われるよう監督する責任を持つ。研究者と教育者は、市民が技術を批判的に理解できるよう助ける責任を持つ。
第13章 ヒューマノイドは何のためにあるのか

問いの終点
最終章である。
出発点は「便利な未来」という、あたりまえに見えたビジョンだった。
第1章では、そのビジョンに込められた「楽になること=良いこと」という前提を疑い、洗濯機のパラドックスのような反例を見た。
第2章と第3章では、人型であることの根拠を問い直し、現実の産業ではむしろ専用化が主流であること、そして人型への偏愛に認知バイアスが関与している可能性を確認した。
第4章と第5章では、汎用性という概念を解体し、経済学の原理から見てもロングテール需要の実態から見ても、汎用ロボットへの需要が自明ではないことを示した。
第6章以降では、視点をAIの学習とデータ競争に移し、身体が持つ知識論的な意味から、プラットフォーム経済学、囚人のジレンマ型の競争加速、国家覇権争いまで、多層的な構造を見てきた。
これだけ丁寧に掘り下げてきたのは、「ヒューマノイドとは何か」という問いに対して、簡単な答えではないからである。
この技術は、同時に複数の文脈に属しており、それぞれの文脈で異なる意味を持つ。
3つの顔を持つ技術
ヒューマノイドロボットには、少なくとも三つの顔がある。
第1の顔:生活支援の技術
家事の代替、労働の補助、高齢者の介護支援。この観点では、ヒューマノイドは長年の技術革新の延長線上にある。洗濯機や食洗機のように、特定の作業負担を軽減する。この文脈においては、需要の強さ、コストの妥当性、安全性、利用者のプライバシーという観点から評価される。
この評価において重要なのは、「技術的に可能か」ではなく「求められているか、そしてその需要に応える最善の手段は何か」という問いだ。介護の負担軽減に汎用ヒューマノイドが最善か、あるいは特定の作業に特化した補助機器の方が優れているか。これは実証的に検証すべき問いだ。
第2の顔:ロングテール自動化の手段
これまでコスト的に成立しなかった多様な小規模作業を、共通のハードウェアとソフトウェアで対応可能にする。ビジネスモデルとして見れば、「プラットフォーム化された身体」だ。ハードウェアを製造・展開する企業が、その上で動作するソフトウェア(行動知識)の開発と販売を管理する。
この文脈では、どのソフトウェアがどのロボット上で動くかを管理するプラットフォームの設計が、最も重要な競争軸になる。Apple対Googleの構図がiOSとAndroidで繰り広げられたように、ヒューマノイドのプラットフォーム戦争が起きる可能性がある。
第3の顔:データ収集インフラ
現実世界における行動データの最大収集機として、AIの進化を支える基盤技術。この観点では、人間の便利さよりも、AIの学習資源の確保という論理が前面に出てくる。ロボットの展開先は「最も需要が高い場所」ではなく、「最も多様なデータが取れる場所」という基準で選ばれる可能性がある。
この顔が最も見えにくいが、おそらく最も強力な推進力だ。なぜなら、人間の需要がそれほど強くなくても、データの価値という観点からロボット展開のインセンティブが生まれるからだ。逆に言えば、ロボットが「人間のため」に見えながら、実際には「AIのため」に動いているという状況が生まれる可能性がある。
3つの顔の評価基準が一致しない問題
重要なのは、これら3つの顔が異なる評価基準を必要とするという点だ。
第1の顔(生活支援)を評価するには、利用者の生活の質、安全性、コスト、プライバシーが基準になる。
第2の顔(ロングテール自動化)を評価するには、ビジネスモデルの持続可能性、市場競争の公正性、サプライチェーンへの影響が基準になる。
第3の顔(データ収集インフラ)を評価するには、データ主権、競争政策、安全保障、個人情報の扱いが基準になる。
これらの基準は、必ずしも同時に満たされない。
データ収集を最大化する設計は、プライバシーを最大限尊重する設計と相反する可能性がある。
ロングテール自動化に最適化した展開は、特定の雇用を置き換えることになる可能性がある。
生活支援として最善のロボットが、データ収集インフラとして見ると欠陥のある設計かもしれない。
したがって、ヒューマノイドの導入を評価する際には、どの観点を重視するのかを明示する必要がある。「便利そうだから良い」という評価は、第1の顔だけを見ている。その背後にある第3の顔まで含めて評価してこそ、真の判断と言える。
意図と帰結のズレが生む責任の問題
もう一つ、見落とせない点がある。個人の意図と社会的帰結が必ずしも一致しないという問題だ。
ロボットを買う人は、たいてい「便利になりたい」と思って買う。ロボットを作る企業も、多くの場合、便利な製品を提供することに純粋な意欲を持っている。研究者は技術的な挑戦に取り組む知的興奮で開発を進める。しかし、そうした個別の意図の集積として、データの集中、競争構造の強化、国家間の覇権争いが進行する可能性がある。
誰も「悪役」になろうとしていない。にもかかわらず、構造的な力が社会を特定の方向に押し流す可能性がある。これを「意図せぬ帰結の問題」と呼ぶ。
この力学を制御するのは個人ではない。
個人が完全な情報を持たないまま選択している状況では、個人の責任には限界がある。必要なのは、社会的な制度設計だ。データの収集と利用に関する透明性の義務付け、競争政策による独占の防止、データ主権の保護、AIの利用に関する基準の設定。これらは、技術の発展に伴って更新され続ける必要がある社会的な契約だ。
前提を問い直すことの実践的な意味
本書は、ヒューマノイドロボットに賛成か反対かという答えを出さない。この技術が良い・悪いという評決を下すことは本書の目的ではないし、そもそもその問い立て自体が単純すぎる。
本書が求めてきたのは、別のことだ。自明とされてきた前提を可視化すること。「そうなって当然」と思われていたことを、一度保留して問い直すこと。技術の表面的な便利さの裏に、どのような構造と論理が働いているかを、なるべく正確に見ること。
これは批判のための批判ではない。前提を問い直せる人間は、構造を意識した上で選択できる。その「意識した選択」の積み重ねが、技術の方向を社会の側から微調整する力になる。完全に制御することはできないが、全く無力でもない。
1990年代のインターネット黎明期に、「プライバシーはどうなるのか」「情報の独占が起きないか」「民主主義への影響は」という問いを、もっと多くの人が声に出していたら、今のGAFAM独占の状況は少し違っていたかもしれない。同じことをヒューマノイドの黎明期である今、繰り返さないために。
最後の問い
旅の終わりに、最初に立てた問いに戻ろう。
ヒューマノイドロボットは、何のためにあるのか。
それは生活を便利にするための技術なのか。それとも、ロングテール市場を席巻するためのプラットフォームなのか。あるいは、次世代AIの学習データを大規模に集めるためのインフラなのか。あるいはその複数が同時に成立しているのか。
答えは、おそらく「すべてが同時に成立している」だ。ただし、それぞれの重みが、誰の立場から見るかによって違う。人間の利用者にとっては第一の顔が重要だ。技術企業にとっては第二の顔が重要だ。AIの開発者とデータを戦略的資源として見る人々にとっては第三の顔が重要だ。国家の政策立案者にとっては三つすべてが重要だ。
そしてもっと根本的な問いとして。私たちは今、この技術を受け入れようとしているが、それは十分な理解の上でなされる選択なのか。それとも、「便利そう」という感覚と「避けられない流れ」という諦観に乗せられているだけなのか。
この問いに対する答えは、一人ひとりが考えるべきものだ。ただ、その考えを始めるために必要な視点を、本書が少し提供できたなら、書いた甲斐があったというものだ。
問いは、まだ終わらない。
おわりに 問いを持ち続けること

本書を書いた理由は、単純だ。
ヒューマノイドをめぐる議論が「すごい技術が来る」という興奮か、「仕事が奪われる」という恐怖のどちらかに偏りすぎていると感じたからだ。どちらの反応も、表面的な現象に対する反射であって、その背後にある構造を問う視点が弱い。
本書で提示した問いの多くは、現時点では明確な答えを持たない。ロングテール需要がどれほど強いのか、フィジカルデータが競争優位にどれほど貢献するのか、国家間競争がどのような帰結をもたらすのか、これらはこれから数年から数十年にわたって明らかになっていく事実だ。
しかし、問いを持っていることと持っていないことでは、その「明らかになっていく事実」の受け取り方が根本的に変わる。問いを持つ人間は、新しい事実を自分の考えの中に位置づけ、理解を更新していける。問いを持たない人間は、事実に流されるだけだ。
AIとロボットが加速する時代は、まさに今始まっている。この技術の恩恵を受けながら、同時にその構造を理解しようとする人間が増えれば、この技術の未来は少し変わるかもしれない。た。
問いを持ち続けること。それが、技術が加速する時代に生きる人間に求められる、最も重要な知的態度の一つだと、著者は考えている。
主な参考文献・出典
Goldman Sachs Global Investment Research, "Humanoid Robots: A Revolution in the Making," 2023年
Morgan Stanley Research, "Humanoid Robots: The Next Transformational Technology," 2023年
International Federation of Robotics (IFR), "World Robotics 2023: Industrial Robots"
Ruth Schwartz Cowan, "More Work for Mother: The Ironies of Household Technology from the Open Hearth to the Microwave," 1983年
Mihaly Csikszentmihalyi, "Flow: The Psychology of Optimal Experience," 1990年
Michael Polanyi, "Personal Knowledge: Towards a Post-Critical Philosophy," 1958年
Maurice Merleau-Ponty, "Phenomenologie de la perception," 1945年
The Economist, "The world's most valuable resource is no longer oil, but data," May 6, 2017年Adam Smith, "An Inquiry into the Nature and Causes of the Wealth of Nations," 1776年
Daniel Kahneman, "Thinking, Fast and Slow," 2011年
George Akerlof, "The Market for Lemons: Quality Uncertainty and the Market Mechanism," Quarterly Journal of Economics, 1970年
Jean-Charles Rochet and Jean Tirole, "Platform Competition in Two-Sided Markets," Journal of the European Economic Association, 2003年
Tanya Chartrand & John Bargh, "The Chameleon Effect: The Perception-Behavior Link and Social Interaction," Journal of Personality and Social Psychology, 1999年
森政弘「不気味の谷」Energy誌、1970年
OpenAI, "Language Models are Few-Shot Learners," NeurIPS 2020年; GPT-4 Technical Report 2023年
Chris Miller, "Chip War: The Fight for the World's Most Critical Technology," 2022年
U.S. Department of Commerce, Bureau of Industry and Security, Advanced Computing Chips Export Controls, October 2022年
National AI Initiative Act, U.S. Public Law 116-283, 2020年
中国国務院「新一代人工智能発展規画」2017年
EU Artificial Intelligence Act, Regulation (EU) 2024/1689, 2024年
日本内閣府「AI戦略2022」2022年
Boston Consulting Group, Bruce Henderson, "The Experience Curve," 1968年
Figure AI, BMW Factory Partnership Press Release, March 2024年
Amazon Robotics, "More than 750,000 Robotic Systems Deployed Across Our Operations," 2023年


