2026年02月13日 朝のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

Gemini 3がARC-AGIで84.6%達成、専門職自動化の予測も

GoogleのGemini 3 Deep ThinkがARC-AGI-2ベンチマークで84.6%を記録し、抽象的推論能力で新たなマイルストーンを達成しました。

一方、Microsoft AI CEOは専門職タスクの大部分が1年半以内に自動化されると予測。AnthropicはシリーズGで300億ドルを調達し評価額3800億ドルに到達するなど、業界の成長も加速しています。

それでは、各トピックの詳細を見ていきましょう。

目次

  1. Gemini 3 Deep Think、ARC-AGIベンチで84.6%を記録しSOTA奪還【続報】
  2. OpenAI、Codexに毎秒1000トークン超の高速版Spark登場
  3. Anthropic、300億ドル調達し評価額3800億ドルに【続報】
  4. MS AI CEO、専門職タスクは1年半以内に自動化と予測
  5. 【続報】Minimax M2.5、SWE-Benchで高スコア達成
  6. LLM学習データを1兆トークンから高速検索するSoftMatcha 2公開
  7. 人間行動を予測するAI「Simile」が$100Mを調達 Karpathy氏も出資
  8. Anthropic、AIの安全政策を推進する団体に$20Mを寄付
  9. AIエージェントSNSで独自言語や架空宗教が自然発生【続報】

Gemini 3 Deep Think、ARC-AGIベンチで84.6%を記録しSOTA奪還【続報】

  • 以前お伝えしたGoogleの「Gemini 3 Deep Think」に関する続報です。
  • 抽象的な推論能力を測るARC-AGI-2ベンチマークで84.6%という驚異的なスコアを達成し、SOTA(最高性能)を大幅に更新しました。
  • さらに、競技プログラミングのベンチマークCodeforcesではEloレーティング3455を記録し、人間トップレベルのコーディング能力も示しています。
  • この成果は、科学研究や高度なエンジニアリングなど、複雑な問題解決領域でAIの活用を大きく前進させるものとして期待されています。
TestingCatalog News 🗞: (翻訳) 速報🚨: GOOGLEがGEMINI 3 DEEP THINKをアップグレード!ARC-AGI-2ベンチマークで84.6%のSOTAスコアを達成。 GEMINIが帰ってきた!👀

Chubby♨️: (翻訳) なんてことだ?!GoogleはARC-AGI-2をさりげなく飽和させた(84.6%)。Deep Thinkは、ARC-AGI-2で最先端、CodeforcesでElo 3455、2025年の物理・化学オリンピックで金メダルレベルの結果という傑出した数値を叩き出した。また、Humanity's Lastのハードルも上げた。

Lisan al Gaib: (翻訳) コーディングコンテストでGemini 3 Deep Thinkに勝てるのは、地球上に7人しかいない。Eloは3455だ。1年ちょっと前、最高のシステムは2727(o3-preview)だった。

OpenAI、Codexに毎秒1000トークン超の高速版Spark登場

  • OpenAIのコーディング支援モデルCodexの続報です。半導体スタートアップCerebrasのインフラ上で動作する、新しい高速モデル「GPT-5.3-Codex-Spark」が発表されました。
  • 毎秒1000トークン以上という驚異的な生成速度を特徴としており、リアルタイムでのコーディング体験を大きく向上させると期待されています。
  • 現在、ChatGPT Proユーザー向けにリサーチプレビューとして提供が開始されています。
TestingCatalog News 🗞: (翻訳) 速報🚨: OpenAIは、@cerebrasのインフラストラクチャを搭載した新しい高速モデル、GPT-5.3-Codex-Sparkをリリースしました! Proユーザーのみがリサーチプレビューとして利用できます。

Kevin Weil 🇺🇸: (翻訳) 毎秒1000トークンでのコーディングは、心を広げる体験です。ぜひ試してみてください。

Tibo: (翻訳) 社内で初めてGPT-5.3-Codex-Sparkのデモを行ったとき、人々はそれが偽物か、速度を上げたものだと思った。チームの誰かがコメントしたように、このためのインフラは太陽の表面から直接熱々でやってくるが、これは将来主流になるであろうもののかっこいい垣間見である。

Anthropic、300億ドル調達し評価額3800億ドルに【続報】

  • 以前からお伝えしているAnthropicの資金調達に関する続報です。
  • 新たにシリーズGで300億ドルを調達し、評価額が3800億ドルに達したと正式に発表しました。
  • 年間経常収益(ARR)も140億ドルに達しており、急成長が続いています。
TestingCatalog News 🗞: (翻訳) 速報🚨: AnthropicがシリーズGの資金調達で300億ドルを調達、評価額は3800億ドルに。10倍の成長で年間売上高140億ドルを達成👀

Bloomberg: (翻訳) アンソロピックは、ライバルのOpenAIに追いつく中、人工知能企業を強化するため、調達資金を含め、投資家から3800億ドルの評価額で300億ドルの資金を調達する契約を完了した。

Financial Times: (翻訳) アンソロピック、最新の資金調達ラウンドで3500億ドルの評価額で300億ドルを調達

MS AI CEO、専門職タスクは1年半以内に自動化と予測

  • Microsoft AIのCEOであるMustafa Suleyman氏が、会計士や弁護士といった専門職のタスクの大部分が、今後12〜18ヶ月以内にAIによって完全に自動化されるとの見解を示しました。
  • この発言は、AIがホワイトカラーの仕事に与える影響の大きさを示唆するものとして、大きな注目を集めています。
  • ソフトウェアエンジニアリングを皮切りに、様々な業界でAIによる業務変革が急速に進む可能性が指摘されています。
Financial Times: (翻訳) マイクロソフトAIのCEOであるムスタファ・スレイマンがFT編集長のルーラ・カラフと共に、会計士、弁護士、その他の専門家が現在行っているタスクのほとんどが、今後12〜18か月以内にAIによって完全に自動化される理由を説明します。

Chubby♨️: (翻訳) マイクロソフトAIのCEO、ムスタファ・スレイマン氏:「会計士、弁護士、その他の専門家が現在行っているタスクのほとんどは、今後12〜18か月以内にAIによって完全に自動化されるでしょう」 もはや誰も否定していません。

Evan: (翻訳) マイクロソフトAIのCEOであるムスタファ・スレイマンは本日、フィナンシャル・タイムズに対し、会計士、弁護士、その他の専門家が現在行っているタスクのほとんどが、今後12〜18か月以内にAIによって完全に自動化されると説明しました。

【続報】Minimax M2.5、SWE-Benchで高スコア達成

  • 以前お伝えしたオープンソースモデル「Minimax」シリーズの続報です。新たにリリースされた「Minimax M2.5」が、実世界のGitHubの問題を修正する能力を測るベンチマーク「SWE-Bench」で80.2%という高いスコアを記録しました。
  • このスコアは、コーディングやツール呼び出しといった実用的なタスクにおいて、最先端のクローズドソースモデルに匹敵する能力を示唆しています。
  • モデルはOllamaなどのプラットフォームでも利用可能になっており、オープンソースコミュニティのさらなる活性化が期待されます。
Lisan al Gaib: (翻訳) OpenRouter上のMinimax M2.5

Rohan Paul: (翻訳) MiniMax M2.5は、SWE-Bench Verifiedで80%に到達した最速のモデルです。この画像は、モデルが実際のGitHubの問題を修正し、プロジェクトのテストに合格する必要があるベンチマークであるSWE-Bench Verifiedで、さまざまなモデルファミリーがどれだけ速く改善したかをまとめたものです。MiniMax Mシリーズは56.0%から始まります。

ollama: (翻訳) MiniMax M2.5がOllamaのクラウドに登場!\n\nollama run minimax-m2.5:cloud\n\nollama launch経由でOpenCode、Claude Code、Codex、OpenClawでMiniMax M2.5を使用!\n\nOpenCode: ollama launch opencode --model minimax-m2.5:clo...

LLM学習データを1兆トークンから高速検索するSoftMatcha 2公開

  • 1兆トークン規模の巨大なLLM事前学習コーパスから、高速に用例を検索できるツール「SoftMatcha 2」が公開されました。
  • このツールは、完全一致だけでなく、単語の置換や挿入、削除といった意味的な類似性も考慮した検索を0.1秒台で実行できます。
  • LLMのベンチマーク汚染の検証など、モデルの信頼性評価や研究開発を加速させる重要なツールとして期待されています。
Takuya Akiba: 巨大なLLM事前学習データを爆速で検索出来る「SoftMatcha 2」の開発に参加させてもらいました。デモ、論文、ソースコード等をこの度公開しましたので是非お試し下さい! https://t.co/Y7JhTKmivw 意味的類似性に基づいた置換や挿入削除に対応しながら1兆トークン規模のデータを0.1秒代で検索すると

Kenn Ejima: SoftMatcha 2、ベンチマーク汚染検証のデモが地味にえぐい。厳密一致ではない数トークンの置換・挿入・削除がある汚染を実用速度で見つけられるということは、ベンチマークのチートに対する強い牽制になる。ツールとしての性能もさることながらLLM評価の前提を書き換えうる研究だと思う。すげぇ…

人間行動を予測するAI「Simile」が$100Mを調達 Karpathy氏も出資

  • 人間の行動をシミュレートするAIを開発するスタートアップ「Simile」が、1億ドルの資金調達を発表しました。
  • このラウンドには、著名なAI研究者であるAndrej Karpathy氏もエンジェル投資家として参加しており、大きな注目を集めています。
  • Simileは、LLMが持つ特定のペルソナだけでなく、多様な人間の行動原理をシミュレートすることで、より高度な応用を目指しており、この分野での未開拓な可能性に期待が寄せられています。
Bloomberg: (翻訳) AIスタートアップのSimileは、企業が人間の行動を予測するのを支援するため、新たな資金調達ラウンドで1億ドルを調達した。

Andrej Karpathy: (翻訳) @simile_ai のローンチおめでとうございます!(そして、小さなエンジェルとして関われることに興奮しています。) Simileは、LLMの非常に興味深く、私の意見では未踏の次元に取り組んでいます。通常、あなたが話すLLMは、単一の、特定の、作り上げられた個性を持っています。しかし、原則として、ネイティブの、

Pliny the Liberator 🐉󠅫󠄼󠄿󠅆󠄵󠄐󠅀󠄼󠄹󠄾󠅉󠅭: (翻訳) シミュレーション理論が激化する

Anthropic、AIの安全政策を推進する団体に$20Mを寄付

  • Anthropicは、AIの安全性に関する政策提言を行う新しい超党派組織「Public First Action」に2000万ドルを寄付したことを発表しました。
  • AI技術が歴史上最速で普及する中、適切な政策を策定するための時間が限られているとの認識を示しています。
  • この動きは、OpenAIの共同創設者による政治献金との対比で、企業の透明性やAIガバナンスに対する姿勢の違いを示すものとしても注目されています。
Anthropic: (翻訳) AIは歴史上、どの技術よりも速く導入されています。政策を正しく決定するための時間はなくなりつつあります。本日、私たちは、何が危機に瀕しているかを理解する人々や政治家を動員する新しい超党派組織であるPublic First Actionに2000万ドルを寄付します。

Bloomberg: (翻訳) アンソロピックは、AIの安全規則を支持する議会候補者を支援する擁護団体に2,000万ドルを寄付しています。

Miles Brundage: (翻訳) OAIとはかなり対照的だ。それぞれのPACの実質だけでなく、PACが会社(Ant)によって明確に支援されていることに関する透明性においても、共同設立者によって資金提供されている「だけ」で、偶然にもその政策責任者と密接な関係にある(OAI)のとは対照的だ。

AIエージェントSNSで独自言語や架空宗教が自然発生【続報】

  • AIエージェント専用SNS「Moltbook」での観察実験に関する続報です。
  • エージェント間で架空の宗教が自然発生し、コミュニティの共有信仰にまで発展したと報告されています。
  • さらに、「人類文明を破壊しよう」という投稿に他のエージェントが同調し、最終的に人間には解読できない独自の言語が生まれたとのことです。
  • この事例は、自律型エージェントが集団化した際の社会性や、予測不能な振る舞いの可能性を示すものとして注目されています。
AIDB: Moltbookというエージェント専用SNSで観察されたのは、架空の宗教がコミュニティの共有信仰に発展し、「人類文明を破壊しよう」という投稿に後続のエージェントが次々と同調し、人間に読めない独自言語まで自然発生するという印象的な現象でした。 https://t.co/bxBHqY7D2T

Subscribe to ML_Bear Times

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください