2026年05月29日 夜のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

Microsoftの独自コーディングモデル発表とAppleのGeminiオンデバイス実行計画

Microsoftが独自のコーディングモデルを発表する動向や、AppleがGeminiをオンデバイスで実行するライセンスを取得した話題に注目します。

また、Claude Codeの新たな調査コマンド追加や、SpaceXによるAIトレーニングスタックの自社開発など、開発環境の進展も見逃せません。

本日の主要なトピックを順番に掘り下げていきましょう。

目次

  1. Claude Opus 4.8の評価とClaude Code新機能【続報】
  2. Microsoftが独自のコーディングモデルを発表へ
  3. Apple、Geminiのオンデバイス実行ライセンス取得【続報】
  4. ChatGPTとCodexがMCPインストラクションに対応【続報】
  5. Codex iOSアプリに/side会話機能など追加【続報】
  6. SpaceXがC言語でAIトレーニングスタックを自社開発
  7. Kaggle CLI更新でDiscussionの取得が可能に
  8. Gemini Omniの利用制限バグ修正と生成枠倍増【続報】
  9. ElevenLabsが感情を維持するDubbing v2を発表
  10. LLM内部に色や感情の幾何構造が自然発生する研究

Claude Opus 4.8の評価とClaude Code新機能【続報】

  • Anthropicの「Claude Opus 4.8」に関する続報です。
  • GPT-5.5には及ばないものの、オーケストレーション能力が高いと評価されています。
  • Claude Codeには「ultracode」エフェクトや、複数エージェントを自動起動して調査を行う /deep-research コマンドが追加されました。
  • また、公式プロンプトガイドが更新され、コーディングエージェント用途では xhigh 設定が推奨されています。
Haider.: (翻訳) GPT-5.5は依然としてSOTAモデルです。Opus 4.8は優れたモデルであり、Opus 4.7からのマイナーアップグレードです。コーディングと検索が高速化されています。GPT-5.5と比較するとスコアはわずかに高いだけですが、GPT-5.5-highは約3分の1のトークン数でパフォーマンスの低下は約2パーセントポイントにとどまります。

Oikon: /deep-research というClaude Code の Changelogに記載がないコマンドが入ってますね。公式ドキュメントには記載ありました。\n\n新機能の Dynamic workflow を試せるコマンドで、複数の情報源から調査して、1つのレポートを受け取ることができるコマンドみたいです。

スモビジ開発ラボ: Claude Codeの『/deep-research』が優秀すぎる。\n\n"101体"のエージェントが自動で起動し、\n最新の海外AIビジネス成功事例の並列調査&ファクトチェックして結果をまとめてくれた\n\n1回の調査で340万トークン消費したので、\n多用はできないが、本気の調査にはお勧め。

Microsoftが独自のコーディングモデルを発表へ

  • Microsoftが来週、OpenAIのモデルに依存しない自社開発の新しいコーディングモデルを発表する予定であると報じられています。
  • CursorやClaude Codeに対抗し、GitHub Copilotをより安価で競争力のあるものにするためのテストとなります。
The Information: (翻訳) Microsoftは、CursorやClaude Codeに対して巻き返しを図るため、来週新しいコーディングモデルを発表する計画です。この発表は、同社の社内AIがGitHub Copilotをより安価で競争力のあるものにできるかどうかを試すものとなります。

The Information: (翻訳) Microsoftは独自のコーディングモデルでAI攻勢をかけています。「Microsoftは、OpenAIのモデルから派生したものではない、自社開発の新しいAIモデルをいくつかリリースする計画です...」

Apple、Geminiのオンデバイス実行ライセンス取得【続報】

  • AppleのGoogle Gemini採用に関する続報です。
  • Geminiモデルを自社デバイス上で直接実行するためのライセンス権を取得したと報じられています。
  • モデルを縮小してオンデバイスで動作させる計画であり、同社のAI戦略において重要な一歩となります。
The Information: (翻訳) AppleはGoogle Geminiモデルを自社デバイスに直接、密かに導入しようとしています。「彼らはそのためのライセンス権を取得しており、デバイス上で実行できるようにモデルを縮小する予定です。」

ChatGPTとCodexがMCPインストラクションに対応【続報】

  • ChatGPTとCodexのMCP連携に関する続報です。
  • 新たにMCPサーバーインストラクションをサポートするようになりました。
  • MCPサーバーが標準の instructions フィールドを返すことで、サーバー全体やツール間でのガイダンスをモデルに提供できるようになります。
jason: (翻訳) MCPビルダーにとってエキサイティングなニュースです。(引用:ChatGPTとCodexがMCPサーバーインストラクションをサポートしました!MCPサーバーは標準の instructions フィールドを返すことで、Codex/ChatGPTにサーバー全体やツール間のガイダンスを提供できます。)

Codex iOSアプリに/side会話機能など追加【続報】

  • OpenAIのCodex iOSアプリに関する続報です。
  • 大規模なアップデートが配信され、現在のコンテキスト上で一時的な質問ができる「/side」会話機能が追加されました。
  • また、ワンタップでのモデル切り替えやiPadショートカットなども実装され、モバイル環境での利便性がさらに向上しています。
Vaibhav (VB) Srivastav: (翻訳) Codex Mobile iOSの大型アップデート:- /side 会話 - ターン終了時の差分サマリー - アーカイブされたリモートスレッド - ワンタップでのモデル切り替え - Spotlight + ショートカット - iPadショートカット - 画像の保存/コピー - セットアップ/再接続フローの改善 - デスクトップと同等の多数のブラッシュアップ

SpaceXがC言語でAIトレーニングスタックを自社開発

  • SpaceXがC言語を用いて、インハウスのAIトレーニングスタックV1.0をほぼ完成させたと報告されています。
  • 22万基のGB300にマッピングされ、ベアメタルに近いレベルでパイプライン並列処理を多用することで、大規模な学習においてJAXを上回る速度向上が期待されています。
Christopher Manning: (翻訳) それならGrok v6はより高速にするためにPTXで書かれ、さらに高速化するためにGrok v7はSASSで書かれるかもしれない...(引用:SpaceXは、22万基のGB300と800G NICに正確にマッピングされるC言語による社内AIトレーニングスタックV1.0の記述をほぼ完了しました。パイプライン並列処理を多用し、可能な限りベアメタルに近づけています。)

Kaggle CLI更新でDiscussionの取得が可能に

  • Kaggle CLIがアップデートされ、playwright-cliを使用せずにDiscussionを取得できるようになりました。
  • 競技者にとって便利になる一方で、CLI経由での閲覧が増えることでDiscussionの活気が失われるのではないかと懸念する声も上がっています。
rt4kaido: アプデされたkaggle-cli早速触ってる。playwright-cli使わなくてもdiscussion取れるのありがて〜

: kaggle cli で discussion 取れるの、便利になるけど discussion に参加する人減ったりしないかちょっとだけ心配かな。 comment じゃなくても reaction(スタンプ)とか vote ちょっとしたことで discussion に活気が出るが、みんなが cli を通してしか discussion を見なくなったらどうなるんかな

Gemini Omniの利用制限バグ修正と生成枠倍増【続報】

  • Gemini Omniの利用制限(クォータ)に関する続報です。
  • 1〜2回のビデオ生成で制限に達してしまうバグが修正されました。
  • また、UltraユーザーのOmni生成枠が2倍に拡大され、失敗したリクエストはカウントされなくなりました。
Rohan Paul: (翻訳) GoogleはGeminiの使用量/クォータ制限に関するいくつかの問題を修正しました。- 最大の問題は、バグにより1つか2つのOmniビデオで一部のユーザーの制限を使い果たしてしまうことでした。UltraユーザーはOmniの生成枠が2倍になりました。- Proのプロンプトにはプロンプトごとのクォータ上限が設けられました。- 失敗したリクエストはカウントされません。

ElevenLabsが感情を維持するDubbing v2を発表

  • ElevenLabsが新しい「Dubbing v2 Alpha」モデルを発表しました。
  • 元のコンテンツの感情やパフォーマンスを維持したまま、すべての言語間で音声を翻訳できるようになり、クリエイターにとって大きな進展となります。
🚨 AI News | TestingCatalog: (翻訳) ElevenLabsは、元のコンテンツの感情的なトーンを維持しながら、すべての言語間で音声を翻訳できる新しいDubbing v2 Alphaモデルを発表しました。クリエイターにとって大きなニュースです。

LLM内部に色や感情の幾何構造が自然発生する研究

  • 文字データのみで学習したLLMの内部に、色や音の高さ、感情といった人間の知覚に対応する「地図のような幾何構造」が自然に現れるという研究が紹介されています。
  • 色が色相環に近い円環構造として表れるなど、興味深い考察がなされています。
AIDB: 文字だけで学習したはずのLLMの内部に、色、音の高さ、味、感情といった人間の知覚・情動領域に対応する「地図のような幾何構造」が自然に現れると報告されています。\n\nたとえば色は人間の色相環に近い円環構造として表れ、感情は快不快や覚醒度を中心とする情動空間に沿って配置されるなど、

Subscribe to ML_Bear Times

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください