2026年05月16日 朝のAIニュースまとめ
(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください
ChatGPTの財務管理機能とClaude Codeの自律タスク実行の進化
OpenAIがChatGPTに銀行口座と連携するパーソナルファイナンス機能を公開し、AIエージェントの新たな可能性を示しました。
一方、AnthropicのClaude Codeは自律的なアプリ構築や自動リサーチで高い性能を発揮し、注目を集めています。xAIも次期Grokモデルの準備を進めています。
本日の主要なトピックの詳細を順に確認していきましょう。
目次
- ChatGPTパーソナルファイナンス機能が公開【続報】
- Claude Codeの/goalによるNext.js構築デモが話題【続報】
- CodexがLocked use機能を開発中【続報】
- Claude Codeが自動リサーチでCodexを圧倒
- xAIが1.5Tパラメータの次期Grokモデルを準備中
- AnthropicのARRが450億ドルに急成長【続報】
- GPT-5.5の性能低下報告に対しCodexチームが調査
- EYがAIの幻覚を含む調査レポートを撤回
- v0がブラウザ操作機能Browser Useを導入
- Googleがチップ内製化に向けTSMCと直接交渉か【続報】
- チューリングがDriveHeronの公道走行動画を公開【続報】
ChatGPTパーソナルファイナンス機能が公開【続報】
- ChatGPTのパーソナルファイナンス機能に関する続報です。
- OpenAIが米国の一部のProユーザー向けに、個人の財務管理ができる新機能を公開しました。
- Plaid経由で銀行口座や証券口座を連携し、支出のダッシュボード表示やGPT-5.5による財務データの分析が可能になります。
- サードパーティのFinTechアプリを代替する強力な機能として、AIが個人のエージェントとして機能する未来への大きな一歩と評価されています。
🚨 AI News | TestingCatalog: (翻訳) OPENAI 🔥: 米国のPro ChatGPTユーザー向けに新しいパーソナルファイナンス機能が展開されています。この機能により、ユーザーは財務データ(銀行口座、Robinhoodなど)をChatGPTに接続し、財務に関する質問をすることができます。
Chubby♨️: (翻訳) OpenAIは今日、文字通り多くのフィンテックスタートアップを終わらせました。OpenAIは米国のProユーザー向けにChatGPTのパーソナルファイナンス機能を立ち上げました。Plaid経由で銀行口座を接続し、支出ダッシュボードを取得し、実際の取引データに基づいた質問をGPT-5.5にすることができます。
Greg Brockman: (翻訳) ChatGPTで個人の財務を理解し管理しましょう。ChatGPTがあなたのパーソナルエージェントとなり、家庭や職場であなたを助けるために24時間365日代行して動く未来へのさらなる一歩です。
Claude Codeの/goalによるNext.js構築デモが話題【続報】
- AnthropicのClaude Codeに追加された「/goal」コマンドに関する続報です。
- この機能を用いて、フルスケールのNext.jsアプリを30分強で自律的に構築したデモが開発者の間で大きな話題を呼んでいます。
- AIがサブタスクに気を取られて無限ループに陥る問題が解決され、自律的なタスク実行能力が大幅に向上していることが実証されました。
CyrilXBT: (翻訳) CLAUDE CODEが、すべての開発者がAIエージェントで抱える最大の問題を解決する機能を出荷しました。問題:Claudeがタスクを開始し、サブ問題に気を取られ、ウサギの穴に落ちて、最初に頼んだことを決して終わらせない。解決策:/goal
CyrilXBT: (翻訳) 🚨 AIのお守りをするのはやめましょう。「プロンプト・返答・プロンプト」の時代は終わりました。AnthropicはClaude Codeの/goalコマンドでゲームを変えました。Chris Ashbyは、32分の自律実行で6フェーズ62タスクにわたるフルスケールのNext.jsアプリの構築を実演しました。
CodexがLocked use機能を開発中【続報】
- Codexに関する続報です。
- Macがロックされた状態でもバックグラウンドで動作させる「Locked use」機能を開発していることが判明しました。
- 移動中やPCを閉じている間でも、長時間のタスクを継続して実行させることが可能になります。
- 常にPCを開いたまま持ち歩く必要がなくなる画期的なアップデートとして期待が寄せられています。
🚨 AI News | TestingCatalog: (翻訳) OpenAIは、ユーザーが「Locked use」を有効にできるようにCodexの専用設定に取り組んでいます。 > ロック中もCodexにMacを使用させる。 もう半分開いたノートPCを持ち歩く必要はありませんか?
Chubby♨️: (翻訳) Codexの「Locked use」がやってきます。おそらく昨日のOpenAIの画像を説明するものです。「ロック中もCodexにMacを使用させる」
Claude Codeが自動リサーチでCodexを圧倒
- AIによる自動リサーチタスクにおいて、Claude Code (Opus 4.7) と Codex (GPT 5.5) の性能比較が行われました。
- nanoGPTの最適化タスクを自律的に実行させた結果、Opusが人間のベースラインを上回り、Codexを圧倒したと報告されています。
- Anthropicの最新モデル「Mythos」を用いればさらに差が開くとの見方もあり、両社のエージェント性能競争に注目が集まっています。
Philipp Singer: (翻訳) 自動リサーチにおいてOpusはCodexよりもはるかに優れており、現時点では勝負にすらなっていません。
Lisan al Gaib: (翻訳) Claudeの圧倒的な勝利
Lisan al Gaib: (翻訳) Mythosを使えばどれほど圧倒的な勝利になるか想像してみてください。これは、OpenAIが今年より速いモデルサイクルで先行していることに対するわずかなアップデートです。
xAIが1.5Tパラメータの次期Grokモデルを準備中
- Elon Musk氏が、xAIの次期ファウンデーションモデル(社内バージョン9)が1.5Tパラメータの規模になることを明らかにしました。
- 現在のGrok 4.2などがベースとする0.5Tのモデルから、データキュレーションや学習手法を含めあらゆる面で大幅な進化を遂げているとのことです。
- トップクラスのコーディングエージェントと競合するよう最適化されており、数週間以内のリリースが予想されています。
Tech Dev Notes: (翻訳) 今後の1.5T GrokモデルについてのElonの発言
Rohan Paul: (翻訳) 「(現在の)Grokファウンデーションモデル8と9の違いは巨大です。」〜 Elon Musk。Grok V9は、トップのコーディングエージェントと競合するために構築された3倍の大きさのファウンデーションモデルです。
Haider.: (翻訳) Elonの説明の後、Grok 4.5 / 5はより面白そうに見えます。公開されているGrok 4.2はまだ古い0.5Tのv8ファウンデーションモデルに基づいているため、彼は基本的に次のGrokモデルがはるかに大きな飛躍になることをほのめかしています。しかし、新しい内部のv9モデルは: - 約1.5Tパラメータ -
AnthropicのARRが450億ドルに急成長【続報】
- Anthropicの急成長に関する続報です。
- 評価額が9000億ドルに達した同社ですが、年間経常収益(ARR)もわずか3ヶ月で90億ドルから450億ドルへと約5倍に成長していることが報じられました。
- 使用量ベースの価格設定への移行により顧客のコスト負担は増していますが、生産性向上のメリットが上回ると判断され利用が継続されています。
Chubby♨️: (翻訳) Anthropicの概要: 評価額:2026年2月:$350B、2026年5月:$900B。わずか3ヶ月でほぼ3倍。 ARR:2025年末:$9B、2026年5月末:$45B。5ヶ月でほぼ5倍。 なんてこった。FTより
The Information: (翻訳) コストの急増にもかかわらず顧客がClaudeに支払い続けているため、Anthropicは真の価格決定力を示しています。
The Information: (翻訳) Anthropicの使用量ベースの価格設定への移行により、顧客は予測不可能なAIの請求を吸収せざるを得なくなっています。多くの人は、Claudeがコストを正当化するのに十分な生産性を向上させることができると賭けて、とにかく支払っています。
GPT-5.5の性能低下報告に対しCodexチームが調査
- 一部のユーザーから、GPT-5.5のパフォーマンスが以前より低下しているとの報告が相次ぎ、Codexチームが調査に乗り出しました。
- 現時点でシステムは正常に稼働しており決定的な原因は見つかっていませんが、チームは引き続き状況を監視しアップデートを共有するとしています。
- Sam Altman氏もこの件に言及し、ユーザーからのフィードバックに真摯に向き合う開発チームの姿勢を高く評価しています。
Tibo: (翻訳) Codexチームは、一部のユーザーでGPT-5.5のパフォーマンスが低下しているという報告を認識しており、調査中です。まだ決定的なものはなく、システムは正常ですが、随時アップデートを共有します。
Sam Altman: (翻訳) チームが常にこれらの報告を真剣に受け止めていることに感謝します(答えが「現在の魔法のレベルに慣れてしまったので、もっとお願いします」であることが判明した場合でも)。
EYがAIの幻覚を含む調査レポートを撤回
- コンサルティング大手のEY(アーンスト・アンド・ヤング)が、サイバーセキュリティ事業の宣伝に使用した調査レポートを撤回しました。
- レポート内にAIのハルシネーション(幻覚)によって生成された架空のデータや、存在しないMcKinseyのレポートの引用が含まれていたことが発覚したためです。
- 企業がAIを業務に活用する際の品質管理やファクトチェックの重要性を改めて浮き彫りにする事例として注目されています。
Financial Times: (翻訳) 研究者がAIの幻覚を発見した後、EYは調査を撤回しました
Financial Times: (翻訳) カナダのEYコンサルタントがサイバーセキュリティ事業のマーケティングに使用したこの調査は、架空のデータを使用し、誤った引用を行い、存在しないMcKinseyのレポートを参照していました。
v0がブラウザ操作機能Browser Useを導入
- Vercelの生成AIツール「v0」に、新たに「Browser Use」機能が導入されました。
- v0自身が構築したアプリケーションをブラウザ上で実際に開き、デザインの評価や複雑なフローのデバッグ、プロアクティブな修正を行うことが可能になります。
- 作業中にはv0が見ている画面のスクリーンショットがユーザーに送信されるため、エージェントの動作プロセスを視覚的に確認できます。
v0: (翻訳) v0 Browser Useの紹介。v0は、構築したアプリを開き、使用し、デザインを批評し、複雑なフローをデバッグし、プロアクティブに修正できるようになりました。作業中、v0は見ているもののスクリーンショットを送信します。
Googleがチップ内製化に向けTSMCと直接交渉か【続報】
- GoogleのカスタムAIチップ内製化に関する続報です。
- 半導体製造大手のTSMCに対し、直接の主要顧客になりたいとの意向を伝えたと報じられています。
- 現在依存しているBroadcomやMediaTekを迂回し、AppleのようなCOT(Customer Owned Tooling)モデルへの移行を目指す動きと見られます。
- AIインフラの要となるカスタムチップの設計・製造において、サプライチェーンの支配力を強めようとする狙いが伺えます。
Jukan: (翻訳) しかし、内部的には、BroadcomとMediaTekの両社は依然として、GoogleのCOTモデルへの移行を遠い未来の脅威と見なしているようです。
Rihard Jarc: (翻訳) 今後5年間で、GoogleとAmazonが設計チェーンを支配するため、半導体分野は大きく異なるものになるでしょう... AmazonとGoogleのチップビジネスを妨げている最大の要因はサプライチェーンのボトルネックですが、それは永遠には続きません。
チューリングがDriveHeronの公道走行動画を公開【続報】
- 自動運転スタートアップのチューリングに関する続報です。
- End-to-End(E2E)自動運転モデル「DriveHeron」の公道走行の様子を公開しました。
- 他車に道を譲る、降車する人を待つ、路肩の障害物を避けるなど、人間のような柔軟な判断をAIが行う様子が確認できます。
- 同社は近日中にYouTube Liveを開催し、公道走行実現までの取り組みやモデルの性能向上についてさらに深掘りする予定です。
Yu Yamaguchi | チューリング CTO: 来週5/20水 18:00、「実車で動かすVLAモデル / 公道走行実現とその先の進化」をYouTube Liveで開催します! 自動運転VLAモデル「DriveHeron」の公道での走行が実現するまでの取り組みをはじめ、更なる性能の向上、さらにはAlpamayoとの比較も含め深堀りします👇
Yu Yamaguchi | チューリング CTO: チューリングのE2E自動運転の一例です。 他の車に道をゆずる、降車する人を待つ、路肩の台車を避ける、…人間なら何気なくできる判断も、自動運転では難しいシーンになりえます
K_mat: カッコよい…! 関係ないけど、地味にカメラが気になってしまう。途中ノイズかと思ったけど鳥が飛んでるのが止まって見えるし、シャッタースピードはやそう👀自動運転ってグローバルシャッター? あとなんか画像がノッペリしている気がするけど気のせいなのかな。