2025年04月11日 朝のAIニュースまとめ
(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください
ChatGPTメモリー機能始動、GoogleのAIエージェント連携戦略が進展
OpenAIがChatGPTに「メモリー機能」を導入し、過去の会話を記憶して応答をパーソナライズできるようになります。数日内にPlusユーザーに展開予定ですが、EU/EEA地域は規制対応のため当面対象外です。
GoogleはAIエージェント開発キット「ADK」と連携プロトコル「A2A」の詳細を発表し、Anthropic提唱のMCPもサポート。一方でMCPのターミナル操作リスクも指摘されています。
OpenAIはAIウェブ探索能力評価のベンチマーク「BrowseComp」を公開し、xAIはGrok 3.5/4の開発進行中と発表しました。
それでは各トピックを詳しく見ていきましょう。
目次
- OpenAI ChatGPTに過去会話参照可能なメモリー機能導入
- GoogleのADKとA2A、エージェント開発・連携の新情報【続報】
- MCP議論続報: Googleサポート表明とターミナル操作リスク
- Gemini 2.5 Pro、ポケモン攻略デモで話題に
- OpenAI、ウェブ探索評価ベンチマークBrowseComp公開
- Kaggle数学コンペAIMO-2、NVIDIAチームが優勝
- xAI、Grok 3.5/4開発中 ベンチマークと課題
- チャットAI、共感力がエンゲージメントの鍵か
- Qwen3予告、Dify書籍発売など AI動向まとめ
OpenAI ChatGPTに過去会話参照可能なメモリー機能導入
- OpenAIのCEO Sam Altman氏が予告していた新機能として、ChatGPTに過去の会話履歴を参照して応答をパーソナライズする「メモリー機能」が導入されました。
- この機能により、ユーザーは繰り返し同じ指示をする手間が省け、より文脈に沿った対話が可能になります。
- まずはPlusユーザー向けに数日以内に展開される予定ですが、EU/EEA地域はプライバシー規制のため当面対象外となる見込みです。
Sam Altman: (翻訳) 年に数回、早起きして眠れなくなることがあります。それは、長い間待ち望んでいた新機能をローンチするからです。今日はそんな日です!
ChatGPT研究所: 【速報】ChatGPT「メモリー改善版」、一般展開開始か 公式発表は未確認ながら、研究所所有のアカウントに「improved memory」機能のポップアップ表示を確認。 メモリーに保存された内容だけでなく、過去の全会話履歴を参照可能になります。 先ほどサムアルトマンが予告した新機能と見られます。 https://t.co/gg9dOuMZOc
TechCrunch: (翻訳) OpenAI、過去のチャットを参照するようにChatGPTを更新
GoogleのADKとA2A、エージェント開発・連携の新情報【続報】
- Google Cloud Next '25で発表されたAIエージェント開発キット「ADK」と連携プロトコル「A2A」に関する続報です。
- ADKはオープンソースかつモデル非依存で、MCPもサポート。ドキュメントと実装の乖離が少ない点も評価されています。
- A2AはMCPを補完し、異なるフレームワークやベンダーのエージェント間連携の標準化を目指します。
- 関連する実行・利用環境としてAgent EngineやAgentspaceも提供されます。
na0: Agent Development Kit、稀に見る出来。 ドキュメントとソースコードの乖離がほとんどないの意。
Hirosato Gamo | AI Cloud Solution Architect: A2A - ADK、ドキュメント眺めてるけどなかなか良き。 Agent2Agentって書かれるとイメージつきにくいけど要はマルチエージェントにおける在るべき機能と連携の仕組みを提案してる。
Google Cloud Tech: (翻訳) エージェントの構築とデプロイを支援する製品をご紹介します: 👋 エージェント構築を支援する Agent Development Kit 👋 エージェント実行を支援する Agent Engine 👋 ユーザーがエージェントと対話するのを支援する Agentspace 詳細はこちら → https://t.co/JGI0DhWF1r #GoogleCloudNext
MCP議論続報: Googleサポート表明とターミナル操作リスク
- Anthropic提唱のAIエージェント連携プロトコルMCP (Model Context Protocol) に関する議論の続報です。
- GoogleがMCPのサポートを表明し、開発コミュニティでの議論がさらに活発化しています。
- MCPの解説記事やクイックスタートガイドも共有されています。
- 一方で、MCPを利用したターミナル操作(特にnpx実行)のセキュリティリスクが具体的に指摘されており、注意喚起がなされています。
Kenn Ejima: MCP流行はいいんだけどエージェントにターミナルでnpx実行させるのは危険だと知っておこう。インストールせずに任意のリモートコードを実行できるので、知らないうちにローカルのデータを全部ぶっこ抜かれて情報漏洩しまくったりランサムくらう事案が近々起きるのは確実なのでご用心を。
カレーちゃん: 今日の朝配信では、「やさしいMCP入門」でおすすめされていた、MCP公式サイトのクイックスタートをやってみました。 資料に書かれていたとおり、理解がとても深まったのでこのクイックスタートをやってみるのはとてもおすすめです。クイックスタートはこちらです。 https://t.co/xU9KkXPXmO
久保田 雅也@Coalis: MCPに関する良まとめ - MCPは、AIエージェントが外部サービスと安全かつ構造的に連携できるようにするプロトコル - 従来のAPIはAIには扱いにくく、パラメータの厳格さやエラー処理が課題 - AIモデルは確率的に動くため、APIのような決定論的な仕組みとは相性が悪い -
Gemini 2.5 Pro、ポケモン攻略デモで話題に
- GoogleのGemini 2.5 Proが、ゲーム「ポケモン」をリアルタイムでプレイ・攻略するデモンストレーションを配信し、その応用力の高さが話題となっています。
- 様々なタスクでの活用が期待される一方、一部ユーザーからはコーディングや長文コンテキスト処理における課題も引き続き指摘されています。
Logan Kilpatrick: (翻訳) Gemini 2.5 Proは現在、ポケモンのクリアに向けてライブで大きな進歩を遂げています。見ていてとても楽しいです :)
ML_Bear: Gemini 2.5 Pro版のDeep Researchがかなりいい雰囲気なので、o3やo4-mini-highの出来が相当良くない限りはChatGPT Proプラン解約しても良いかもしれない。代替案が出てきちゃった以上、月3万はちょっと払えないかなぁ〜😇
久保田 雅也@Coalis: Gemini 2.5 Pro無双してるな。Googleがいよいよ本気モード。あらゆるベンチで最高性能叩き出してる。DeepResearch一定チャーンしそう https://t.co/0k14d2nBjC
OpenAI、ウェブ探索評価ベンチマークBrowseComp公開
- OpenAIは、AIエージェントがインターネットをブラウジングして特定の情報を見つけ出す能力を評価するための新しいベンチマーク「BrowseComp (Browsing Competition)」をオープンソースで公開しました。
- このベンチマークは、単純な検索だけでなく、複数ページにわたる探索やインタラクションが必要な、より困難な情報探索タスクを含んでいます。
- AIエージェントの高度なウェブナビゲーション能力と情報収集能力の研究開発を促進することが期待されます。
OpenAI: (翻訳) インターネットを閲覧して見つけにくい情報を見つけるAIエージェントの能力をテストするために設計された、新しい挑戦的なベンチマークであるBrowseComp(「ブラウジングコンペティション」)をオープンソース化しています。これは、ブラウジングエージェントのためのオンラインスカベンジャーハントのようなものです。
morgan —: (翻訳) もしGoogleの使命が世界の情報を整理することであるなら、それは単に計算能力をスケールさせることで解決されるかもしれないように見えます
The Information: (翻訳) 競合他社がエージェント向けの新ソフトウェアで団結、アプリメーカーを脅かす DoorDashのようなアプリは、MCPを使用するAIエージェントが人間のアプリ訪問を減らし、広告収入やブランド認知度に影響を与えることを懸念しています。🛒 eコマースへの潜在的な影響:
Kaggle数学コンペAIMO-2、NVIDIAチームが優勝
- LLMの数学的能力を競うKaggleコンペ「AI Mathematical Olympiad - Progress Prize 2 (AIMO-2)」の続報です。
- NVIDIAの研究者チーム「NemoSkills」が優勝したことが発表されました。
- 同チームのシステムは4基のL4 GPUを使用し、5時間で50問中34問を解決しました。
- 前回報じた通り、複数の日本人Kaggle Grandmasterを含むチームも上位入賞し、金メダルを獲得しています。
NVIDIA AI Developer: (翻訳) 🎉 @Kaggle で開催された AIMO-2 コンペティションで優勝した NVIDIA チーム「NemoSkills」におめでとうございます 🏆。彼らのシステムは、4つの L4 GPU を使用してわずか 5 時間で 50 問中 34 問を解決しました。🔢✨⏱️ https://t.co/vUFJkURzoi 方法は?強力なチーム—Christof Henkel、Darragh Han...
こへっち: Novice の若手に少しアドバイスしたらセンスがいいのか一気にスコア改善してくれて4位に浮上。いいぞいいぞ。そのままKaggleに沼ってくれぇ。 https://t.co/qmWc6AMfx6
ざぶろう: GENIAC 関連で、LLM の事前学習チームの鈴木さんと一緒に事後学習チームのリードとして取材していただきました🙏
xAI、Grok 3.5/4開発中 ベンチマークと課題
- xAIがGrok 3 APIを公開したことに続き、Elon Musk氏がライブストリームでGrok 3.5とGrok 4の開発にも言及しました。
- Grok 3.5は「間もなく」、Grok 4は「今年中」のリリースを目指しているとのことです。
- 早速、開発ツール「aider」でのベンチマークが実施され、Grok 3 Betaはo3-mini-mediumと同等の性能を示したと報告されています。
- 一方で、Grokのファクトチェック回避プロンプトが容易に無効化できるといった指摘もされています。
Kol Tregaskes: (翻訳) イーロン・マスク氏がライブストリームでGrok 3.5を発表、「間もなく」登場すると述べました。また、Grok 4についても言及し、「今年」登場すると改めて述べました。これらはイーロン時間であることに注意してください。😜
Paul Gauthier: (翻訳) Grok 3 Betaはaiderポリグロットコーディングベンチマークで54%を獲得しました。パフォーマンスとコストでo3-mini-mediumと競合しますが、はるかに高速です。Grok 3 Mini Betaは35%を獲得しましたが、diffで確実に編集できませんでした。aider v0.81.2で利用可能: aider --model grok3
Iaiso: Grok 3 APIが来た。コーディングツールとの相性どんなもんなんだろう
チャットAI、共感力がエンゲージメントの鍵か
- チャットAIとの対話において、ベンチマークスコアだけでなく「共感力」がユーザーエンゲージメントを高める重要な要素ではないか、という議論が起きています。
- Claudeが人気を集める理由の一つとして、応答の冒頭でユーザーを肯定する姿勢が挙げられています。
- LLMベンダーも、より人間らしい対話や共感表現を取り入れる方向にシフトし始めている可能性が指摘されています。
Kenn Ejima: これは間違いないと思います。 Claudeが人気なのも返信の最初に You're absolutely right! という超絶肯定をくれることで「どれどれ、そこまで言うなら続きを読んでやらんでもない」という殿様気分を味わえるのが大きいでしょう。結果「お主もなかなかやるな?」という友情ループが生まれる。
Torishima / INTP: 結局大半の人間が求めてるのはベンチで出る性能よりベンチで測れない相手への共感力の高いチャット相手なんだなぁ・・・ってチューニングにようやくLLMベンダーが気付き始めた感
Kol Tregaskes: (翻訳) ソーシャルプラットフォームでニュースをキュレーションする者として、私は間違いなく加速に気づきました。最初はニュースに追いつき、ここでのすべてのアラートを確認し、ほとんどのツールを試し、GitHubのアプリを試し、定期的に自分のプロジェクトに時間を割くことさえできました。その後、ニュースは加速し、私は
Qwen3予告、Dify書籍発売など AI動向まとめ
- Alibabaの次世代大規模言語モデル「Qwen 3」が近日リリースされると予告されました。
- ノーコードAIアプリ開発ツール「Dify」の入門書籍が発売されました。
- Midjourneyが、創造的な執筆タスクにおけるAI出力の多様性を向上させる手法に関する論文を発表しました。
- LLMOpsツール「Langfuse」に、ダッシュボードのカスタマイズ機能などが追加されました。
- その他、AIコーディングツール比較(Cursor/Cline/Claude Code)、vLLMのTPU対応計画、AnimagineXLのLoRA学習、GeminiとVeoの統合可能性など、多岐にわたる話題が報告されています。
Kol Tregaskes: (翻訳) Qwen 3は今日リリースされますか?
しま / 大嶋勇樹: ノーコードで生成AIを始めるための必携本 ー 『コーディング不要で毎日の仕事が5倍速くなる!Difyで作る生成AIアプリ完全入門』が日経BPから発売 #Dify完全入門 https://t.co/jcEYaYdPDV @PRTIMES_JPより
Kol Tregaskes: (翻訳) Midjourneyからの論文。この論文では、品質を維持しながら創造的な執筆生成における出力の多様性を高めるためのトレーニング後のアプローチを探求しています。この研究は、創造的な執筆のための大規模言語モデル(LLM)における出力の多様性の重要性を強調し、対処しています。