2025年04月08日 夜のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

MCPエコシステム拡大とアルトマン氏のAGI発言に注目が集まる週

AIエージェント連携プロトコルMCPのエコシステムが拡大中です。a16zが詳細解説記事を公開し、ElevenLabsもMCPサーバー対応を発表しました。

一方、OpenAIのアルトマン氏は「AGI実現への道筋はほぼ判明している」と発言。Sakana AIとGoogle DeepMindの研究チームは論文自動生成「AI Scientist-v2」を発表し、初めて査読を通過させることに成功しています。

MetaはLlama 4ベンチマーク検証用に2000件超の評価データを公開し、NVIDIAはLlama 3.1ベースの253Bモデル「Nemotron-Ultra」をリリースしました。

それでは各トピックの詳細を見ていきましょう。

目次

  1. MCPエコシステム拡大:a16zの解説記事、ElevenLabs対応
  2. アルトマン氏「AGI実現への道筋は判明済み」
  3. Sakana AI、論文自動生成「AI Scientist-v2」公開
  4. Meta、Llama 4ベンチマーク検証用に2000件超の評価データ公開
  5. Algomatic社、AIエージェント開発の実践知を公開
  6. Shopify CEO、全社員にAI活用を義務化
  7. NVIDIA、Llama 3.1ベースの253Bモデル「Nemotron-Ultra」公開
  8. AmazonのAI「Nova Reel」、2分動画生成が可能に【続報】
  9. Stanford AI Index Report 2025年版公開、最新動向示す
  10. Krea AIなど4社で3億ドル超の新規資金調達
  11. GoogleがAI人材流出防止に異例の報酬策
  12. Cursor×Gemini 2.5 Pro利用で長所短所が明らかに
  13. ChatGPT、トラフィック増でXに迫る、新機能開発中か
  14. IBM、AIコンサルHakkoda買収でAI戦略強化
  15. Google AI Mode機能拡充と新AI技術登場

MCPエコシステム拡大:a16zの解説記事、ElevenLabs対応

  • AIエージェント間連携プロトコルMCPのエコシステム拡大に関する続報です
  • ベンチャーキャピタルa16zがMCPの詳細解説記事を公開し、開発者の理解促進に貢献しています
  • 音声AI企業ElevenLabsがMCPサーバー対応を発表し、AIエージェントと音声技術の連携が容易になりました
  • 開発コミュニティでは引き続きFunction Callingとの連携手法や実装の最適化について議論が深まっています
Shinichi Takaŷanagi: 著名VC アンドリーセン・ホロウィッツ (a16z) からMCP の解説記事が出ていた。MCPとは?に始まり、ユースケース、現状と課題(認証・認可、等)、AIツールの未来予想など、とても参考・勉強になる。 A Deep Dive Into MCP and the Future of AI Tooling https://t.co/AbcbsJJiUm

Hirosato Gamo | AI Cloud Solution Architect: MCPではFunction Callingを使わずにシステムプロンプトにツール判断およびAPIのパラメータ抽出の基準(いわゆる関数定義)を与えることになります。(ドキュメントとサンプル実装は確認してますが間違ってたらすみません) プロンプトに関数定義や出力形式の記述が与えられる点はFunction (引用ツイート: 精度が下がると言ってる理由がわからない。MCP は単にツールとしてコマンド...

Hirosato Gamo | AI Cloud Solution Architect: X上でのMCPディスカッションで時間が溶けてくぜ…。 この素敵な議論って普通コミュニティのDiscordとかでやるものな気もするけど。

西見 公宏 | Generative Agents: fetchをMCPサーバに加えると、Claudeが延々とハルシネーションしたURLをfetchに与え続ける病を患う。 MCPサーバが自己申告したdescriptionをもとにツールを呼び出そうとするので、どのツールを選択するとタスクがこなせるかは、LLMにとってはガチャに近い。ここがチューニングのポイントですね。

アルトマン氏「AGI実現への道筋は判明済み」

  • OpenAI CEOのサム・アルトマン氏が2025年に期待することとして「AGI」を挙げ、「AGI実現のために何をすべきかはほぼわかっている」と述べています。
  • また「一人と1万GPU」で数十億ドル企業が誕生する可能性に言及し、AIによる新たな生産性革命を予測しています。
  • 同氏のAGI実現に向けた具体的な見解は、業界内での技術的進展の加速を示唆するものとして注目されています。
d: 質問: 2025年は何が楽しみですか? サム・アルトマン: AGI。 https://t.co/GvYuInU4Y0 (引用ツイート: サム・アルトマン: ・2025年に期待することは「AGI」 ・数千日内に超知能到来の可能性 ・創業するには最高の時期 ・AGIに向けて何をすべきかはっきり見えている ・ビジネスの基本ルールはAIでも変わらない ・AIは飽和しておらず、すごい速さで進化中 ...

d: サム・アルトマン: 今が初めて、『何をやるべきか』がはっきり見えている気がします。AGIを実現するにはまだたくさんの仕事がありますし、『わかっていないこと』もありますが、やるべきことは、ほぼわかっています。 https://t.co/mkwP4flKu7 (引用ツイート: サム・アルトマン: ・2025年に期待することは「AGI」 ・数千日内に超知能到来の可能性 ・創業するには最高の時期 ...

d: サム・アルトマン: 一人で数十億ドル企業はありえる。 要は、一人と1万GPUみたいなもんですよ。 https://t.co/iueAlL3Dht (引用ツイート: サム・アルトマン: ・2025年に期待することは「AGI」 ・数千日内に超知能到来の可能性 ・創業するには最高の時期 ・AGIに向けて何をすべきかはっきり見えている ・ビジネスの基本ルールはAIでも変わらない ・AIは飽和してお...

d: サム・アルトマン: (LLMラッパーに関して)そのほとんどは失敗するか、うまくいかないでしょうが、そのうちのいくつかは本当に永続的なビジネスを見つけ、莫大な価値を生み出すでしょう https://t.co/hzJ2IIknyS (引用ツイート: サム・アルトマン: ・今年か来年、コーダーの生産性は10倍になる ・コード自体の価値は下がるが需要が増えるため、「書ける人」の価値は上がる ・gp...

Sakana AI、論文自動生成「AI Scientist-v2」公開

  • Sakana AIとGoogle DeepMindの研究者らが、科学論文を自動生成する「AI Scientist」の改良版「AI Scientist-v2」を発表しました。
  • 新たに「Agentic Tree Search」を導入し、より深いアイデア探求や実験、論文執筆が可能になったとしています。
  • 生成された論文がICLR 2025のワークショップレベルで査読を通過した初の事例となり、AIによる科学的発見の自動化に向けた大きな一歩と注目されています。
hardmaru: (翻訳) 技術レポート「AI Scientist-v2: Agentic Tree Searchによるワークショップレベルの自動科学的発見」のリリースに興奮しています‼️ https://t.co/JdqPGFSqNE AI Scientist-v2は、「Agentic Tree Search」アプローチをワークフローに組み込み、より深く、より多くのことを可能にします

Sakana AI: 進化したAIサイエンティスト、「The AI Scientist-v2」を公開 AIが完全自動で科学論文を生成するAIサイエンティストの改訂版、The AI Scientist-v2を公開しました。 論文:https://t.co/HBXB7jTXfF GitHub:https://t.co/2SEMs0OgNz 昨年8月のAI Scientist-v1から、以下の点で大きく進歩しました。 ...

Kosuke Nakago: AI Scientist-v2のtech reportが公開されました! Quick summaryはこちら⬇️ (引用ツイート: Introducing The AI Scientist-v2, which produced the 1st fully AI-generated paper to pass peer review at a workshop level (at @iclr_...

Cong Lu: (翻訳) AI Scientist-v2の完全なプレプリントと100%オープンソースコードを共有できることを嬉しく思います🚀🚀 現代の基盤モデルがより良いアイデアを思いつき、より深く、より一般的な実験を行い、より良い論文を書くことを可能にする多くの改善点があります!👩‍🔬

Meta、Llama 4ベンチマーク検証用に2000件超の評価データ公開

  • 前回報告されたLlama 4のベンチマーク操作疑惑について、Metaは透明性確保のため2000件以上の評価データを公開しました
  • Hugging Face CEOはオープンソースによる迅速な誤解解消の利点を強調する一方、専門家からはArenaのようなリーダーボード向けに最適化することの容易さも指摘されています
  • この一件は、LLMの評価手法やベンチマークの信頼性、オープンソースコミュニティの役割について改めて議論を呼んでいます
clem 🤗: (翻訳) オープンソースの美しさは、透明性を高め、ここで起こっているような誤解を非常に迅速に修正できることです。プロプライエタリなAPIでおそらく起こったであろう、私たちが聞いたことすらない同様の出来事をすべて想像してみてください!

heartkilla: (翻訳) かなりがっかりです。Metaからそんなことがあるとは思っていなかったので、何らかの形で対応してくれることを願っています。

Philipp Singer: (翻訳) lmsysリーダーボード向けに特別に最適化するのは非常に些細なことだと数ヶ月間言い続けてきました。世の中には大量のデータがあり、kaggleコンペティションがあり、フィードバックデータを得る他の方法もあります。十分に長く公開されているすべてのベンチマークで同じことが起こります。

Algomatic社、AIエージェント開発の実践知を公開

  • Algomatic社エンジニアがFindy主催イベントで、AIエージェント開発における性能改善やリスク検証、ガードレールの役割など現場の「地上戦」について発表しました。
  • 発表では、ドメインエキスパートと開発者の協働の重要性や、AIエージェントのオンボーディング設計、実用レベルの品質担保のための手法などが詳しく解説されています。
  • これらの実践知は、AIエージェント実用化に取り組む企業にとって参考になる貴重な情報として注目されています。
s-miyawaki | Algomatic: Findyさんのイベントで、AIエージェントやLLMアプリケーション開発の性能改善の取り組みについて紹介しました🙌 ・AIエージェントは何が嬉しいか ・地上戦ロードマップ ・ガードレールの役割 ・リスク検証 などについてお話してます🙏 https://t.co/SCsD5EGyK3

Algomatic池田|AI×営業: AIエージェント開発には、①ドメインエキスパート、②開発者、の協働が必須です。 その様子を詳細に記載している神スライドです。 AlgomaticのAIエージェント開発をするエンジニアは、ビジネスの解像度が高くて驚きます・・・! https://t.co/FKVAU9xMo9 (引用ツイート: Findyさんのイベントで、AIエージェントやLLMアプリケーション開発の性能改善の取り組みについ...

Algomatic池田|AI×営業: エンジニアリングマネージャーがAIを使って開発生産性を上げるときも、AIオンボーディングをしている様子です。 AIが最も効果的に働ける環境のベストプラクティスをずっと探索しています。 https://t.co/MXW7trMkQ1 (引用ツイート: チームのエンジニアGoさんの記事です。AIエージェントに丁寧にコンテキストを伝えながら開発を進める中で、「EMの力がこれまで以上にレバレッジ効...

Dory | Algomatic Works: 「自分向けのパーソナルAIを作ったら楽しいだろうなあ...!」って思って、社内Slackに私の分身となるAIエージェントを公開したんですが、待っていたのは私の分身AIが仕事できなさすぎて問い詰められる未来で号泣しました https://t.co/kbNlX9K8X0 (引用ツイート: OpenAI Agents SDK、MCPサーバーと連携したエージェントをシュッと作れるのでめちゃ便利 ht...

Shopify CEO、全社員にAI活用を義務化

  • Shopify CEOのTobi Lütke氏が社内メモで、AI活用を「期待」ではなく「必須」とする方針へと強化しました。
  • 役員を含む全社員がAIを業務に取り入れることが義務付けられ、チーム拡大の前にAIで生産性向上を図ることが求められています。
  • これは先日報じられた同社のAI推進方針をさらに強化するもので、AIを前提とした組織運営への本格的なシフトを示しています。
Tetsuro Miyatake: Shopify CEOのTobi Lütkeが社内で出したAIに関するメモが公開された。 AIを反射的に使うのがShopify内でのベースラインの期待値になると発言。 プロトタイプ、評価、採用などはAIをまず積極的に使い込むのが大事とのこと。 (引用ツイート: https://t.co/6i6h3sKi3x)

Taro Fukuyama: ShopifyのAI活用に関する指針 + AI活用は“期待”ではなく“必須” 。今後、AIを使いこなすスキルがないと成長は難しい。 + AI活用は全社員に適用(役員も含む) 一部の人だけではなく、全員がAIを取り入れる必要がある。 + AIの反射的な活用はもはや前提 (引用ツイート: https://t.co/6i6h3sKi3x)

NVIDIA、Llama 3.1ベースの253Bモデル「Nemotron-Ultra」公開

  • NVIDIAがMetaのLlama 3.1 405Bモデルをベースにした大規模言語モデル「Llama-Nemotron-Ultra」をリリースしました
  • このモデルは253Bパラメータを持ち、推論能力に焦点を当てたポストトレーニング(SFT+RL)が施されています
  • オープンウェイトとポストトレーニングデータが公開されており、NVIDIAによるオープンソースコミュニティへの貢献として注目されていますが、ライセンスの扱いに一部疑問も出ています
Nathan Lambert: (翻訳) Nvidiaはオープンなポストトレーニング作業の偉大な陰の貢献者であり、それを愛しています

Aratako: これに限らず最近のNVIDIAのLlama3.1派生モデルはLlama3.1ライセンスを直接継承していないようだけど、この書き方はどういう解釈をすればいいんだろうか https://t.co/qXffi9Q2lB https://t.co/sD7wJYtkV0 https://t.co/yBBx6IvC09 https://t.co/MMSdRWT9D0 (引用ツイート: We are ex...

AmazonのAI「Nova Reel」、2分動画生成が可能に【続報】

  • Amazonが開発中のAI動画生成モデル「Nova Reel」について、機能向上が報告されています。
  • 最大4000文字のプロンプトから、合計2分間の動画を生成できるようになったとのことです。
  • ただし、現状は複数の6秒動画を組み合わせる形であり、連続した1テイクの2分間動画生成はまだ実現できていない模様です。
Tetsuro Miyatake: Amazonが去年の12月に発表したAI動画生成モデル「Nova Reel」のアップグレード版を披露した。 4,000文字までのプロンプトを入力して合計2分間動画を生成することができる。 基本的には6秒動画を複数組み合わせているので、ワンテイクの2分間動画はまだ作れない。 https://t.co/rPx4KOV8LE https://t.co/6mGEG9V1al

TechCrunch: (翻訳) Amazon、AI動画モデルが数分間のクリップを生成可能になったと発表 https://t.co/1n0O8i0hru

Stanford AI Index Report 2025年版公開、最新動向示す

  • スタンフォード大学人間中心AI研究所(HAI)が、年次報告書「AI Index Report」の2025年版を公開しました。
  • 報告書では、AIのユースケース拡大(米中自動運転、医療等)、各国の民間投資動向、中国の台頭、推論コストの大幅低下、規制動向などが網羅されています。
  • 計算量やデータ量が急速に増加している現状も指摘されており、AI分野の最新動向を把握するための重要な資料となっています。
Shinichi Takaŷanagi: Stanford HAIからAI Index Reportの2025年版が出た。 ユースケース拡大(米中の自動運転、医療等)、各国の民間投資動向、中国の台頭、AIに対する地域別センチメント、推論コスト大幅低下(HW含)、規制動向、計算量/でデータが5/8ヶ月ごとに倍増、等、話題が超豊富 https://t.co/Z8jpeN5wD5

Krea AIなど4社で3億ドル超の新規資金調達

  • AI分野への投資が引き続き活発です。デザイナー向けAIプラットフォームのKrea AIが評価額5億ドルで8300万ドルを調達しました。AI動画スタートアップのMoonvalleyも4300万ドルを調達し、先週には新モデル「Marey」をローンチしています。量子暗号技術のSandboxAQは評価額57.5億ドルで1.5億ドル、VCファンドSignalFireは10億ドルの新ファンド組成を発表するなど、周辺領域への投資も旺盛です。
Tetsuro Miyatake: デザイナー向けのAIクリエイティブプラットフォームを提供しているKrea AIが$500Mの時価総額で$83M調達を発表した。 Perplexity、Pixar、LEGO、Samsungなどが利用しているとのこと。 https://t.co/J6Qqt4CEC2

Tetsuro Miyatake: AI動画スタートアップのMoonvalleyが$43M調達を発表した。 先週AI動画生成モデル「Marey」をローンチした。 https://t.co/xcE8Arj8SH

Tetsuro Miyatake: 量子暗号技術を提供するSandboxAQは$5.75Bの時価総額で$150M調達を発表した。 https://t.co/9L5cMW4U57

Tetsuro Miyatake: VCファンドのSignalFireが$1Bのファンド調達を行い、投資先支援や市場トレンドを見つけてくれるようなAIツール「Beacon AI」を自社開発したとのこと。 https://t.co/g8UySbqxuW

GoogleがAI人材流出防止に異例の報酬策

  • Googleが一部のAIスタッフに対し、競合他社への転職を防ぐために1年間何もしなくても給与を支払うという異例の施策を実施していると報じられました
  • また、Google DeepMindの英国従業員の雇用契約には、退職後12ヶ月間は競合他社で働けないという競業避止条項が含まれているとの情報も出ています
  • これらの動きは、AI分野における人材獲得競争が一層激化していることを示しています
TechCrunch: (翻訳) Googleは、競合他社に参加するよりも1年間何もしないAIスタッフに給与を支払っていると伝えられています https://t.co/qJ0TYJcy6o

Tetsuro Miyatake: Google DeepMindのイギリスの従業員はGoogleを退職してから12ヶ月ほど競合企業と働けない競業避止条項が雇用契約書に含まれているらしい。 https://t.co/QBPZ3WpvPC

Cursor×Gemini 2.5 Pro利用で長所短所が明らかに

  • AIコーディング支援ツールCursor AgentでGemini 2.5 Proを利用するユーザーから、使用感に関する声が上がっています。
  • Gemini 2.5 Proの長いコンテキスト長や高い処理能力は評価されているものの、Agentとしての自律的な動作にはまだ改善の余地があるとの指摘があります。
  • 一方で、要件定義能力の高さを評価する声もあり、今後のCursorのアップデートによる改善も期待されています。
はち: Cursor AgentにおけるGemini-2.5-Pro、コンテキスト長くて処理能力高いの良いのだが、逐一止まらずにAgentとしてもっと自律的に動いてほしい。 自分の頭で考えろ系上司の気分が味わえます。 https://t.co/LmQGjpxS0S

Torishima / INTP: Gemini 2.5 Pro はマジで要件定義能力が高すぎるので相棒なんだよなもう

Torishima / INTP: Cursor の最新版だと改善されてるのか

ChatGPT、トラフィック増でXに迫る、新機能開発中か

  • ChatGPTのウェブサイト訪問者数が急増しており、2025年3月のデータでは世界トップ5サイトの中でX(旧Twitter)に迫る勢いを見せています。
  • 機能面では、生成した画像を共有するための新機能「share post/image」や、パーソナライズされたウェルカムメッセージの導入が進められている模様です。
  • これらの動きは、ChatGPTが依然として高い注目を集め、継続的に機能改善が行われていることを示しています。
Tibor Blaho: (翻訳) ChatGPTは、世界のトップ5ウェブサイトの中でXを追い抜く寸前です(2025年3月のトラフィック)

Tibor Blaho: (翻訳) ChatGPTニュース - 以前発見された新しい「投稿を共有」機能は、ImageGenを使用して生成された画像を共有するために開発中です(「画像を共有」とも呼ばれます - まだ機能していません、おそらくまだ開発中です) - https://t.co/ZmwH7VBk7k の一部として新しいパーソナライズされたウェルカムメッセージ/ヘッドライン

IBM、AIコンサルHakkoda買収でAI戦略強化

  • IBMが、AIおよびデータコンサルティング企業のHakkodaを買収したことを発表しました。
  • IBMは今年2月にもAIアプリ開発プラットフォームのDataStaxを買収しており、AI分野での企業買収を加速させています。
  • これらの動きは、IBMがエンタープライズ向けAIソリューション提供能力の強化を急いでいることを示しています。
Tetsuro Miyatake: IBMがAI・データのコンサル企業Hakkodaを買収したことを買収した。 今年の2月にAIアプリを開発するプラットフォームのDataStax、そして去年は$6.4BでHashiCorpなどを買収している。 https://t.co/vYZMFF6gk8

TechCrunch: (翻訳) IBM、AI時代向けに構築された新しいメインフレームをリリース https://t.co/7my55vhR4w

Google AI Mode機能拡充と新AI技術登場

  • Google AI Modeに画像認識・検索機能やアート作品情報提供機能が追加される見込みです。
  • 高精度な量子化技術「ExLlamaV3」や、拡散言語モデル「Dream 7B」、テーブルタスク汎用モデル「TableLlama」などが登場しています。
Tetsuro Miyatake: GoogleのAI Modeチャットボットにマルチモーダル機能を加えて画像認識や画像検索ができるようになる。 https://t.co/myL4UJPS8g https://t.co/hPjiRGW0Wn

Aratako: ExLlamaV3の量子化、かなり精度良さそう(まだearly previewの模様) https://t.co/52BbXQQpZo (引用ツイート: ____ https://t.co/awtqCy6vDE)

Kenn Ejima: 面白い、まじでdiffusionな動きをしてるなー それっぽいけどよく見たらめちゃくちゃなワードサラダを超高速並列生成するのに向いてそう(誰得) (引用ツイート: 拡散言語モデルがhuggingfaceに来てた 一応日本語も出力できた 面白いなー Dream 7B - Diffusion Language Model https://t.co/m6JrbrofOc)

u++: 「言語処理 100 本ノック」の個人的な実装例を、2025 年版に更新し始めました。 https://t.co/YpTTNJjzvf ✅ 1-4, 6 章は更新済み。残りも随時進めていきます。 ✅ ついでに Python 3.11.11、パッケージ管理は uv、リンターは Ruff に移行しています (引用ツイート: 📢言語処理100本ノックの2025年版を公開しました。 最新の自然言語処理...

Subscribe to ML_Bear Times

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください