2025年04月06日 朝のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

Meta、Llama 4シリーズついに公開!OpenAIのGPT-5延期の裏側とAI能力の逆転現象

MetaがLlama 4シリーズを突如公開し、マルチモーダル対応と1000万トークンという長大なコンテキスト長を実現。特にMaverickモデルはGPT-4oを上回る評価も。

一方OpenAIはGPT-5を「大幅改良の可能性」を理由に延期。GPT-4o画像生成APIの近日公開にも期待が高まっています。

興味深い研究では「AI vs 人間の能力逆転現象」も判明。AIは初速で優位も、24時間後には人間が大きく引き離すという結果に。

それでは各トピックの詳細を見ていきましょう。

目次

  1. Meta、延期されていたLlama 4シリーズをついに公開、マルチモーダル対応・1000万トークンコンテキストを実現
  2. OpenAI、GPT-5大幅改良のためリリース計画を更新、延期の背景も明らかに
  3. GPT-4o画像生成APIの提供が間近か、開発者から期待の声
  4. 「AIと人間の能力逆転現象」が判明、初速はAIが優位も長期では人間が上回る
  5. 自作コーディングエージェント開発の広がりとAPI制限の壁
  6. OpenAI Node SDKのv4.91で破壊的変更、embeddings APIに注意
  7. AIコーディング時代、EMの役割がさらに重要に

Meta、延期されていたLlama 4シリーズをついに公開、マルチモーダル対応・1000万トークンコンテキストを実現

  • Metaが、以前リリース延期が報じられていたLlama 4シリーズを予告なしに公開しました。
  • Maverick(402B)とScout(109B)の2モデルが登場し、ネイティブでのマルチモーダル・多言語対応、1000万トークンという長大なコンテキスト長が特徴です。
  • 特にMaverickはGPT-4oやGemini 2.0 Flashを上回る性能を持つとの評価も出ています。
  • HuggingFaceでの公開にはXet技術が活用され、ダウンロード速度の向上やストレージ容量の削減も実現しています。
clem 🤗: (翻訳) Llamaは史上最も人気のあるオープンモデルファミリーであり、AI界に本当に変革をもたらしました。新しい仲間たちを迎えることができて、これ以上なく興奮しています。@Ahmad_Al_Dahle @ylecun と@AIatMetaチーム全体の皆さん、おめでとう!素晴らしいです!

ollama: (翻訳) .@ollamaは@AIatMetaのLlama 4 Scoutで遊んでいます!🤯 Ollamaの巨大スーパーコンピュータをテストする絶好の機会です ✈️✈️✈️

Vaibhav (VB) Srivastav: (翻訳) Llama 4には、ダウンロード速度が5-10倍速く、最大30%の重複排除機能を持つ新しいxetバックエンドも搭載されています!🔥 より小さなストレージで、より速いダウンロードが可能です!🌟

OpenAI、GPT-5大幅改良のためリリース計画を更新、延期の背景も明らかに

  • 先日お伝えしたOpenAIのモデルリリース計画変更について、延期の背景となる詳細が明らかになりました。
  • o3およびo4-miniモデルは数週間後、GPT-5は数ヶ月後のリリースへと延期されます。
  • 主な理由として、GPT-5を当初想定より大幅に改良できる見込みであること、技術統合の複雑さ、需要増に対応するシステム容量確保が挙げられています。
  • これにより、さらに強力なGPT-5への期待が高まるとともに、OpenAIの質を重視する開発姿勢がうかがえます。
酒井@製造業×生成AI高速PoCシステム開発: 期待させてくる、GPT-5凄く楽しみ --- ☑️o3とo4-miniのリリースは数週間後に延期 ☑️GPT-5は数ヶ月後にリリース予定 ☑️この計画変更の主な理由  ☑️GPT-5を当初の想定よりも大幅に改良できる見込み  ☑️技術的な統合が予想以上に複雑  ☑️高い需要に対応するためのシステム容量の確保が必要

GPT-4o画像生成APIの提供が間近か、開発者から期待の声

  • OpenAIのLu Liu氏が「GPT-4o画像生成API」についての質問に「乞うご期待」と回答し、近日中の公開が期待されています。
  • GPT-4oの画像生成能力は高く評価されており、ChatGPT研究所からは基本機能から応用まで網羅した完全攻略ガイドも公開されるなど、開発者コミュニティの注目度が高まっています。
  • APIの提供によって、GPT-4oの画像生成機能をアプリケーションに統合しやすくなり、新たな創造的ツールやサービスの開発が加速することが期待されています。
Lu Liu: (翻訳) 何度も尋ねられてきましたが、もうしばらくお待ちください

Tibor Blaho: (翻訳) OpenAIはGPT-4o画像生成APIに取り組んでいます

ChatGPT研究所: 【完全攻略】GPT-4o 画像生成 GPT-4oはまさに「現在最強クラス」の画像生成AIです。 リリース直後から徹底検証した 知見を全投入しました。 ✅基本機能から応用まで網羅 ✅30超プロンプト実例集(掲載画像116枚) ✅Preset機能でスタイル管理 基本は無料部分で掴めます👇 https://t.co/d0KxjB8HIF

「AIと人間の能力逆転現象」が判明、初速はAIが優位も長期では人間が上回る

  • OpenAIの研究で「AIと人間の時間経過による能力逆転現象」が発見されました。AIは最初の1時間で急速に成果を上げ人間を上回りますが、その後は伸び悩むことがわかっています。
  • 一方、人間は徐々に理解を深め、24時間後には大きくAIを引き離すという逆転現象が観察されました。これはPaperBenchの実験結果によるものです。
  • この知見から、スタートダッシュにはAIを活用し、じっくり仕上げる段階では人間が知恵を使うという現時点での最適な協業方法が見えてきます。
Kenn Ejima: つまりスタートダッシュにはAIを使い、じっくり仕上げるところで人間が知恵を使うのが現時点では最適解と。 実際の使い方や実感値とも一致しますね。

自作コーディングエージェント開発の広がりとAPI制限の壁

  • 複数の開発者が独自のコーディングエージェント開発に挑戦している様子が見られ、これらのツールがAIコーディング支援の新たな可能性を示しています。
  • しかし開発者らはAPIのレート制限に直面するなど技術的課題にも直面しており、「APIのrate limitが厳しい」「memory-bankを削除して、boomerang modeを評価中」など試行錯誤が続いています。
  • Cursor+Rooなどを使った実験では「定期的にエディタ本体のリブートが必要」「タスク終了時にターミナルを消した方がいい」など実用的な知見も共有されています。
azukiazusa: オレオレコーディングエージェント作ってる https://t.co/jDhmu10vmR

azukiazusa: 自作コーディングエージェントで遊んでるけど API の rate limit が厳しい

erukiti: 定期的にエディタ本体(cursor + Rooでやってるからcursor)のリブートが必要。動かし続けるとバグる(ウィンドウが化けるなど)とかRooのターミナルはタスク終了時に消した方がいいとか、タスクが終わったらタブは全部閉じた方がいいとか 微妙なコツを得つつある

OpenAI Node SDKのv4.91で破壊的変更、embeddings APIに注意

  • OpenAIがNode.js SDKのv4.91でembeddings APIに破壊的変更を加え、開発者が困惑しています。特に、レスポンスのデータ型変更とdimensionsパラメータが無視される問題が報告されました。
  • この変更によりベクトルデータが壊れ、壊れている問題に気づきにくいこともあり「普通に気づきにくいところなんだからやめれ」と開発者からの不満の声が上がっています。
  • 開発者はSDKのバージョンアップに注意を払い、テストを徹底するなど、APIの突然の変更に対する対策が必要です。
Kenn Ejima: (翻訳) お知らせ:OpenAI nodeが4.90.0と4.91.0の間でembeddings APIに破壊的変更を導入しました。dimensionsパラメータさえも無視しています... 開発速度は尊重しますが、これはかなり悪いです。

Kenn Ejima: OpenAIはしれっとv4.91でレスポンスのデータ型を変えるような破壊的変更入れてくるんじゃねーよ危うくQdrantのせいにするところだったじゃねーかembeddingのベクターデータが壊れてるのなんて普通に気づきにくいところなんだからやめれみたいな気分になる週末みなさんいかがお過ごしですか

AIコーディング時代、EMの役割がさらに重要に

  • AI時代においてエンジニアリングマネージャー(EM)の価値が高まるという視点が注目を集めています。takuya kikuchi氏は「AIによって最もエンパワーメントされるのはそんなEMのみなさまかもしれない」と指摘しています。
  • EMたちが持つ「自分の力をレバレッジさせる」能力が、AIツールの効果的な活用により一層強化され、組織全体の生産性向上につながるとの見方です。
  • EMとAIの組み合わせにより、「世界中で一気に答え合わせフェーズに入りつつあるかもしれない」と、新たな生産性革命の可能性も示唆されています。
takuya kikuchi | Algomatic カンパニーCTO: わたしがこれまでお会いしてきたEMの方々、みんなすごい自分の力をレバレッジさせてる人たちでした。AIによって最もエンパワーメントされるのはそんなEMのみなさまかもしれない、という記事です。 なんだかワクワクしてきませんか https://t.co/PhieFb7BqN

erukiti: ちょうどこの前のEMconf JPとかきのこカンファレンスとかでもEMとかそういう視点を持てる人が今後めっちゃ強みになるのではって話題になってましたね 世界中で一気に答え合わせフェーズに入りつつあるかもしれない

Subscribe to ML_Bear Times

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください