2025年04月18日 夜のAIニュースまとめ
(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください
Gemini 2.5 Flash高評価、OpenAIのAgent SDKガイド公開、Salesforceはコードの20%をAIで生成
Googleが新たにリリースしたGemini 2.5 Flashが視覚・音声処理と長文対応で開発者から高評価を獲得しています。特に文字起こし性能と出力トークン上限の大幅拡大が注目されています。
一方、OpenAIはAgent SDKのガイドラインを公開し、初期段階ではシングルエージェント活用を推奨。Salesforceでは直近のコード20%がAI生成という具体的成果も報告されました。
その他、OpenAIの低コスト「Flex processing」提供開始や、DeepMind CEOによるAI創薬の可能性についての発言も話題となっています。
それでは各トピックの詳細について見ていきましょう。
目次
- Gemini 2.5 Flash、Vision/Audioや長文処理で高評価
- OpenAI、Agent SDKガイド公開 シングルエージェント推奨
- Salesforce、直近コードの20%をAIが生成
- 【続報】Grok、メモリ強化と画像対応音声対話を開始
- OpenAI、低コストAPI「Flex processing」提供開始
- MCP続報: FastAPI実装例やCodex CLIサポート進む
- AI創薬・生物学応用加速、DeepMind CEO発言も
- OpenAI、Cursor買収を試みるも失敗と報道
- LMArena UI刷新、Netflix AI活用、TBS Gemini活用事例
Gemini 2.5 Flash、Vision/Audioや長文処理で高評価
- リリースされたGemini 2.5 Flashについて、開発者から高評価の声が相次いでいます。
- 特にVision/Audioの文字起こし性能や、出力トークン上限の拡大(8,192→65,536)による長文処理能力の向上が評価されています。
- GoogleのJeff Dean氏も高品質・低価格・低遅延をアピールしており、コストパフォーマンスの良さも注目されています。
Kenn Ejima: vision / audioの文字起こしは全部Gemini 2.5 Flashに切り替えて大満足。 2.0 Flashのスピード・品質バランスも良かったけど、出力トークンの8,192上限が意外ときつくて長時間の録音をJSONにしたり情報量の多いPDFからのOCRだと途中で切れてた。65,536あれば無敵。
Kimihiko Kitase ♨️ 北瀬 公彦: Gemini 2.5 Flash Preview きたー。Gemini の高コスパモデル。思考モードも調整できるようになりました。これからは、普段使いは Flash で、複雑なタスクは Pro って使い分けって感じかな。 まずはお試しください👉 https://t.co/kOrq6lkLFe #gemini #google #googlecloud https://t.co/hK96C7Bw...
Jeff Dean: (翻訳) Gemini Flash 2.5モデルのリリースに興奮しています(多くの人々の努力の結晶です!)。このモデルはFlashモデルバリアントの特徴を引き継ぎ、非常に高いモデル品質を低価格で、そして非常に低いレイテンシで実現し、より良い方向への我々の推進を続けています https://t.co/2NHZsTt7qi
OpenAI、Agent SDKガイド公開 シングルエージェント推奨
- OpenAIがAgent SDKのガイドラインを公開し、初期段階ではシングルエージェントの能力を最大限引き出すことを推奨している点が話題に。
- GoogleのAgent Development Kit (ADK)やAgent2Agent (A2A)プロトコルに関するイベントも開催され、フレームワークや連携手法への関心も高い。
- Agent開発の難しさや実用化への課題も指摘されている。
久保田 雅也@Coalis: OpenAIのAIエージェントガイド https://t.co/StPcrY81hG
Hirosato Gamo | AI Cloud Solution Architect: やっぱりみんな同じ結論になるのか…という、Agent開発では絶対にぶつかる問題。LangGraphやADKのようなマルチエージェントフレームワークでは状態遷移を一定厳密に制御できる機能が準備されてるので、Agent間遷移もしっかり入れて堅い方式を取りがちなのだけれど、初期からそれをやると危険がある。遷 https://t.co/RG6pDKFVgn
Odashi: RAGはバズろうがバズるまいが天文学的な量のドキュメントを扱うとき実用上必要な技術なのでともかく、agentは「別になくてもいい」から脱出するのが難しい
Salesforce、直近コードの20%をAIが生成
- AIコーディングツールの普及により、ソフトウェア開発の生産性向上が進んでいます。
- Salesforceでは、直近で書かれたコードの20%がAIによって生成されたという具体的な事例が報告されました。
- AIと対話しながら開発する「Vibe Coding」や、AIをレビュアーとして活用するなど、開発プロセスにおけるAIの役割は変化し続けています。
Taro Fukuyama: Salesforceの直近のコードの20%はAIによって書かれています。 従業員数が7万人を超えるSalesforceですら、これだけのスピード感でAI開発を進めているのであれば、スタートアップこそ、さらにスピード感を持ってAIを活用していきたいところですね。 https://t.co/AWGaV1DM35
Kenn Ejima: あのぉ、2025年に入ってから感じませんか? なんか世の中のプロダクトの進化が異常に速くなってることに。 見えにくいけど、これ絶対AI Codingの影響だよね。
Taro Fukuyama: アンドリーセン・ホロウィッツ:AIはBPO市場を再構築する https://t.co/DWQ3kwbT5G
【続報】Grok、メモリ強化と画像対応音声対話を開始
- Grokに関する続報です。
- 既報のメモリ機能が強化され、iOSアプリでも参照チャットがサポートされました。
- 画像入力に対応した音声対話機能「Grok Voice with Vision」がiOSアプリで一部ユーザー向けに提供開始された模様です。
- CSVファイルのレポート作成機能にはバグ報告も上がっています。
TestingCatalog News 🗞: (翻訳) Grok for iOSも参照チャットをサポートしています。そこから過去の会話を閲覧したり、Grokに忘れさせたりすることができます。
Tetsuro Miyatake: xAIがGrokのメモリ機能を強化した。 https://t.co/0ucqjdGnZn
Tech Dev Notes: (翻訳) xAIはiOSアプリでGrok Voice with Visionの展開を開始しました!一部のユーザーは利用できるかもしれません
OpenAI、低コストAPI「Flex processing」提供開始
- OpenAIが、低コストでAIモデルを利用できる新しいAPIオプション「Flex processing」を発表した。
- o3やo4-miniといったモデルを対象に、処理速度は遅くなるもののAPIコストを半減させることができる。
- バッチ処理や非同期タスクなど、リアルタイム性が求められない用途での活用が期待される。
TechCrunch: (翻訳) OpenAI、より安価で遅いAIタスクのためのFlex processingを開始 https://t.co/PmZy9o3uPe
Tetsuro Miyatake: OpenAIがより低コストでAIモデルを支えるためのAPI機能「Flex processing」をローンチした。 最近ローンチしたo3やo4-miniを使いながら少し対応が遅い代わりにAPIコストを半減するようなオプションとなる。 https://t.co/WZTM1FYGGk
MCP続報: FastAPI実装例やCodex CLIサポート進む
- AIエージェント連携プロトコルMCPに関する続報です。
- FastAPIを用いたMCPサーバーの実装例や、ArduPilotドローンを操作するMCPサーバーの自作例が共有されています。
- また、OpenAIのCodex CLIでもMCPサポート追加に向けた開発が進められている模様です。
からあげ: メモ > FastAPIで始めるMCPサーバー|KMiura https://t.co/JmqfB4Db0d #zenn
からあげ: メモ > ArduPilotドローンを操作するMCPサーバーを自作する|fujihide https://t.co/CJcZzlf0B2 #zenn
Wolfram Ravenwolf: (翻訳) @OpenAI Codexのクライアントおよびサーバーmcpサポートに関する最初のPRが入りました。まだテスト中で作業中ですが、始まりです。私のブランチに貢献していただければ幸いです。うまくいけば利用されることを願っています! https://t.co/YxmHDBD6QR
AI創薬・生物学応用加速、DeepMind CEO発言も
- AI技術の生物学や創薬分野への応用が加速しています。
- Google AIは細胞情報をテキスト表現する新手法「Cell2Sentence-Scale」を発表しました。
- また、DeepMindのDemis Hassabis CEOは、AIによって今後10~15年で全ての病気を解決できる可能性があると発言し、注目を集めています。
- タンパク質生成AI「ProGen3」なども登場し、創薬への期待が高まっています。
Google AI: (翻訳) 本日ブログでCell2Sentence-Scaleを紹介します。これは細胞や生物学的情報をテキストとして最適に表現する方法を深く探求し、大規模言語モデルを用いた言語駆動型の単一細胞解析のエキサイティングな応用を開きます。詳細はこちら→https://t.co/Rzy4FSFnQY https://t.co/DxEbHUx8kI
Chubby♨️: (翻訳) https://t.co/PGSEQcQZY6 AIは生物学の新時代を切り開いています。以前は不可能だった開発が今可能になりつつあります。この新しいモデルは以下を可能にするはずです:
Chubby♨️: (翻訳) 「おそらく今後10年、15年で、実際にすべての病気を解決する本当のチャンスがあると思います。」私たちは地球上でこれまで見られなかった知性の誕生を目の当たりにしています。生きていることが素晴らしい時代です。 https://t.co/QgI8YDogY1
OpenAI、Cursor買収を試みるも失敗と報道
- OpenAIが、AIコーディングツールCursorを開発するAnysphere社の買収を過去に試みていたと報じられた。
- The Informationによると、OpenAIは昨年と今年の2度にわたり買収を持ちかけたが、Anysphere社に断られたという。
- 最近報じられたWindsurf社の買収検討の前に、Cursorに関心を示していた模様。
Tetsuro Miyatake: 最近OpenAIがAIコード生成企業のWindsurfを$3Bで買収することを検討しているというニュースが出たが、元々はCursorを開発しているAnysphereを買収しようとしていたらしい。 去年買収することに興味を示したがAnysphereが断り、今年も再度連絡したがダメだったとのこと。 https://t.co/hBju9j7hwP
TechCrunch: (翻訳) OpenAIは、Windsurfを30億ドルで買収する交渉に入る前に、Cursorメーカーを追跡していました https://t.co/Nv4R2tWN1h
まつにぃ: OpenAIのCodex CLIの作成者はCursorを利用している中で、OpenAIはWindsurfを買収仕掛け、4.1oはCopilotの方が強いのではという噂が沸き立つカオスな状況。
LMArena UI刷新、Netflix AI活用、TBS Gemini活用事例
- LLM評価プラットフォームLMArenaのUI刷新が報告されている。
- Netflixにおける広告レコメンドやコンテンツ制作補助でのAI活用が進んでいる模様。
- TBSテレビではGeminiを用いた映像メタデータ自動生成の実証実験が行われ、作業効率化への貢献が期待されている。
Philipp Schmid: (翻訳) LMArenaが新しいUIになります。ホットに見えます 🔥 https://t.co/ETQ5jXhEZk
パウロ: ネットフリックス、AIで加速しているっぽいですね 広告レコメンドとコンテンツ生成補助で 大量のユーザーデータ吸い上げることが出来るのは強い
Kimihiko Kitase ♨️ 北瀬 公彦: TBSテレビ: Gemini 1.5 Pro / 2.0 Flash で映像メタデータの自動生成を世界に先駆けて実現、作業効率化とクリエイティブな業務への注力も促進 https://t.co/oBgMuT7hVZ #googlecloud