2025年04月09日 朝のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

Sakana AIが論文自動生成AIの詳細公開、AIコーディング支援ツールの進化が加速

Sakana AIとGoogle DeepMindが共同開発した論文自動生成AI「AI Scientist-v2」の技術レポートとコードが公開されました。新手法「Agentic Tree Search」により、AI生成論文がICLR 2025ワークショップで査読を通過した初の事例として注目されています。

AIコーディング支援も進化が続いており、Claude CodeやGitHub Copilotの外部モデル連携機能(BYOK)など新たな選択肢が増えています。また、OpenAIのEvals APIの公開やLangGraphの法律業務・ブラウザ操作への活用事例も報告されています。

それでは各トピックの詳細を見ていきましょう。

目次

  1. Sakana AI、論文自動生成AI Scientist-v2の詳細・コード公開
  2. MCP: FC比較に加え実装課題やハルシネーションが焦点に
  3. Claude Code、開発者から高評価、APIクレジット提供も
  4. Gemini 2.5 Pro、コーディング・壁打ちで高評価続く
  5. 新LLM DeepCogito公開、NVIDIA Nemotron-Ultra続報
  6. Claude CodeやCopilot BYOKなどAIコーディング支援が進化
  7. LangGraph活用広がる、法律業務やブラウザ操作自動化で事例
  8. Kaggle新コンペ開始、地球物理学的波形反転がテーマ
  9. OpenAI Evals API公開、評価の自動化・効率化へ

Sakana AI、論文自動生成AI Scientist-v2の詳細・コード公開

  • 先日発表された、Sakana AIとGoogle DeepMind共同開発の論文自動生成AI「AI Scientist-v2」について、技術レポートとコードが公開されました。
  • 導入された新手法「Agentic Tree Search」により、より柔軟で探索的な仮説検証や論文執筆が可能になったとされています。
  • AI生成論文がICLR 2025ワークショップレベルで査読を通過した初の事例としても注目されています。
Sakana AI: 進化したAIサイエンティスト、「The AI Scientist-v2」を公開 AIが完全自動で科学論文を生成するAIサイエンティストの改訂版、The AI Scientist-v2を公開しました。 論文:https://t.co/HBXB7jTXfF GitHub:https://t.co/2SEMs0OgNz 昨年8月のAI Scientist-v1から、以下の点で大きく進歩しました。 ...

hardmaru: (翻訳) 技術レポート「AI Scientist-v2: Agentic Tree Searchによるワークショップレベルの自動科学的発見」のリリースに興奮しています‼️ https://t.co/JdqPGFSqNE AI Scientist-v2は、「Agentic Tree Search」アプローチをワークフローに組み込み、より深く、より多くのことを可能にします

Kosuke Nakago: AI Scientist-v2のtech reportが公開されました! Quick summaryはこちら⬇️ (引用ツイート: Introducing The AI Scientist-v2, which produced the 1st fully AI-generated paper to pass peer review at a workshop level (at @iclr_...

MCP: FC比較に加え実装課題やハルシネーションが焦点に

  • AIエージェント連携プロトコルMCPに関する議論の続報です。
  • Function Calling(FC)との比較に加え、Claude利用時のハルシネーション発生や、クライアント側のStreamable HTTP対応状況が新たな論点となっています。
  • Playwright MCPをLangGraphで利用する実装例も共有されましたが、プロトコルの曖昧さや実装上の課題も依然として指摘されています。
西見 公宏 | Generative Agents: fetchをMCPサーバに加えると、Claudeが延々とハルシネーションしたURLをfetchに与え続ける病を患う。 MCPサーバが自己申告したdescriptionをもとにツールを呼び出そうとするので、どのツールを選択するとタスクがこなせるかは、LLMにとってはガチャに近い。ここがチューニングのポイントですね。

Hirosato Gamo | AI Cloud Solution Architect: MCP vs Function Calling比較っておかしいよねって話したんですが、そもそもネット上のユーザで勝手に比較しているだけで、調べていくとAnthropicが公式に触れている記載は見つけられない。やっぱ使えるLLMならFC併用で良い。 結構な数ヒットするけど誰が言い出したんだこれ。

Hirosato Gamo | AI Cloud Solution Architect: MCPのコンセプトも手続きの中身も、誰かが言ってたけどプロトコルと呼ぶにはフワフワしてるから厳密に向き合って悩み始めたら負け感ある。ポイントだけ押さえて良いとこ取りするくらいの気概で良いのかもしれない。

Claude Code、開発者から高評価、APIクレジット提供も

  • AnthropicのClaude 3.7 Sonnet (Claude Code) が、コーディングタスクにおいて高い性能を発揮すると開発者から評価されています。
  • AIコード生成やデザインパターンの実装などで特に有用との声が上がっています。
  • AnthropicがClaude Codeに関するツイート投稿者にAPIクレジットを提供するキャンペーンを実施していることも話題になっています。
Masato Naka: Devin->Cursor->Clineからの最近はClaude Codeがマイブーム! Claude Codeが結構かゆいところに手が届く!

elvis: (翻訳) Claude 3.7 Sonnetは、私がコードに使用するデフォルトのモデルです。他のモデルと比較して、パフォーマンスの違いは驚異的です。Claude 3.7 Sonnetは、AIコードの生成、スタータープロンプト、一般的なデザインパターンの実装に非常に役立ちます。Claude 3.7 Sonnetは、「AIを構築するためのAI」の分野をリードしています。

morgan —: (翻訳) anthropicはclaude codeについてツイートした人にAPIクレジットで50ドル支払っています

Gemini 2.5 Pro、コーディング・壁打ちで高評価続く

  • GoogleのGemini 2.5 Proが、特にコーディング能力やアイデアの壁打ち相手として高い評価を得ています。
  • 長いコードを一括生成する能力や、思考の深さがユーザーに好まれています。
  • 一方で、ツールコール後に必ず思考ステップが入る挙動や、インフラ構成案でAWSを提案する点などが指摘されています。
  • Embedding APIの無料利用も可能です。
限界助教|ChatGPT/Claude/Geminiで論文作成と科研費申請: 【更新情報】Gemini用のpromptを追加しました! 是非Gemini2.5Proでやってみてください アイディアの壁打ちではo1Proと同等かそれ以上の知性のきらめきを感じることができる思います すみませんが1週間後に少し値上げさせていただきます🙏 https://t.co/aa9NzndpkP https://t.co/PnsOs1gc8w

Torishima / INTP: 今使っていてわかったんだが、Gemini 2.5 Pro は一発でめちゃくちゃ長いコードを書いてくれるので、Agent を無理に使わなくても Manual で全コードを出力してくれればもういいやんってなっちゃうな Manual の存在価値 (引用ツイート: Gemini 2.5 Pro が出てから神様仏様 Gemini 2.5 Pro 様〜〜〜〜〜ってくらい進捗が良い)

coji 溝口浩二: 最近、Embedding は OpenAI の API 使うとちょっとだけだけど課金されるので Gemini を使って無料でやってます。性能・品質はまったく遜色なし。

新LLM DeepCogito公開、NVIDIA Nemotron-Ultra続報

  • 新たなオープンソースLLM「DeepCogito」が公開されました。反復蒸留と増幅(IDA)の研究に基づき、3Bから70Bまでのモデルが利用可能です。Ollamaでもサポートされています。
  • 先日お伝えしたNVIDIAの推論特化モデル「Llama-Nemotron-Ultra (253B)」については、ライセンスの扱いに一部疑問の声が上がっている状況です。
ollama: (翻訳) すごい!これらのモデルはDeepSeek R1蒸留よりも改善されており、デバイス上で実行できるサイズです!😍 ollama run cogito さまざまなモデルパラメータサイズのモデルページを確認してください: https://t.co/9FaOzKbPII

TechCrunch: (翻訳) Deep CogitoがハイブリッドAI「推論」モデルでステルスから登場

Aratako: これに限らず最近のNVIDIAのLlama3.1派生モデルはLlama3.1ライセンスを直接継承していないようだけど、この書き方はどういう解釈をすればいいんだろうか https://t.co/qXffi9Q2lB https://t.co/sD7wJYtkV0 https://t.co/yBBx6IvC09 https://t.co/MMSdRWT9D0 (引用ツイート: We are ex...

Claude CodeやCopilot BYOKなどAIコーディング支援が進化

  • AIコーディング支援ツールの進化が続いています。
  • Claude Codeはその使い勝手の良さが話題になっています。
  • GitHub Copilotでは、AnthropicやGeminiなど外部モデルをAPIキーで利用できるBYOK機能がプレビュー公開されました。
  • BYOK機能について、将来的にはllama.cppへの対応を望む声も上がっています。
Iaiso: Cursorのコード編集はClineよりどの程度早いのか? https://t.co/3TVawbp7rQ

Kazuhiro Sera (瀬良): 仕事でJava を書かなくなりPython もちょっとしたものは Cursor で vibe coding なので、すっかり JetBrains IDE 離れしてしまった。とはいえ JetBrains もキャッチアップしていくはず(既にしている?)なので PyCharm で同じ使い勝手になったらやっぱり戻りたい。

Georgi Gerganov: (翻訳) ここにllama.cppを追加してほしい場合はリツイートしてください 👇

LangGraph活用広がる、法律業務やブラウザ操作自動化で事例

  • AIエージェント構築フレームワークLangGraphの活用事例が報告されています。
  • 法律事務所向けAIエージェント開発企業Definelyが、Microsoft Word内で複雑な法的タスクを処理するマルチエージェントシステムにLangGraphを利用している事例が紹介されました。
  • また、Playwright MCP(ブラウザ操作ツール)とLangGraphを連携させる方法についての技術記事も公開されています。
LangChain: (翻訳) ⚖️ DefinelyがLangGraphを使用して弁護士向けAIエージェントを構築する方法 Definelyは、Microsoft Wordに直接組み込まれたAIエージェントを使用して、弁護士が複雑な法的業務に取り組むのを支援しています。LangGraphを使用すると、彼らのマルチエージェントシステムは次のことができます: 🧠 法的タスクを管理可能なサブタスクに分解する 📃 抽出...

Harrison Chase: (翻訳) 法律分野向けのAIはROIの高いユースケースです このケーススタディを紹介できることを嬉しく思います!

asap: Playwrite MCPをLangGraphで利用する方法について記事を書きました! LangChain MCP Adaptersを利用すれば、単純なtoolとしてMCPをLangchainで利用できるから、学習コストが低くて嬉しい。 【Playwright MCP】を利用したエージェントを【LangGraph】で構築する|asap https://t.co/l393dpQBfG #zenn

Kaggle新コンペ開始、地球物理学的波形反転がテーマ

  • Kaggleで新しいコンペティション「Yale/UNC-CH - Geophysical Waveform Inversion」が開始されました。
  • このコンペでは、反射法地震探査データを用いて地下構造を高精度に推定する手法の開発が求められます。
  • メダル対象のKernel限定ではないコンペで、締切は2025年6月30日です。
Kagoole: (翻訳) 新しい#kaggleコンペティション「Yale/UNC-CH - Geophysical Waveform Inversion」が開始されました。 メダル:True カーネルのみ:False 締切:2025-06-30 23:59:00+00:00 https://t.co/N6OmnI6nMH

Jun Koda: フムン (引用ツイート: New #kaggle competition " Yale/UNC-CH - Geophysical Waveform Inversion" is launched. Medal: True Kernel Only: False Deadline: 2025-06-30 23:59:00+00:00 https://t.co/N6OmnI6nMH)

Takami Sato @ 4/28まで一時帰国: Kaggle新コンペ 反射法地震探査による地質構造の推定改善コンペ。何か昔の塩コンペを思い出す https://t.co/KYK17Q2UTn

OpenAI Evals API公開、評価の自動化・効率化へ

  • OpenAIが、モデル評価をプログラム経由で実行できる「Evals API」を公開しました。
  • これにより、テストの定義、評価の自動実行、プロンプトの迅速なイテレーションが可能になります。
  • 従来ダッシュボードから利用可能だった評価機能をAPI経由でワークフローに統合できるようになり、開発効率の向上が期待されます。
Romain Huet: (翻訳) 開発者の皆様、@OpenAI APIを使用してプログラムで評価を作成および実行できるようになりました。

OpenAI Developers: (翻訳) Evals API のご紹介。 プログラムでテストを定義し、評価の実行を自動化し、プロンプトを迅速に反復できるようになりました。 Evals は引き続きダッシュボードで利用できます。そして今では API を通じて利用できるため、ワークフローのどこにでも統合できます。

Subscribe to ML_Bear Times

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください