19 4月 2025

2025年04月19日夜のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

Gemini 2.5 Proのポケモン制覇と新興AIモデルの台頭

Googleの「Gemini 2.5 Pro」がポケモン攻略でバッジ5つを獲得し、競合モデルを大きく引き離す進捗が話題です。一方、OpenAIの最新モデル「o3」は複雑タスク処理能力が高く評価される中、ハルシネーション増加の懸念も指摘されています。

国内ではABEJAがGPT-4o性能を超える独自AIモデル開発の報道があり、日本語処理に強みを持つとされます。AI業界ではMCPプロトコル議論や企業活用の多様化も進行中です。

それでは各話題の詳細について見ていきましょう。

Gemini 2.5 Pro、ポケモン攻略でバッジ5つ獲得【続報】
OpenAI o3、複雑タスク処理能力をBrockman氏ら評価【続報】
Kaggle新コンペ Image Matching Challenge 2025 開始
MCP続報: RAG比較やDB連携、実装議論が多様化
ABEJA、GPT-4o性能超え独自AIモデル開発と報道
OpenAI新モデルのハルシネーション増加をTechCrunchが報道【続報】
企業AI活用: Uber人材不足指摘、マーケティングでAgent活用増

Gemini 2.5 Pro、ポケモン攻略でバッジ5つ獲得【続報】

以前話題となったGemini 2.5 Proによるポケモン（レッド/ブルー）攻略デモの続報です。
GoogleのLogan Kilpatrick氏によると、Gemini 2.5 Proは5つ目のバッジを獲得し、他のモデル（最高3つ）を上回る成果を見せています。
Google CEOのSundar Pichai氏もこの進捗に言及し、「API (Artificial Pokémon Intelligence)に取り組んでいる」とユーモラスにコメントしました。

Logan Kilpatrick: (翻訳) Gemini 2.5 Proはポケモンのクリアに向けて大きな進歩を続けています！ 5つ目のバッジを獲得しました（次に優れたモデルはこれまでのところ3つしか獲得していませんが、エージェントハーネスは異なります）👀

Sundar Pichai: (翻訳) 私たちはAPI、人工ポケモン知能に取り組んでいます:)

シェイン・グウ: API (人工ポケモン知能) > AGI。Gemini 2.5 Pro現在バッジ5個。 https://t.co/q5HM0xVlhs

OpenAI o3、複雑タスク処理能力をBrockman氏ら評価【続報】

OpenAIの最新モデルo3について、複雑なタスク処理能力への評価が続いています【続報】。
共同創設者Greg Brockman氏もその能力を高く評価しています。
ユーザーからはAWSトラブルシューティング、ニッチ情報検索、Obsidianでの情報整理支援など、具体的な活用事例が報告されています。
単一プロンプトで複雑な作業をこなす点が注目される一方、非専門家による作業内容確認の難しさも指摘されています。

Greg Brockman: (翻訳) 複雑なタスクのためのo3:

Kenn Ejima: o3のおかげでAWSへの嫌悪感が減った CloudFrontの証明書が更新できないとかいう超絶面倒そうなメールが来てたけど、AWS Consoleのスクショをバンバン送りながら作業したらクリアできた AWS完全に捨てようと思ってたけど延命スクショも面倒いのでリアルタイム画面共有して音声サポートはよ

Nathan Lambert: (翻訳) o3の検索能力は信じられないほどです。大量の追加コンテキストなしで、非常にニッチな情報を見つけることができます。まさに同僚に言うようなことです。

Kaggle新コンペ Image Matching Challenge 2025 開始

Kaggleで新しいコンピュータビジョンコンペティション「Image Matching Challenge 2025」が開始されました。
このコンペでは、与えられた画像群を正しくグループ化し、各グループの画像から正確な3Dシーンを再構築するタスクに取り組みます。
入賞者はCVPR 2025ワークショップでの発表に招待される可能性があり、自動運転などで活用される3D再構成技術に関心のある参加者にとって注目のコンペです。

Yu Yamaguchi | チューリング CTO: Image Matching Challenge 2025、はじめました📸 画像がどのようにグループ化されるべきかを判断し、その上で正確な3Dシーンを再構築するコンペです。（入賞者？はCVPR WSへの発表招待も）会社では自動運転のための3D再構成にも取り組んでおり、そのあたりの知識も役立ちそうです https://t.co/wmGRPjqshB

Yu Yamaguchi | チューリング CTO: 業務はKaggleの役に立つ

からあげ: 「育児中でも、新しい挑戦はできる」データ分析未経験から、Kaggle金メダルをつかんだ女性の物語 - Findy Engineer Lab https://t.co/7wKZprnRdM #EngineerLab @findy_englabより

MCP続報: RAG比較やDB連携、実装議論が多様化

AIエージェント連携プロトコルMCPに関する議論の続報です。
RAGとの比較やデータベース連携の可能性など、新たな議論が始まっています。
Cursor Agent勉強会のアーカイブ公開、Streamable HTTP transport実装、スマホ用クライアント要望など、具体的な動きも出ています。

Kazunori Sato: [定期] RAG ≠ ベクトル検索。これは単にデータソースと要件の性質上mongodbが適していたという話。その手前をRAGにするかMCPにするかはまた別の話（ツール間連携やエージェントが不要な用途ならRAGでもいい） https://t.co/NRtnFG1Q0H

しま / 大嶋勇樹: 一昨日の勉強会のアーカイブ動画公開しました！ Cursor AgentによるパーソナルAIアシスタント育成入門―業務のプロンプト化・MCPの活用 #StudyCo https://t.co/ZAkd46YlwJ

からあげ: メモ > MCP + DB ＞ RAG?｜シンウフム https://t.co/cMFLYwcBpD #zenn

ABEJA、GPT-4o性能超え独自AIモデル開発と報道

日本のAI企業ABEJAが、OpenAIのGPT-4oの性能を上回る独自のAIモデルを開発したと日本経済新聞が報じました。
記事によると、このモデルは日本語処理能力に優れ、特定のベンチマークで高いスコアを記録したとされています。
国内企業による高性能な独自LLM開発の動きとして注目されます。

Ryosuke Hata: ABEJA、「GPT-4o」性能上回るAIモデル - 日本経済新聞 https://t.co/7QZx6S9DDf

OpenAI新モデルのハルシネーション増加をTechCrunchが報道【続報】

TechCrunchが、OpenAIの新しいAIモデルについて、以前のモデルよりもハルシネーション（もっともらしい嘘をつくこと）を起こしやすいと報じました【続報】
これは、以前から指摘されていた新モデルの課題の一つですが、今回の報道で懸念が改めて示された形です
モデルの高度化に伴う、信頼性・安全性確保の難しさが浮き彫りになっています

TechCrunch: (翻訳) OpenAIの新しい推論AIモデルはより多くハルシネーションを起こす

企業AI活用: Uber人材不足指摘、マーケティングでAgent活用増

企業におけるAI活用が様々な側面で進んでいます。
UberのCEOは、社内でAIを使いこなせる従業員が不足していると指摘し、AIスキルの重要性を強調しました。
マーケティング業務においてもAIエージェントの活用が増加していると報告されています。

Tetsuro Miyatake: UberではAIを上手く活用できる従業員が少なすぎるとCEOのDara Khosrowshahiが発言。より学校でAI技術の使い方が学べるプログラムをUberが支援するべきと語った。 Uber社内ではコードする際にAIエージェントを使えるようになるのは1年以内に必須になると述べた。 https://t.co/0FwRrUv8ti

Taro Fukuyama: Salesforceの直近のコードの20％はAIによって書かれています。従業員数が7万人を超えるSalesforceですら、これだけのスピード感でAI開発を進めているのであれば、スタートアップこそ、さらにスピード感を持ってAIを活用していきたいところですね。 https://t.co/QMcn4Bo3v8

Tetsuro Miyatake: 徐々により多くのマーケターは広告キャンペーンなどマーケティング業務をAIエージェントに任せている。 https://t.co/f4RlsHALK2