2025年04月19日 夜のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

Gemini 2.5 Proのポケモン制覇と新興AIモデルの台頭

Googleの「Gemini 2.5 Pro」がポケモン攻略でバッジ5つを獲得し、競合モデルを大きく引き離す進捗が話題です。一方、OpenAIの最新モデル「o3」は複雑タスク処理能力が高く評価される中、ハルシネーション増加の懸念も指摘されています。

国内ではABEJAがGPT-4o性能を超える独自AIモデル開発の報道があり、日本語処理に強みを持つとされます。AI業界ではMCPプロトコル議論や企業活用の多様化も進行中です。

それでは各話題の詳細について見ていきましょう。

目次

  1. Gemini 2.5 Pro、ポケモン攻略でバッジ5つ獲得【続報】
  2. OpenAI o3、複雑タスク処理能力をBrockman氏ら評価【続報】
  3. Kaggle新コンペ Image Matching Challenge 2025 開始
  4. MCP続報: RAG比較やDB連携、実装議論が多様化
  5. ABEJA、GPT-4o性能超え独自AIモデル開発と報道
  6. OpenAI新モデルのハルシネーション増加をTechCrunchが報道【続報】
  7. 企業AI活用: Uber人材不足指摘、マーケティングでAgent活用増

Gemini 2.5 Pro、ポケモン攻略でバッジ5つ獲得【続報】

  • 以前話題となったGemini 2.5 Proによるポケモン(レッド/ブルー)攻略デモの続報です。
  • GoogleのLogan Kilpatrick氏によると、Gemini 2.5 Proは5つ目のバッジを獲得し、他のモデル(最高3つ)を上回る成果を見せています。
  • Google CEOのSundar Pichai氏もこの進捗に言及し、「API (Artificial Pokémon Intelligence)に取り組んでいる」とユーモラスにコメントしました。
Logan Kilpatrick: (翻訳) Gemini 2.5 Proはポケモンのクリアに向けて大きな進歩を続けています! 5つ目のバッジを獲得しました(次に優れたモデルはこれまでのところ3つしか獲得していませんが、エージェントハーネスは異なります)👀

Sundar Pichai: (翻訳) 私たちはAPI、人工ポケモン知能に取り組んでいます:)

シェイン・グウ: API (人工ポケモン知能) > AGI。Gemini 2.5 Pro現在バッジ5個。 https://t.co/q5HM0xVlhs

OpenAI o3、複雑タスク処理能力をBrockman氏ら評価【続報】

  • OpenAIの最新モデルo3について、複雑なタスク処理能力への評価が続いています【続報】。
  • 共同創設者Greg Brockman氏もその能力を高く評価しています。
  • ユーザーからはAWSトラブルシューティング、ニッチ情報検索、Obsidianでの情報整理支援など、具体的な活用事例が報告されています。
  • 単一プロンプトで複雑な作業をこなす点が注目される一方、非専門家による作業内容確認の難しさも指摘されています。
Greg Brockman: (翻訳) 複雑なタスクのためのo3:

Kenn Ejima: o3のおかげでAWSへの嫌悪感が減った CloudFrontの証明書が更新できないとかいう超絶面倒そうなメールが来てたけど、AWS Consoleのスクショをバンバン送りながら作業したらクリアできた AWS完全に捨てようと思ってたけど延命 スクショも面倒いのでリアルタイム画面共有して音声サポートはよ

Nathan Lambert: (翻訳) o3の検索能力は信じられないほどです。大量の追加コンテキストなしで、非常にニッチな情報を見つけることができます。まさに同僚に言うようなことです。

Kaggle新コンペ Image Matching Challenge 2025 開始

  • Kaggleで新しいコンピュータビジョンコンペティション「Image Matching Challenge 2025」が開始されました。
  • このコンペでは、与えられた画像群を正しくグループ化し、各グループの画像から正確な3Dシーンを再構築するタスクに取り組みます。
  • 入賞者はCVPR 2025ワークショップでの発表に招待される可能性があり、自動運転などで活用される3D再構成技術に関心のある参加者にとって注目のコンペです。
Yu Yamaguchi | チューリング CTO: Image Matching Challenge 2025、はじめました📸 画像がどのようにグループ化されるべきかを判断し、その上で正確な3Dシーンを再構築するコンペです。(入賞者?はCVPR WSへの発表招待も) 会社では自動運転のための3D再構成にも取り組んでおり、そのあたりの知識も役立ちそうです https://t.co/wmGRPjqshB

Yu Yamaguchi | チューリング CTO: 業務はKaggleの役に立つ

からあげ: 「育児中でも、新しい挑戦はできる」データ分析未経験から、Kaggle金メダルをつかんだ女性の物語 - Findy Engineer Lab https://t.co/7wKZprnRdM #EngineerLab @findy_englabより

MCP続報: RAG比較やDB連携、実装議論が多様化

  • AIエージェント連携プロトコルMCPに関する議論の続報です。
  • RAGとの比較やデータベース連携の可能性など、新たな議論が始まっています。
  • Cursor Agent勉強会のアーカイブ公開、Streamable HTTP transport実装、スマホ用クライアント要望など、具体的な動きも出ています。
Kazunori Sato: [定期] RAG ≠ ベクトル検索。これは単にデータソースと要件の性質上mongodbが適していたという話。その手前をRAGにするかMCPにするかはまた別の話(ツール間連携やエージェントが不要な用途ならRAGでもいい) https://t.co/NRtnFG1Q0H

しま / 大嶋勇樹: 一昨日の勉強会のアーカイブ動画公開しました! Cursor AgentによるパーソナルAIアシスタント育成入門―業務のプロンプト化・MCPの活用 #StudyCo https://t.co/ZAkd46YlwJ

からあげ: メモ > MCP + DB > RAG?|シンウフム https://t.co/cMFLYwcBpD #zenn

ABEJA、GPT-4o性能超え独自AIモデル開発と報道

  • 日本のAI企業ABEJAが、OpenAIのGPT-4oの性能を上回る独自のAIモデルを開発したと日本経済新聞が報じました。
  • 記事によると、このモデルは日本語処理能力に優れ、特定のベンチマークで高いスコアを記録したとされています。
  • 国内企業による高性能な独自LLM開発の動きとして注目されます。
Ryosuke Hata: ABEJA、「GPT-4o」性能上回るAIモデル - 日本経済新聞 https://t.co/7QZx6S9DDf

OpenAI新モデルのハルシネーション増加をTechCrunchが報道【続報】

  • TechCrunchが、OpenAIの新しいAIモデルについて、以前のモデルよりもハルシネーション(もっともらしい嘘をつくこと)を起こしやすいと報じました【続報】
  • これは、以前から指摘されていた新モデルの課題の一つですが、今回の報道で懸念が改めて示された形です
  • モデルの高度化に伴う、信頼性・安全性確保の難しさが浮き彫りになっています
TechCrunch: (翻訳) OpenAIの新しい推論AIモデルはより多くハルシネーションを起こす

企業AI活用: Uber人材不足指摘、マーケティングでAgent活用増

  • 企業におけるAI活用が様々な側面で進んでいます。
  • UberのCEOは、社内でAIを使いこなせる従業員が不足していると指摘し、AIスキルの重要性を強調しました。
  • マーケティング業務においてもAIエージェントの活用が増加していると報告されています。
Tetsuro Miyatake: UberではAIを上手く活用できる従業員が少なすぎるとCEOのDara Khosrowshahiが発言。 より学校でAI技術の使い方が学べるプログラムをUberが支援するべきと語った。 Uber社内ではコードする際にAIエージェントを使えるようになるのは1年以内に必須になると述べた。 https://t.co/0FwRrUv8ti

Taro Fukuyama: Salesforceの直近のコードの20%はAIによって書かれています。 従業員数が7万人を超えるSalesforceですら、これだけのスピード感でAI開発を進めているのであれば、スタートアップこそ、さらにスピード感を持ってAIを活用していきたいところですね。 https://t.co/QMcn4Bo3v8

Tetsuro Miyatake: 徐々により多くのマーケターは広告キャンペーンなどマーケティング業務をAIエージェントに任せている。 https://t.co/f4RlsHALK2

Subscribe to ML_Bear Times

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください