2025年04月19日 夜のAIニュースまとめ
(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください
Gemini 2.5 Proのポケモン制覇と新興AIモデルの台頭
Googleの「Gemini 2.5 Pro」がポケモン攻略でバッジ5つを獲得し、競合モデルを大きく引き離す進捗が話題です。一方、OpenAIの最新モデル「o3」は複雑タスク処理能力が高く評価される中、ハルシネーション増加の懸念も指摘されています。
国内ではABEJAがGPT-4o性能を超える独自AIモデル開発の報道があり、日本語処理に強みを持つとされます。AI業界ではMCPプロトコル議論や企業活用の多様化も進行中です。
それでは各話題の詳細について見ていきましょう。
目次
- Gemini 2.5 Pro、ポケモン攻略でバッジ5つ獲得【続報】
- OpenAI o3、複雑タスク処理能力をBrockman氏ら評価【続報】
- Kaggle新コンペ Image Matching Challenge 2025 開始
- MCP続報: RAG比較やDB連携、実装議論が多様化
- ABEJA、GPT-4o性能超え独自AIモデル開発と報道
- OpenAI新モデルのハルシネーション増加をTechCrunchが報道【続報】
- 企業AI活用: Uber人材不足指摘、マーケティングでAgent活用増
Gemini 2.5 Pro、ポケモン攻略でバッジ5つ獲得【続報】
- 以前話題となったGemini 2.5 Proによるポケモン(レッド/ブルー)攻略デモの続報です。
- GoogleのLogan Kilpatrick氏によると、Gemini 2.5 Proは5つ目のバッジを獲得し、他のモデル(最高3つ)を上回る成果を見せています。
- Google CEOのSundar Pichai氏もこの進捗に言及し、「API (Artificial Pokémon Intelligence)に取り組んでいる」とユーモラスにコメントしました。
Logan Kilpatrick: (翻訳) Gemini 2.5 Proはポケモンのクリアに向けて大きな進歩を続けています! 5つ目のバッジを獲得しました(次に優れたモデルはこれまでのところ3つしか獲得していませんが、エージェントハーネスは異なります)👀
Sundar Pichai: (翻訳) 私たちはAPI、人工ポケモン知能に取り組んでいます:)
シェイン・グウ: API (人工ポケモン知能) > AGI。Gemini 2.5 Pro現在バッジ5個。 https://t.co/q5HM0xVlhs
OpenAI o3、複雑タスク処理能力をBrockman氏ら評価【続報】
- OpenAIの最新モデルo3について、複雑なタスク処理能力への評価が続いています【続報】。
- 共同創設者Greg Brockman氏もその能力を高く評価しています。
- ユーザーからはAWSトラブルシューティング、ニッチ情報検索、Obsidianでの情報整理支援など、具体的な活用事例が報告されています。
- 単一プロンプトで複雑な作業をこなす点が注目される一方、非専門家による作業内容確認の難しさも指摘されています。
Greg Brockman: (翻訳) 複雑なタスクのためのo3:
Kenn Ejima: o3のおかげでAWSへの嫌悪感が減った CloudFrontの証明書が更新できないとかいう超絶面倒そうなメールが来てたけど、AWS Consoleのスクショをバンバン送りながら作業したらクリアできた AWS完全に捨てようと思ってたけど延命 スクショも面倒いのでリアルタイム画面共有して音声サポートはよ
Nathan Lambert: (翻訳) o3の検索能力は信じられないほどです。大量の追加コンテキストなしで、非常にニッチな情報を見つけることができます。まさに同僚に言うようなことです。
Kaggle新コンペ Image Matching Challenge 2025 開始
- Kaggleで新しいコンピュータビジョンコンペティション「Image Matching Challenge 2025」が開始されました。
- このコンペでは、与えられた画像群を正しくグループ化し、各グループの画像から正確な3Dシーンを再構築するタスクに取り組みます。
- 入賞者はCVPR 2025ワークショップでの発表に招待される可能性があり、自動運転などで活用される3D再構成技術に関心のある参加者にとって注目のコンペです。
Yu Yamaguchi | チューリング CTO: Image Matching Challenge 2025、はじめました📸 画像がどのようにグループ化されるべきかを判断し、その上で正確な3Dシーンを再構築するコンペです。(入賞者?はCVPR WSへの発表招待も) 会社では自動運転のための3D再構成にも取り組んでおり、そのあたりの知識も役立ちそうです https://t.co/wmGRPjqshB
Yu Yamaguchi | チューリング CTO: 業務はKaggleの役に立つ
からあげ: 「育児中でも、新しい挑戦はできる」データ分析未経験から、Kaggle金メダルをつかんだ女性の物語 - Findy Engineer Lab https://t.co/7wKZprnRdM #EngineerLab @findy_englabより
MCP続報: RAG比較やDB連携、実装議論が多様化
- AIエージェント連携プロトコルMCPに関する議論の続報です。
- RAGとの比較やデータベース連携の可能性など、新たな議論が始まっています。
- Cursor Agent勉強会のアーカイブ公開、Streamable HTTP transport実装、スマホ用クライアント要望など、具体的な動きも出ています。
Kazunori Sato: [定期] RAG ≠ ベクトル検索。これは単にデータソースと要件の性質上mongodbが適していたという話。その手前をRAGにするかMCPにするかはまた別の話(ツール間連携やエージェントが不要な用途ならRAGでもいい) https://t.co/NRtnFG1Q0H
しま / 大嶋勇樹: 一昨日の勉強会のアーカイブ動画公開しました! Cursor AgentによるパーソナルAIアシスタント育成入門―業務のプロンプト化・MCPの活用 #StudyCo https://t.co/ZAkd46YlwJ
からあげ: メモ > MCP + DB > RAG?|シンウフム https://t.co/cMFLYwcBpD #zenn
ABEJA、GPT-4o性能超え独自AIモデル開発と報道
- 日本のAI企業ABEJAが、OpenAIのGPT-4oの性能を上回る独自のAIモデルを開発したと日本経済新聞が報じました。
- 記事によると、このモデルは日本語処理能力に優れ、特定のベンチマークで高いスコアを記録したとされています。
- 国内企業による高性能な独自LLM開発の動きとして注目されます。
Ryosuke Hata: ABEJA、「GPT-4o」性能上回るAIモデル - 日本経済新聞 https://t.co/7QZx6S9DDf
OpenAI新モデルのハルシネーション増加をTechCrunchが報道【続報】
- TechCrunchが、OpenAIの新しいAIモデルについて、以前のモデルよりもハルシネーション(もっともらしい嘘をつくこと)を起こしやすいと報じました【続報】
- これは、以前から指摘されていた新モデルの課題の一つですが、今回の報道で懸念が改めて示された形です
- モデルの高度化に伴う、信頼性・安全性確保の難しさが浮き彫りになっています
TechCrunch: (翻訳) OpenAIの新しい推論AIモデルはより多くハルシネーションを起こす
企業AI活用: Uber人材不足指摘、マーケティングでAgent活用増
- 企業におけるAI活用が様々な側面で進んでいます。
- UberのCEOは、社内でAIを使いこなせる従業員が不足していると指摘し、AIスキルの重要性を強調しました。
- マーケティング業務においてもAIエージェントの活用が増加していると報告されています。
Tetsuro Miyatake: UberではAIを上手く活用できる従業員が少なすぎるとCEOのDara Khosrowshahiが発言。 より学校でAI技術の使い方が学べるプログラムをUberが支援するべきと語った。 Uber社内ではコードする際にAIエージェントを使えるようになるのは1年以内に必須になると述べた。 https://t.co/0FwRrUv8ti
Taro Fukuyama: Salesforceの直近のコードの20%はAIによって書かれています。 従業員数が7万人を超えるSalesforceですら、これだけのスピード感でAI開発を進めているのであれば、スタートアップこそ、さらにスピード感を持ってAIを活用していきたいところですね。 https://t.co/QMcn4Bo3v8
Tetsuro Miyatake: 徐々により多くのマーケターは広告キャンペーンなどマーケティング業務をAIエージェントに任せている。 https://t.co/f4RlsHALK2