2025年04月16日 朝のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

GPT-4.1の評価と安全性、Claude新機能、OpenAIのソーシャル計画

GPT-4.1の性能評価に様々な声が上がる中、安全性レポートが未公開である点が注目されています。

一方、AnthropicはClaudeに「Research」機能とGoogle Workspace連携を追加し、GoogleもVeo 2による動画生成AIをGemini Advancedで提供開始しました。

OpenAIのX風ソーシャルネットワーク開発計画や、Deepmindの自己発見型RLアルゴリズムなど、AI業界の新たな展開も続々と報じられています。

それでは、各トピックの詳細を見ていきましょう。

目次

  1. (続報) GPT-4.1、性能評価と安全性レポート未公開に注目
  2. Claude Research機能(β)とWorkspace連携を追加【続報】
  3. Google、動画生成AI Veo 2をGemini Advancedで提供開始【続報】
  4. 【続報】Grok、音声モード・Workspace等を追加
  5. OpenAI、X風ソーシャルネットワーク開発中との報道
  6. OpenAI、安全性フレームワーク更新 AIリスク管理を強化
  7. Google DeepMind、自己発見型RLアルゴリズム開発を発表
  8. KaggleとGoogle Colabの連携強化、開発体験向上へ
  9. MCP/A2A続報: LINEが公式MCPツール公開
  10. Microsoft、ゼロから学習したBitNet新モデルを公開
  11. フリーランス開発者、AI利用料の経費計上が話題に

(続報) GPT-4.1、性能評価と安全性レポート未公開に注目

  • 先日発表されたOpenAIのGPT-4.1ファミリーについて続報です。
  • 開発者からは、簡単なタスクには高速だが複雑な指示追従には課題がある、といった性能評価の声が上がっています。
  • Cursorなどの開発ツールへの導入も進んでいますが、一部ではGPT-4.1 miniがGPT-4.1本体を上回る性能を示すケースも報告されています。
  • また、通常モデルリリース時に公開される安全性レポート(System Card)がGPT-4.1では未公開である点も注目されています。
Torishima / INTP: GPT-4.1 、確かに処理に忠実だけど良くも悪くも癖がなくてそこまで気が利いたりもしない感じ

Ian Nuttall: (翻訳) gpt-4.1は、小規模でシンプルなプロジェクトや簡単なモックアップには適している...しかし、より難しいタスクにはまだ苦労している

TechCrunch: (翻訳) OpenAIはGPT-4.1を安全性レポートなしで出荷

Claude Research機能(β)とWorkspace連携を追加【続報】

  • AnthropicのClaudeに新機能が追加されました。
  • 以前お伝えしたDeep Research機能(コードネーム: Compass)に相当すると見られる「Research」機能(ベータ版)が、Max, Team, Enterpriseプラン向けに提供開始されました。
  • また、全ての有料プランでGoogle Workspaceとの連携が可能になり、Gmail、Google Drive、Google Calendarの情報をClaudeが読み取れるようになりました。
  • これにより、ユーザーは自身のデータやWeb上の情報を組み合わせて、よりパーソナライズされた回答や調査結果を得られるようになります。
TechCrunch: (翻訳) AnthropicのClaudeがあなたのGmailを読めるように

ぬこぬこ: Anthropic の Claude に Research、Google Workspace 連携、エンプラ RAG、ウェブ検索(日本)が追加 Research は複数回の検索を通して自律的にエージェントが調査する機能。ウェブ検索と Deep Research https://t.co/ccDlekLD1O

まつにぃ: ClaudeにWEB検索に加えてGmailとGoogleカレンダー、Googleドライブ連携が正式サポートされましたね。 WEB検索自体はMCPのBraveに近い挙動のなので馴染みがあり、また各種Googleサービス連携は書き込み不可の、読み取りのみっぽいですね。 ただMCP連携しなくてもこの辺できるのが手軽で良き。 https://t.co/JM6iFBIWqa

Google、動画生成AI Veo 2をGemini Advancedで提供開始【続報】

  • Googleの動画生成AI「Veo 2」が、Gemini Advancedユーザー向けに提供開始されました。【続報】
  • テキストプロンプトから高品質な8秒間の動画を生成できます。
  • 画像編集ツール「Whisk」経由での画像からの動画生成も今後可能になる予定です。
  • Klingなど競合モデルが登場する中、Googleも動画生成分野での開発を加速させています。
TechCrunch: (翻訳) GoogleのVeo 2動画生成モデルがGeminiに登場

ChatGPT研究所: 【速報】Google動画AI「Veo 2」、Gemini App/Whiskで提供開始 Googleの新動画AI「Veo 2」がGemini Advanced (テキスト入力) とWhisk (画像入力+animate) 経由で使えるようになりました。1~2分程で8秒の動画が生成されます。 Google One AI Premium加入者が利用可能です↓ https://t.co/YRQ4...

TestingCatalog News 🗞: (翻訳) 速報🚨: GoogleがGemini Advancedユーザー向けにVEO 2の展開を開始しました。Veo 2はWhiskでも利用可能になります👀

【続報】Grok、音声モード・Workspace等を追加

  • Grokに関する続報です。
  • Androidアプリに続き、iOSアプリでも音声モードが提供開始されました。
  • Web検索結果のソース表示も改善されています。
  • ChatGPTのGPTs等に相当する「Workspace」機能が実装され、カスタムAIを作成可能です。
  • Web版では画像編集機能が追加され、将来的にPythonコード実行機能も搭載見込みです。
Kol Tregaskes: (翻訳) Grok Androidが話せるようになった。Grok Voiceは私がタイプしている間に展開中、アプリを更新してください。

限界助教|ChatGPT/Claude/Geminiで論文作成と科研費申請: GrokにWorkspaceなるGPTsやGems的な機能が実装されてますね 全然話題になってませんでしたが3日前くらいから出ていたようです https://t.co/S6SavoAH0n

Tech Dev Notes: (翻訳) Grok WebにまもなくPythonコード実行機能が搭載されます!チャート作成やコード実行が可能になります!

OpenAI、X風ソーシャルネットワーク開発中との報道

  • OpenAIが、X (旧Twitter) に似たソーシャルネットワークを開発中であると複数のメディアが報じている。
  • 報道によると、社内ではChatGPTの画像生成機能を中心としたソーシャルフィードのプロトタイプが存在し、投稿機能は「yeet」と呼ばれているという。
  • CEOのSam Altman氏が外部関係者に意見を求めているとも伝えられており、今後の動向が注目される。
Chubby♨️: (翻訳) OpenAIはソーシャルネットワークを構築中 OpenAIは独自のソーシャルネットワークを開発中であると、複数の情報筋が伝えている。内部プロトタイプはChatGPTの画像生成を中心としたソーシャルフィードに焦点を当てている。サム・アルトマンはすでに外部の人々にフィードバックを求めている。この開発は激化する

unusual_whales: (翻訳) 速報:FORTUNEによると、OpenAIは独自のX風ソーシャルネットワークに取り組んでいる

TechCrunch: (翻訳) OpenAIは独自のX風ソーシャルメディアプラットフォームを開発中と報じられている

OpenAI、安全性フレームワーク更新 AIリスク管理を強化

  • OpenAIは、高度なAI能力が深刻な危害をもたらす可能性に備えるための「Preparedness Framework」を更新した。
  • この更新では、新たなリスクをどのように追跡し、それらのリスクを十分に最小化する安全策を構築するプロセスが明確化された。
  • また、競合他社が「高リスク」なAIをリリースした場合、自社の安全対策を「調整」する可能性も示唆しており、AI開発競争における安全性のバランスが議論されている。
OpenAI: (翻訳) 重大な危害につながる可能性のある高度なAI能力を追跡し、準備するためのPreparedness Frameworkを更新しました。この更新では、新しいリスクをどのように追跡し、それらのリスクを十分に最小化する安全策を構築することが何を意味するのかを明確にしています。

TechCrunch: (翻訳) OpenAIは、競合他社が「高リスク」なAIをリリースした場合、その安全策を「調整」する可能性がある

TechCrunch: (翻訳) OpenAIはGPT-4.1を安全性レポートなしで出荷

Google DeepMind、自己発見型RLアルゴリズム開発を発表

  • Google DeepMindの研究者が、強化学習(RL)を用いて自己のRLアルゴリズムを発見するシステムを構築したと発表した。
  • このAIによって設計されたシステムは、人間が長年開発してきた既存のRLアルゴリズムを上回る性能を示したという。
  • この成果は、AIが自己改善能力を獲得し、科学的発見や技術革新を自動化する可能性を示唆するものとして、ASI(人工超知能)の実現が近づいているとの声も上がっている。
Chubby♨️: (翻訳) https://t.co/ZNUu3rQZG4 「我々はRLを使って独自のRLアルゴリズムを発見するシステムを構築した。」 我々はそれを成し遂げた。ASIは手の届くところにある。すべてが変わるだろう。後戻りはできない。

Chubby♨️: (翻訳) いくつかのAIエージェントは「睡眠」を学習した - そのため、より良く学習する。人間の脳の働きにどれほど近いかは驚くべきことだ https://t.co/eawKNbJdiK

The Information: (翻訳) OpenAIの最新のブレークスルーは、新しいアイデアを思いつくAIだ。

KaggleとGoogle Colabの連携強化、開発体験向上へ

  • KaggleとGoogle Colabの連携機能が強化された。これにより、両プラットフォーム間での作業がよりシームレスになる。
  • 主な改善点として、ノートブックの最新状態の同期、KaggleビューアからのColabでの直接編集、コンペティションへのリンク、複数ノートブックのインポートなどが可能になった。
  • データサイエンティストや機械学習エンジニアにとって、より効率的な開発環境が提供される。
Kaggle: (翻訳) 🚀 機能ローンチ:より良い@GoogleColab統合!Google ColabとKaggle間での作業をさらに簡単にします。これで次のことが可能になります: - 最新の更新を同期 - ビューアからColabで編集 - コンペティションへのリンク - 複数のノートブックをインポート

Jun Koda: Geophysical inversion はじめました sample_submission に負けました 🤭 https://t.co/Owd3bnSF6i

T88: 早起きしてたらkaggleやりたくなってきた

MCP/A2A続報: LINEが公式MCPツール公開

  • AIエージェント連携プロトコルMCP/A2Aに関する続報です。
  • LINEが公式のMCPツールを公開し、具体的な実装が進んでいます。
  • 引き続き、両プロトコルの関係性やLangGraph等を用いた実装に関する議論も活発です。
小川雄太郎: Googleが昨週発表した「A2A(Agent2Agent)」は、 ・MCPとどう違うのか ・MCPを補完するのか、置き換えるのか 「A2A」と「MCP」の丁寧な最新解説記事でした 記事タイトル:「MCP vs. A2A: 味方か敵か?」 https://t.co/zGQMHY6nr1

まつにぃ: Lineの公式MCP良いですね。 色々使えそうです。 ・出来ること 1.push_text_message テキストメッセージ送信。 2.push_flex_message 柔軟なレイアウトのFlexメッセージ(バブルまたはカルーセル)を送信。 3.get_profile ユーザープロフィール情報を取得 https://t.co/d9jyn4nD9J

Atai Barkai: (翻訳) 私が知る限り最初の事例です!MCP + マルチエージェントシステム(@LangChainAI LangGraphエージェント)。このパターンには非常に強気です:汎用MCPサーバーが、アプリケーションに組み込まれた特化/垂直化されたエージェントと連携して動作する。

Microsoft、ゼロから学習したBitNet新モデルを公開

  • Microsoftが、1.58ビット量子化技術を用いた新しいBitNetモデル「BitNet-b1.58-2B-4T」をオープンソースで公開した。
  • 従来のBitNetモデルが既存モデルの変換だったのに対し、今回は4兆トークンを用いてゼロから学習されており、性能向上が期待される。
  • ベンチマークスコアでは、Qwen2.5-1.5Bに匹敵する結果が報告されており、低ビット量子化モデルの実用性を示すものとして注目されている。
mizchi: BitNet 生きてたんだ。手元で雑にセットアップしてもそれっぽく数少ないモデルだから、頑張ってほしいが... (引用ツイート: マイクロソフトはBitNetを諦めてなかった!今までみたいに既存モデルをBitNetに変換してお茶を濁したモデルじゃなくて、ゼロから4Tトークンで学習したBitNet-b1.58-2B-4Tをオープンでリリース。ベンチスコアでQwen2.5-1.5Bに匹敵。という...

mizchi: 確かに新モデル出てた https://t.co/K0Q44rPFa5

mizchi: BitNet 確かに動いてるんだけどなんか嘘くさいのはなんなんだろうな。収束が速くて最終的な精度が伸びにくいからだろうか

フリーランス開発者、AI利用料の経費計上が話題に

  • フリーランスのソフトウェア開発者などの間で、ChatGPTや各種AI APIの利用料金を経費として計上することが話題になっている。
  • これまでPC購入費程度しか主な経費がなかった職種において、AI利用料が新たな経費項目として認識されつつある。
  • 月数万円から十数万円程度のAI利用料が発生しているケースもあり、事業に必要なコストとして扱われるようになってきている。
mizchi: 会社のトークンでやってる人は会社の金でモデルぶん回せばいいだけなんだけど、自分はフリーランスなので労働原価にのっててコスパ感にシビアになってる

mizchi: 現時点だと、今はたぶん月5~10万ぐらいAIに使ってんじゃないかな。経費で落とすから多少返ってくるとはいえ

mizchi: まあ、今までフリーランスのプログラマってパソコン購入費ぐらいしかまともに経費精算するのがなかったのが、AIの使用料を経費計上できるので他業種に対して不当に損してるんじゃないか感が少しマシになった

Subscribe to ML_Bear Times

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください