2025年04月14日 夜のAIニュースまとめ
(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください
OpenAI新モデルの噂と医療AIの進展
OpenAIの新モデル「o3」「o4-mini」などのアートワークが発見され、リリースへの期待が高まっています。
一方、Google DeepMindは医療・健康分野向けのAIモデル「TxGemma」を発表。既存のGemmaとGeminiを基盤とした医療現場での活用が期待されます。
主要LLMの比較では、Claudeの局所的注意力、GPTの論理性、Gemini 2.5 Proの全体把握能力といった各モデルの特性が明らかになってきました。
それでは各トピックの詳細に目を向けていきましょう。
目次
- OpenAI、新モデル(o3, o4-mini等)のアートワーク発見か
- Google、医療向けAIモデル「TxGemma」発表
- Llama 4続報: Chatbot Arenaスコア大幅低下、性能調整か
- 開発者視点: Claude/GPT/Gemini 2.5 Proの特性比較
- TSMC工場計画:アリゾナ加速、熊本は延期か
- AdobeがAIエージェント導入計画、イベント駆動型も注目
- AI活用: 10Xタグ生成、企業戦略、未来予測
- AI開発: 構造化出力の最適化、mizchi氏ツール評価、MCPサーバ構築
- Kaggle動向: 新コンペ(サッカー)、湘南会資料、atmaCup知見
- OpenAI API認証必須化報道、AI資金調達活況続く
OpenAI、新モデル(o3, o4-mini等)のアートワーク発見か
- OpenAIが開発中と噂される新モデル群のアートワークとされる画像が発見されました。これは以前報じられたWebアプリ内でのモデル名の痕跡発見に続く動きです。
- 発見されたのは「o3」「o4-mini」「GPT-4.1」「GPT-4.1-mini」のアイコンで、これらが近々リリースされるモデルラインナップではないかと推測されています。
- これらのモデル名は、以前からリーク情報などで言及されており、発表への期待が高まっています。
Tibor Blaho: (翻訳) モデルページ用のモデルアートとアイコンが、ローンチに先駆けて過去数時間でo3、o4-mini、GPT-4.1モデル用に更新されました(以前は既存モデルに基づくプレースホルダー/コピー画像のみでした)
Kol Tregaskes: (翻訳) o4-mini、o3、4.1-nanoのアートワークが見つかりました。また、TiborはGPT-4.1と4.1-miniのアートワークも見つけました:https://t.co/rG47RwJENv これでOpenAIからの新しいChatGPTモデルリストが揃いましたね。👍
Google、医療向けAIモデル「TxGemma」発表
- Google DeepMindのJeff Dean氏が、医療・健康分野に特化したオープンモデルファミリー「TxGemma」を発表しました。
- TxGemmaは、既存のGemmaおよびGeminiモデルを基盤として構築されており、医療現場での活用が期待されます。
Jeff Dean: (翻訳) GemmaとGeminiを基盤に構築された、健康分野に特化したオープンモデルファミリー「TxGemma」を紹介します。
Google Cloud: (翻訳) #GoogleCloudNext ニュース:Vertex AIのメディア生成AIモデルのアップデートを発表し、テキストから音楽を生成するモデルLyriaを導入しました!このモデルを使用すると、顧客はジャジーなピアノソロからローファイなトラックまで、さまざまなスタイルやジャンルの曲を作成できます ↓
Llama 4続報: Chatbot Arenaスコア大幅低下、性能調整か
- LLM性能評価で注目されるChatbot Arenaで、MetaのLlama 4のELOスコアが大幅に低下したことが報告されました。
- 以前は1400ポイント超でしたが、現在は1270ポイント程度となり、DeepSeek v2.5と同水準です。
- この変動は、以前指摘された評価方法への過剰適合(ズル)疑惑を受け、Metaがモデルを調整した結果ではないかとの憶測を呼んでいます。
ML_Bear: Chatbot Arenaでズルをしていたと指摘されたのを受けてか、Llama 4がサイレントでモデルを差し替えた模様👀 150ポイント近くスコア下がったらしいけど、150ポイントも操作できてたってこと…?!
ML_Bear: (翻訳) Llama 4は静かにELOが1417から1273に低下し、DeepSeek v2.5と同等になりました
開発者視点: Claude/GPT/Gemini 2.5 Proの特性比較
- 開発者の間で、主要な大規模言語モデル(LLM)であるClaude、GPT、Gemini 2.5 Proの特性や性能に関する比較・評価が活発に行われています。
- Claudeは局所的な注意力、GPTは局所的な論理性、Gemini 2.5 Proは全体の把握能力にそれぞれ強みがあるといった分析が見られます。
- 一方で、Gemini 2.5 Proは指示に従わない頑固さを見せることや、AnthropicのSonnetはウェブ開発において課題があるといった指摘も挙がっています。
SHINJI KIMURA: Claudeは局所的な注意力は強いけど、全体性の把握と全体からの論理性が弱い。 Gptは、局所的論理性は強いが、全体の把握も、全体の論理性も弱い。 gemini2.5 proは、全体の把握能力はあるが、局所の注意力もそこそこあって、局所の論理性もまぁまぁ強いけど。Claudeよりそれは弱い。
asap: gemini-2.5-pro、普段使いしてるAIの中では一番性能いいから使い込んでるけど、たまに強情な時あるんよね 一度geminiくんの固定概念にハマると、どう指示しても修正してくれない。自分の解釈に自信持ちすぎてて指示を聞かない。 そうなったら、もうその子は破棄して新しい子にするしかなくなる・・・
erukiti: しかし、ウェブ開発でSonnetが著しくアレ(穏当な表現)問題、そろそろ真面目に考えないといけないな???
TSMC工場計画:アリゾナ加速、熊本は延期か
- 半導体受託製造最大手TSMCが、米国アリゾナ州での第3工場建設を加速する計画です。
- 一方、熊本での第2工場(JASM)建設計画は再度延期される見込みと報じられています。
- 背景には米国の政策や顧客の動向があり、AI向け先端半導体の供給体制への影響も懸念されます。
パウロ: TSMC アリゾナ第三工場建設を加速 動いていますね https://t.co/jEsb6uyK3h
パウロ: TSMC 熊本第二工場、再度延期 自動車メーカーが米国での生産を検討し始めたか https://t.co/1tVbXVplqR
パウロ: 熊本第二工場は立ち消えになるんじゃないかな 月産2.5万枚を埋める製品がない しかもN7~N16はTSMCでも余ってるし
AdobeがAIエージェント導入計画、イベント駆動型も注目
- AdobeがPhotoshopとPremiere Proにチャット形式で操作できるAIエージェントを導入する計画を発表しました。
- また、従来のチャット駆動型とは異なる、特定のイベント発生時に自律的に動作する「イベント駆動型AIエージェント」の有用性に関する考察も注目されています。
- エージェントの推論モデルの重要性も指摘されています。
Tibor Blaho: (翻訳) AIエージェントがPhotoshopとPremiere Proに登場
Algomatic池田|営業AIエージェント開発: イベント駆動型AIエージェント - AIエージェントのトリガー方法を分類・考察したらイベント駆動型にも目を向ける必要があると気付いた話|gura105 @gura105 #note
erukiti: これめっちゃ面白くて、MCPはプッシュ通知めいたことが可能なので、それを前提にイベント駆動型AIエージェントとして作ると、既存のやり方とは全く違う本当のAIエージェントを作れるんですよね!! 全然思いつかなかったけど、このやり方マジでいいんで、僕も真似したい!!!
AI活用: 10Xタグ生成、企業戦略、未来予測
- 様々な分野でAI活用が進んでいます。10Xは商品検索タグの自動生成とRecall改善にBigQueryとGeminiを活用した取り組みを紹介しています。
- エンタープライズ領域では、単なるツール提供ではなく、企業のタレント不足を補うAIエージェント構築の重要性が指摘されています。
- また、5年後の未来として、パーソナルAIによる会議・交渉代行や、インターネットの人間用/AI用への分裂可能性などが予想されています。
野川の側: メモ LLMを活用した商品検索タグ自動生成とRecall改善の取り組み(BigQuery × Gemini) - 10X Product Blog https://t.co/5kL5OtUzmU
Taro Fukuyama: 「エンタープライズ向けAI:ツールではなく、エージェントを作れ」 過去2週間で、複数のAIエージェント開発系スタートアップと話しました。
久保田 雅也@Coalis: 面白い。5年後の世界予想 - パーソナル AI が代わりに会議に出席する - インターネットは 人間用とAI エージェント用の二つに分裂する - AIエージェントのエラー回復(ロールバックや保険など)の市場が生まれる - AI によって「十分に良い」コンテンツが無料に。差別化は配信、スピード、独創性に
AI開発: 構造化出力の最適化、mizchi氏ツール評価、MCPサーバ構築
- 生成AIの構造化出力において、JSON等のフィールド順序や命名規則が精度に影響する可能性を検証した記事が注目されています。
- 開発者のmizchi氏がClaude、Gemini、Clineなど主要AIコーディング支援ツールの現時点での評価をまとめた記事も話題です。
- MCPサーバの構築ガイド記事も複数公開されており、開発コミュニティでの関心の高さがうかがえます。
Masa Kazama: 生成AIの構造化出力(Structured Output)において、フィールドの順番や命名が重要という記事を書きました。 https://t.co/DK8nxdMsQt
mizchi: 現時点での Claude とか Gemini とか Cline とかの各種ツールの評価を書いた https://t.co/p6wVEvbRDy
からあげ: メモ > 【初心者向け】2年目エンジニアが実践したMCPサーバー構築ガイド2025 - 電通総研 テックブログ https://t.co/ideJbFQXVV #MCP #AI #Agent
Kaggle動向: 新コンペ(サッカー)、湘南会資料、atmaCup知見
- 新たなKaggleコンペティション(サッカーのトラッキングデータ)が開催、参加者募集中
- 先日開催された第2回湘南Kaggler会で発表されたプロンプトエンジニアリング等の資料が公開
- atmaCup振り返り配信から特徴量エンジニアリングの知見を得たとの報告も
ころんびあ: NFLコンペ(サッカー)始まった👀️
Kimihiko Kitase ♨️ 北瀬 公彦: あとで読む✍️
rt4kaido: 今更atmaの振り返り配信アーカイブを見た 一位の方の特徴量の作り方めちゃめちゃ参考になりました
OpenAI API認証必須化報道、AI資金調達活況続く
- OpenAIが将来のAPIアクセスに組織向けのID認証を必須化する可能性が報じられました。
- AI企業の資金調達は活発で、$100M以上のラウンド調達社数は高水準を維持していますが、プロダクト前の企業への巨額投資にはバブルを懸念する声も上がっています。
- 法人カードRampの調査によると、SaaS市場ではOpenAIが新規顧客獲得数でトップとなっています。
TechCrunch: (翻訳) OpenAIのAPIにおける将来のAIモデルへのアクセスには、認証済みIDが必要になる可能性があります
Publickey: Google Cloud、AIによるアプリの自動生成ツール「Firebase Studio」公開。プロンプトで作りたいアプリを説明するだけ、無料で利用可能 https://t.co/cawv89INpG
久保田 雅也@Coalis: プロダクト前のAI企業の巨大調達ラウンドで巨額のセカンダリーが売りに出てるとか。バブルがコントロール不能になってて危険