2025年04月17日 夜のAIニュースまとめ
(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください
OpenAI新モデルの評価と最新AI開発動向
OpenAIの新モデル「o3」と「o4-mini」への評価が注目を集めています。o3は高度な推論能力とツール連携で「実践的なAgent」として評価され、o4-miniはコストパフォーマンスとコーディング能力が高く評価されています。
TSMCはAI半導体需要に牽引され過去最高の決算を発表。GoogleのApps Builder、xAIのGrok Memoryなど各社の新機能も続々と登場しています。
それでは各トピックの詳細をご覧いただきましょう。
目次
- OpenAI新モデルo3/o4-miniに称賛と懸念の声【続報】
- o3: 高度な推論・ツール連携で「実践的Agent」評価
- o4-mini、コーディング能力に高評価 Codex CLIにも採用【続報】
- OpenAIのCodex CLI、対話型開発などで活用進む【続報】
- TSMC決算絶好調、AI半導体需要が牽引し過去最高更新
- AI Agent開発動向: LangGraph強化やSDK他モデル対応等【続報】
- Google AI Studio、IDE「Apps Builder」統合で開発強化
- Grok、会話履歴を記憶する「Memory」機能を追加
- その他: MS Xbox Copilot、Nvidia Nemotron、ABEJAモデル、ChatGPT新機能
OpenAI新モデルo3/o4-miniに称賛と懸念の声【続報】
- 先日発表されたOpenAIの新推論モデル「o3」と「o4-mini」に対し、開発者コミュニティから称賛と同時に課題を指摘する声が上がっています。【続報】
- 特にo3の高度な推論能力やツール連携、o4-miniのコストパフォーマンスとコーディング能力が注目されています。
- 一方で、プロンプト追従性、出力の癖、ハルシネーション、日本語能力などが課題として挙げられています。
- また、旧モデルであるo1とo3-miniがAPIから削除されたことも話題になっています。
まつにぃ: o3を検証しています。 ・WEB検索やPython、画像拡大などtoolsを多段推論で自動的に挟み相当広範囲を任せられるので普段使いはこれでいい気が。 ・ただo1の時と結構運用変わりそうなのでプロンプト見直し必要そう ・o4-miniよりもo3の方がweb検索使いやすい 少し癖ありな気がしますが性能は強いです。
Chubby♨️: (翻訳) 私もo3を試してみましたが、本当に別格です。素晴らしく、ツールの使い方も注目に値します。o3がDeepResearch lightのように感じられるという意見に同意します。DRの品質の約80%で、大幅に高速です。
Torishima / INTP: o3 と o4-mini が出たことで o1 / o3-mini がパージされとる件について… レガシーモデル扱いですらないのか https://t.co/xVqWbQpnqF
o3: 高度な推論・ツール連携で「実践的Agent」評価
- 新モデル「o3」は、特にその高度な推論能力とツール連携能力が高く評価されています。
- Web検索、Pythonコード実行、画像分析・生成などを自律的に組み合わせてタスクを実行できることから、「実践的なAgent」「DeepResearch light」「AGIに片足を踏み入れている」といった声が上がっています。
- 複雑なタスクに対して長時間の思考や複数ツールの連続使用が可能である点も注目されています。
まつにぃ: o3自体がもう実質単体でミニDeepResearchしてるようなものなのでo3-Proえげつないことになりそうですね。 なんかもうタスク実行力と言うよりは答えのない問題とか未知の問題とか、そっち方向の能力がガンガン上がってる気がします。 やっぱりそういう意味でのGPT4.1だった気かしますね。
まつにぃ: o3の感想を一言で言うなら、実践Agent。 o1やo1-Proはやはり受動的で、賢いけど机上の空論感がありました。 o3からは実践で本当に使えるAgentの第1歩という感じがひしひし伝わってきます。 賢さだけでは無い感じですね。
石川陽太 Yota Ishikawa: 改めてo3/o4-miniの発表みたらGregがとんでもないこと言ってるなこれ笑 『o3は複雑なタスクを解決するために、”600回連続”でツールを使った』 『私よりもOpenAIのコードベースを変更するのが上手い』 『一流の科学者たちが、本当に優れた役に立つ新しいアイデアを生み出すと認めた』 https://t.co/RWmLc985VG
o4-mini、コーディング能力に高評価 Codex CLIにも採用【続報】
- OpenAIの新モデル「o4-mini」について続報です。
- o3-miniと同等の価格帯ながら、特にコーディングタスクで高い性能を発揮すると評価されています。
- 画像入力にも対応しており、安価で高速なコーディング支援モデルとしての活用が期待されます。
- OpenAIが公開したCodex CLIのデフォルトモデルにも採用されました。
jian: (翻訳) Pointerでのo4-mini初期バイブテスト。自分自身のランディングページを作成するように依頼しました... gpt-4.1よりもはるかにエージェント的で、高速で安価なコーディングモデルの代替となる可能性があります。
ぬこぬこ: Codex CLI で遊んでいるけど、デフォルトモデルが o4-mini なの、コーディングには GPT-4.1 ではなく o4-mini を使えってことなんじゃ...安いし... とりあえず完璧に動作するテトリスは Vibe Coding でできました https://t.co/k9oAZe7hB5
Torishima / INTP: o4-mini は画像使えるのは嬉しいな
OpenAIのCodex CLI、対話型開発などで活用進む【続報】
- OpenAIが公開したOSSローカルコーディングエージェント「Codex CLI」の活用事例が報告されている【続報】。
- CLIから自然言語で指示し、o4-miniやo3を用いてコード生成・修正を行う。
- 対話的に開発を進める「Vibe Coding」スタイルでの利用や、マイグレーション作業の大幅短縮といった効果が報告されている。
- 効果的なプロンプトの共有やシステムプロンプトの解析も進んでいる。
- GitHub Copilot Agentでもo4-miniが利用可能になったとの報告もある。
Kazuhiro Sera (瀬良): 💻 オープンソースのローカルコーディングエージェント Codex CLI をリリースしました! CLI の対話環境で自然言語の指示をするだけで、o3 / o4-mini モデルの能力をフルに活用した開発作業を行うすることができます。 あと、このタイミングでこの CLI だけでなく OpenAI FM も OSS になっています😉
石川陽太 Yota Ishikawa: 早速OpenAIのCodexやってみた!npm i -g @openai/codex
で入る。試しにやったのはCloudflare PagesからWorkersへのマイグレーション作業。結構時間かかるかなと思ってたらCodex + o4-miniの助けで往復5回のチャットで1時間もかからずに完了できちゃった!今のところCodex + o4-miniかなり良さげ https://t.co/V6...
ぬこぬこ: GitHub Copilot Agent でも o4-mini が使えるようになっていた! https://t.co/dFvfcNd4Pm https://t.co/STLUdA0YSN
TSMC決算絶好調、AI半導体需要が牽引し過去最高更新
- TSMCが2025年第1四半期決算を発表し、売上高・利益ともに市場予想を上回り、過去最高を更新しました。
- AIサーバー向けなどの高性能コンピューティング(HPC)需要が引き続き旺盛で、特に5nmプロセス(Nvidia GPUなど)の売上が大きく貢献しています。
- 第2四半期の売上高ガイダンスも市場予想を大幅に上回る強い見通しを示しており、AI半導体市場の力強さを裏付ける結果となりました。中国向けH20チップの輸出規制の影響は織り込み済みと見られています。
unusual_whales: (翻訳) TSMC決算: - EPS:2.14ドル(予想:2.07ドル) - 売上高:257.7億ドル(予想:257.2億ドル)
パウロ: TSMC 2025Q1決算 季節性考えると絶好調 N5のNvidia GPUが大量に出荷されている N3のiPhoneチップは季節性で減少 https://t.co/iZ9PF9ByIN
パウロ: TSMC Q2ガイダンス強すぎだろ なんやこれ 史上最高を余裕でぶち抜くじゃん
AI Agent開発動向: LangGraph強化やSDK他モデル対応等【続報】
- LangGraphのSlack連携強化やOpenAI Agents SDKの他モデル対応など、開発ツールが進化しています。
- AWS SummitでのAI AgentハッカソンやCursor Agentに関する勉強会も開催予定です。
- Algomatic社はAI EXPOに出展し、業界特化エージェントの導入事例を紹介しました。
- AI面接官とAI面接者のイタチごっこへの懸念なども議論されています。
Kazunori Sato: 人間が普段得ているコンテキストが格段に多いですよね。過去に読んだ本、Xで見た議論、ライブラリや開発ツールのクセや不具合、チーム内の空気、等々。。エージェントにも適切なコンテキストを与えるとうまく動くこともあるけど、プロンプトやユーザーとのやり取りがどうしても長くなってしまう。
Harrison Chase: (翻訳) LangGraphを使ってSlackでコミュニケーションできるエージェントをより簡単に構築する方法!
piqcy: AWS Summit で AI Agent のハッカソンをやります!一風変わったテーマなので、その背景について書きました。参加お待ちしております! https://t.co/RbaNnK8L8F
Google AI Studio、IDE「Apps Builder」統合で開発強化
- Googleは、AI Studio内で直接アプリケーションを構築・公開できる新機能「Apps Builder」を発表しました。
- これはAI Studio内に統合されたIDE(統合開発環境)であり、開発者はGemini APIを無料で利用して、JavaScript/HTMLアプレットやReactアプリケーションなどを開発できます。
- 10種類以上のスターターアプリも提供され、リミックスして独自のアプリを作成したり、共有したりすることが可能です。
TestingCatalog News 🗞: (翻訳) AI StudioはApps Builderをローンチしました。これはAI Studio内のIDEで、コードをビルドしてローンチできます。そこでは、Gemini APIを使ってアプリをビルドしたり、いくつかの既製のオプションで遊んだりできます。
Philipp Schmid: (翻訳) これはAI Studioのビルダーと開発者にとって最大のアップデートです! AI Studioで直接独自のアプリをビルド、保存、共有できるようになりました! アカウントに直接接続して、Javascript&HTMLアプレットまたは完全なReactアプリケーションをビルドできます。🤯 > 10以上のスターターアプリがあります。
TestingCatalog News 🗞: AI StudioにIDE「Apps Builder」登場、Gemini API活用。
Grok、会話履歴を記憶する「Memory」機能を追加
- xAIのAIモデル「Grok」に、過去の会話履歴を記憶する「Memory」機能が追加されました。
- これにより、ユーザーが以前にGrokと交わした会話の内容を踏まえた、よりパーソナライズされた応答が可能になります。
- ChatGPTやGeminiなども同様の記憶機能を提供しており、主要なAIチャットボットにおける標準機能となりつつあります。
Tech Dev Notes: (翻訳) Grok Memory リリース:
Kol Tregaskes: (翻訳) Grokがあなたのチャットを記憶できるようになりました。😀
Chubby♨️: (翻訳) Grokにメモリが搭載されました。すべてのモデルが新機能をいかに早く採用するか驚きです。
その他: MS Xbox Copilot、Nvidia Nemotron、ABEJAモデル、ChatGPT新機能
- MicrosoftがXbox向けAIアシスタント「Copilot」を従業員向けにテスト中と報じられています。
- Nvidiaが400万トークンコンテキスト長のLlama 3.1ベースモデル「Nemotron」を発表したとの情報が出ています。
- ABEJAが日本語Reasoningモデル「ABEJA-QwQ32b-Reasoning-Japanese-v1.0」を公開しました。
- OpenAIがChatGPT内にSNS風フィード「Yeet」を開発中との噂や、ChatGPTの画像生成ライブラリ機能が全ユーザーに展開されたことも話題です。
Tetsuro Miyatake: MicrosoftがXbox用のAIアシスタント「Copilot」を検証し始めている。 まだ従業員だけが使えるらしいが、ゲームのオススメやゲーム中に質問することなども出来るとのこと。 https://t.co/fp0GFFLHC2 https://t.co/cTgTzbXtFB
Vaibhav (VB) Srivastav: (翻訳) 待って、Nvidiaが400万コンテキスト長のLlama 3.1 Nemotronをリリースした🤯 文字通りコードベース全体を投入できる!
pao: Reasoningができる新しいモデルを作って公開しました!!32Bでかなり実用的なReasoningモデルかと思います!! 使ってみてください!