2026年05月27日 夜のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

GPT-5.5のコーディング評価と台湾でのAIチップ密輸摘発

新ベンチマーク「DeepSWE」でGPT-5.5がClaude Sonnetを上回る高評価を獲得しました。一方で、最近の挙動から性能低下を懸念する声も上がっています。

また、台湾ではNVIDIA製AIチップを日本経由で中国へ密輸した疑いで初の摘発が行われました。TSMCの3nmプロセス値上げの動きも注目されます。

それでは、本日の主要なトピックを順番にご紹介します。

目次

  1. 新ベンチマークDeepSWEでGPT-5.5が高評価【続報】
  2. 台湾、NVIDIA製AIチップの日本経由密輸を摘発【続報】
  3. TSMC、3nmプロセスを今年下半期に15%値上げへ【続報】
  4. インド政府がAnthropicのMythosをテスト【続報】
  5. Gemini 3.5 FlashがVision評価で1位獲得【続報】
  6. Claude Code v2.1.152公開、自動修正や新プラグイン追加【続報】
  7. Qwen3.7-MaxがCode Arenaで4位に【続報】
  8. MediaTekがxAIのデータセンターASICを受注か【続報】
  9. Mac向け超軽量文字起こしアプリKanaryが話題
  10. LLM-jpコーパスの日本語PDF生データ5000万件公開
  11. GPT-5.5の性能低下を懸念する声【続報】

新ベンチマークDeepSWEでGPT-5.5が高評価【続報】

  • GPT-5.5のコーディング能力に関する続報です。
  • エージェントコーディングの現実的な評価を目的とした新ベンチマークDeepSWEがリリースされました。
  • DeepSWEではGPT-5.5が70%のスコアを記録し、Claude Sonnetを上回りました。
  • 多くの開発者が日常的に感じていた「GPT-5.5の方がコーディングに優れている」という体感と一致する結果として注目を集めています。
Chubby♨️: (翻訳) Codexに対する一般的な感情がどれほど好意的に変化したかを見るのは本当に驚くべきことです。GPT-5.5を搭載したCodexが現在非常に優れており、Claude Codeよりも定期的に好まれているという投稿をたくさん読んでいます。(私自身もCodexの大ファンになりました)。同時に、新しいDeepSWE...

まつにぃ: 過去1番しっくりくるSWEベンチの結果。 Gemini3.5 Flash 頑張ってる。

Kol Tregaskes: (翻訳) 多くの開発者は数ヶ月前から、コーディングにおいてGPT-5.5がClaude Sonnetを上回っていると疑っていました。しかしSWE-Benchはほぼ同等と報告し、人々は実際の経験を疑うようになりました。DeepSWEはその日常的な経験により密接に一致しています:GPT-5.5は70%のスコアを記録しました。

台湾、NVIDIA製AIチップの日本経由密輸を摘発【続報】

  • NVIDIA製AIチップの中国への密輸問題に関する続報です。
  • 台湾の検察当局が、禁止されているNVIDIAのAIチップを日本経由で中国に密輸した疑いで3名を摘発しました。
  • 高度な技術の密輸に対する台湾初の公的な取り締まりとなります。
  • 米国の輸出規制を回避するための迂回ルートとして日本が利用された可能性があり、波紋を呼んでいます。
Bloomberg: (翻訳) 台湾の検察当局は、3人の個人が禁止されているNvidiaのAIチップの少なくとも1回の出荷を、日本経由で中国に密輸することに成功したと疑っています。

Bloomberg: (翻訳) 独占:台湾は、高度技術に対する同島初の公的な取り締まりにおいて、NvidiaのAIチップが日本経由で中国に密輸されたと疑っています。

TSMC、3nmプロセスを今年下半期に15%値上げへ【続報】

  • 以前から報じられているTSMCの先端プロセス値上げに関する続報です。
  • 3nmプロセスの価格を今年下半期に15%、来年にはさらに10%引き上げる見込みであることが報じられました。
  • AIチップ需要による生産ラインの逼迫が背景にあるとみられています。
  • この値上げにより、Appleの2nmプロセスと同等の価格帯になる可能性が指摘されています。
Jukan: (翻訳) 独占:TSMCの3nmプロセスの価格が下半期に15%上昇すると言われています。来年にはさらに10%の引き上げの可能性があります。C.C. Weiは株主総会で「物事を明確にする」と予想されています。

パウロ: N3 15%値上げ さらに 10%値上げ AppleのN2と同じぐらいの価格か TSMC儲かりますなぁ

インド政府がAnthropicのMythosをテスト【続報】

  • Anthropicの未公開モデル「Mythos」に関する続報です。
  • インド政府が、同モデルの脆弱性を理解するためのテストを実施していると報じられました。
  • 機密性の高い公共向けの金融および政府アプリケーションのソフトウェアが対象となっています。
  • 未公開の強力なモデルに対する国家レベルでのセキュリティ評価として関心を集めています。
Bloomberg: (翻訳) 情報筋によると、インドはAnthropicの次世代AIモデル「Mythos」に対する脆弱性をよりよく理解するため、最も機密性の高い公共向けの金融および政府アプリケーションソフトウェアの一部のテストを実施しています。

Bloomberg: (翻訳) 独占:情報筋によると、インドはAnthropicの次世代AIモデル「Mythos」に対する脆弱性をよりよく理解するため、最も機密性の高い公共向けの金融および政府アプリケーションソフトウェアの一部のテストを実施しています。

Gemini 3.5 FlashがVision評価で1位獲得【続報】

  • Gemini 3.5 Flashに関する続報です。
  • CAIS Text Capabilitiesで4位、Visionで1位を獲得したことが報告されました。
  • 開発者からは、指示追従やチャット能力においてOpenAIやAnthropicのモデルよりも優れているとの声が上がっています。
  • 多くのチャットリクエストを同モデルに移行し、非常に良好に動作しているとの実体験も共有されています。
Lisan al Gaib: (翻訳) Gemini 3.5 FlashがCAIS Text Capabilitiesで4位、Visionで1位にランクインしました。また、DeepSeek-V4-ProはTextでKimi-K2.6をわずかに上回っています。

Bindu Reddy: (翻訳) Gemini Flashは、OpenAIやAnthropicのどのモデルよりも指示追従とチャットにおいてはるかに優れています。多くのチャットリクエストをFlash 3.5に移行しましたが、非常にうまく機能しています❤️🚀

Claude Code v2.1.152公開、自動修正や新プラグイン追加【続報】

  • AnthropicのAIコーディング支援ツール「Claude Code」に関する続報です。
  • バージョン2.1.152がリリースされ、コードレビュー後の自動修正適用などの機能が追加されました。
  • また、コード記述中の脆弱性を特定し修正する「security-guidance」プラグインも公開されました。
  • 組織独自のルールを設定することも可能で、セキュアなコーディングを強力にサポートします。
Oikon: Claude Code 向けにsecurity-guidanceプラグインをリリース。 コードを書いている際の脆弱性を特定し、修正する。リポジトリ内のclaude-security-guidance/.mdで組織独自のルールも設定可能。 https://t.co/FiJuKABvp9

Claude Code Changelog: (翻訳) Claude Code 2.1.152がまもなくリリースされます #cccnext

Oikon: Claude Code 2.1.152 (抜粋) - /code-review --fix がレビュー後にワーキングツリーへ修正を適用するように(再利用・簡素化・効率化の提案を含む)。/simplify/code-review --fix を呼び出すよう変更 - スキルとスラッシュコマンドのフロントマターに disallowed-tools https://t.co/dp...

Qwen3.7-MaxがCode Arenaで4位に【続報】

  • 以前お伝えしたAlibabaのQwen3.7-Maxに関する続報です。
  • Code Arenaのフロントエンド部門で4位にデビューし、中国のラボとしてトップランクを獲得しました。
  • エージェント型Web開発タスクにおいて、Claude Opus 4.6と同等の性能を示しています。
  • オープンモデルの進化が続いており、今後のさらなるリリースにも期待が寄せられています。
Qwen: (翻訳) 🚀🚀 Qwen3.7-MaxがCode Arenaで4位にランクインし、Claude Opus 4.6と同等になりました。ボード上でトップランクの中国のラボです!@arena さらにリリース予定です。ご期待ください。🕶️

MediaTekがxAIのデータセンターASICを受注か【続報】

  • xAIのデータセンター向けASIC開発に関する続報です。
  • MediaTekが新たなASICの設計サービスプロバイダーになる可能性が報じられました。
  • 製造にはIntel 14AプロセスとEMIB技術が採用される見込みです。
  • 以前はBroadcom設計やSamsung製造の噂がありましたが、新たなパートナー候補が浮上した形となります。
Jukan: (翻訳) 「新しいデータセンターASICはSpaceXが獲得する可能性が高い。MTK(MediaTek)がIntel 14A + EMIB-Tに基づくxAIのデータセンターASICの設計サービスプロバイダーになると予想している。」興味深いですね....

パウロ: Mediatek イーロンマスクのSpaceXのASIC 受注へ しかもIntel EMIBか 勢いがすごいね

Mac向け超軽量文字起こしアプリKanaryが話題

  • わずか10MBで動作するMac向けのローカル文字起こし+LLM要約アプリKanaryがリリースされ話題になっています。
  • Apple Siliconに最適化されており、オフライン環境でも高精度かつ高速な処理が可能です。
  • エコーキャンセル機能などを備えつつ、バッテリーやストレージ消費を最小限に抑える工夫が凝らされています。
Kenn Ejima: ようやくOS付属ローカルAIモデルでも満足のいく 文字起こし品質が得られる時代になりました しかもAppleのチップに最適化されていて爆速です 言語の予測判定など色々トリッキーなところも 摩擦のないUXのため徹底して頑張ってます とくにマイクがスピーカーの音を拾う場面の

Kenn Ejima: 今日の会議ではKanaryで録音・文字起こし・要約を試してみて! 相手の許可もいらないし、どこにもデータを送らないローカル完結なので安心・安全です!

Kenn Ejima: 10MBで動作するローカル文字起こし+LLM要約アプリは地球上で唯一のはずです! (ちなみにエコーキャンセル機能だけでその半分近くを占めてます…笑) 精度を落とさずバッテリー消費とストレージ消費も最小に抑えるため、一切の無駄を許さず 録音→波形生成→ALAC変換→ASR投機実行→確定

LLM-jpコーパスの日本語PDF生データ5000万件公開

  • LLM-jpコーパスの日本語データソースの一つであるPDF資料の生データが公開されました。
  • 約5000万件に及ぶ膨大なデータセットであり、日本語関係のPDFコレクションとして非常に巨大です。
  • 日本語LLMの開発や研究において、貴重なリソースとなることが期待されています。
Odashi: LLM-jpコーパスの日本語データのソースの一つであるPDF資料の生データを公開しました。5000万件あり、日本語関係のPDFのコレクションとしては巨大だと思います。 https://t.co/2pKqOLq7hn

GPT-5.5の性能低下を懸念する声【続報】

  • GPT-5.5の性能評価に関する続報です。
  • 絶賛の声が上がる一方で、最近になってミニモデルに置き換わったような挙動を示していると一部の開発者から指摘されています。
  • 一時的な技術的低下の可能性もありますが、過去にも同様の事象があったため懸念が広がっています。
  • OpenAIの対応の遅れを危惧する声も上がっています。
Haider.: (翻訳) 他の人が気づいているかはわかりませんが、最近gpt-5.5がミニモデルに置き換えられたかのように振る舞っています。一時的な技術的な低下であることを願っていますが、そうでない場合、openaiは火遊びをしています。彼らは以前にも同じ状況にあり、前回は修正に時間がかかりすぎました。

Haider.: (翻訳) 他の人が気づいているかはわかりませんが、最近gpt-5.5がミニモデルに置き換えられたかのように振る舞っています。一時的な技術的な低下であることを願っていますが、そうでない場合、openaiは火遊びをしています。彼らは以前にも同じ状況にあり、前回は修正に時間がかかりすぎました。

Subscribe to ML_Bear Times

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください