Google Gemini 2.5 Pro コード生成で高評価、AppleとOpenAIの新展開も
(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください
Google Gemini 2.5 Proがコード生成能力でClaude 3.7 Sonnetと互角以上の性能を発揮。AppleはHealthアプリにAIコーチング機能導入を計画中。OpenAIは初の自社データセンター建設を検討し、MetaのLlama新モデルも間もなく登場か。画像生成AIによる文書偽造リスクが高まる中、半導体業界ではTSMCが先端プロセス開発を加速。Alibaba CloudからはQwen2.5-Omniが登場、音声・動画対応のオープンソースモデルとして注目されています。
それでは各トピックの詳細を見ていきましょう。
目次
- Gemini 2.5 Pro、コーディング能力で高評価続く、Claude 3.7 Sonnetとの比較や注意点も
- Apple、HealthアプリにAIコーチ機能導入を計画か
- OpenAI、初の自社データセンター建設検討報道、Deep Researchの能力も話題に
- 画像生成AIによる文書偽造の懸念高まる、対策議論の必要性
- Metaの次期大規模言語モデルか、Llama 4/3.4候補がlm arenaに登場
- TSMC、先端プロセス開発を加速、米国での1.6nm生産計画も
- Qwen2.5-Omni登場、オープンソースの音声・動画対応オムニモーダルモデル
Gemini 2.5 Pro、コーディング能力で高評価続く、Claude 3.7 Sonnetとの比較や注意点も
- 先日のニュースレターでお伝えしたBigQueryクエリ生成能力に続き、Googleの最新LLM「Gemini 2.5 Pro」が、より広範なコード生成能力においても開発者から高い評価を得ています。
- 特に、Anthropicの強力な競合モデルであるClaude 3.7 Sonnetと比較しても遜色ない、あるいは優れているとの声が上がっています。
- 一方で、AIコーディングツール「Cursor」経由で利用する場合、性能が低下する可能性があるという指摘もあり、利用環境によっては注意が必要です。
Google Gemini App: (翻訳) 2.5 Proが実際に使われている素晴らしい例⬇️(引用ツイート: 2.5 Proの幅広い利用法が大好きです。需要に応えるために一生懸命取り組んでいます!いくつか私のお気に入りを紹介します👇)
elvis: (翻訳) Claude 3.7 Sonnetに強力なライバルが登場!Gemini 2.5 Proはコードに関して本当に優れたモデルです。- コード品質が非常に良い- 100万トークンのコンテキスト- ネイティブなマルチモダリティ- 長いコード生成- 大規模なコードベースの理解Windsurfと組み合わせてAI検索エージェントアプリを生成しました: https://t.co/v...
Kai INUI: gemini-2.5、生で使ったときとCursorを経由したときの能力値の差が激しすぎる たぶん、Cursorのプロンプト設計と相性が悪く、最終出力がだいぶナーフされて見える
パウロ: Gemini 2.5Pro 本当に翼を持たせてくれるっ
Apple、HealthアプリにAIコーチ機能導入を計画か
- AppleがHealthアプリを大幅に刷新し、AIを活用したコーチング機能を導入する計画であると報じられています。
- これは、ユーザーの健康データに基づき、パーソナライズされたアドバイスやガイダンスを提供するものと見られます。
- Appleのヘルスケア分野におけるAI活用戦略の具体化として注目されます。
TechCrunch: (翻訳) AppleがHealthアプリを刷新し、AIコーチを追加すると報じられています https://t.co/mpJW7Vxy7k
Tetsuro Miyatake: Appleがヘルスケアアプリを大幅にアップデートしてAI医者サービスみたいなコーチングAIアシスタントを導入する予定。2年前にOff Topicで予想していたAppleのAI x ヘルスケア展開が徐々に実現されようとしている。https://t.co/3PWkGR0uVo https://t.co/7GNcnKUw12
OpenAI、初の自社データセンター建設検討報道、Deep Researchの能力も話題に
- OpenAIが、モデル学習やサービス提供のためのインフラ強化として、初の自社データセンター建設を検討していると報じられています。
- ストレージソフトウェア契約の入札候補にはPure Storage、Vast Data、DDNなどが挙がっています。
- また、同社の「Deep Research」機能が100ページを超える長文レポートを生成したという報告もあり、その能力が注目されています。
The Information: (翻訳) OpenAI、ストレージ用初のデータセンター建設を協議 OpenAIのストレージソフトウェア契約の潜在的な入札者には、Pure Storage、Vast Data、DDN、MinIO、Wekaが含まれます。💼 サーバーハードウェアはDellまたはHPEから提供される可能性があります。 誰が候補になっているかを見る: https://t.co/Xa446d8CEF
Kol Tregaskes: (翻訳) うわー、OpenAIのDeep Researchに109ページのレポートを作成させました! DRから受け取った最も長いレポートは何ページですか?
画像生成AIによる文書偽造の懸念高まる、対策議論の必要性
- 画像生成AIの進化により、領収書などの文書を本物そっくりに生成することが容易になり、悪用リスクへの懸念が高まっています。
- 写真による本人確認や書類提出の信頼性が揺らぐ可能性があり、電子透かしの導入や偽造への厳罰化など、技術的・法的な対策の議論が急務となっています。
- この問題に対し、冷静な合意形成の必要性が指摘されています。
Kenn Ejima: 架空の領収書を作るのが簡単になった、と画像生成AIの危険性に警鐘を鳴らす空気が出てきているので冷静な合意形成の必要性を感じる。せっかく電子文書でOKになってきたのに現物回帰は避けたい。生成画像に「電子透かし」を入れて除去や偽造を厳罰化するという抑止力で十分だろうか?議論が必要。(引用ツイート: Until now, sending photos of documents was consid...
Metaの次期大規模言語モデルか、Llama 4/3.4候補がlm arenaに登場
- 大規模言語モデルの性能評価プラットフォーム「lm arena」に、Metaの次期モデルと思われる匿名のモデルが複数登場しました。
- これらのモデルはJuly 2024までの知識を持つと回答しており、Llama 4またはLlama 3.4ではないかと推測されています。
- 絵文字を多用する特徴から、チャット性能やロールプレイ能力を重視している可能性も指摘されています。
webbigdata: lm arenaにmetaの最新モデルと思われる匿名モデルが3つ公開 英語で同じ質問をした人にはJuly 2024までの知識と回答しているので幻覚の可能性もあります Llama 4なのかLlama 3.4なのかわかりませんが、絵文字を多用するところは共通しているのでチャットもしくはロールプレイを重視しているようです https://t.co/xTvNtBBTQ3
TSMC、先端プロセス開発を加速、米国での1.6nm生産計画も
- 半導体受託製造最大手のTSMCが、先端プロセスの開発と生産能力拡大を加速しています。
- 高雄工場ではN2プロセスの高い需要に対応するための拡張式典が行われました。
- さらに、2030年までに米国アリゾナ州で1.6nmプロセスによる生産を開始する計画も報じられており、AppleやNvidiaといった主要顧客への供給体制強化が図られています。
パウロ: TSMC 高雄工場拡張式典、本日実施へ N2の高い需要、N3以上 https://t.co/UUfF4Wp5oF
パウロ: TSMC 2030年までに1.6nmプロセスを米国で生産へ AppleとNvidiaがいるのは強いですね https://t.co/JaOrEqG1iM
Qwen2.5-Omni登場、オープンソースの音声・動画対応オムニモーダルモデル
- Alibaba Cloudから、新たなオープンソースのオムニモーダルモデル「Qwen2.5-Omni」がリリースされました。
- このモデルはテキスト、画像、音声、動画を入力とし、テキスト、音声、動画を出力できます。
- リアルタイム処理を意識したストリーミングファースト設計で、考えながら話すといったインタラクティブな応用が期待されます。
Kenn Ejima: Qwen2.5-Omni は voice + video のオムニモーダルなモデル。テキスト・画像・音声・動画を入力とし、テキスト・音声・動画を出力できる。ストリーミングファーストの設計でリアルタイムエンコーディングしつつThinker-Talker分担によって考えながら話すことが可能に。そしてオープンソース。(引用ツイート: Voice Chat + Video Chat! Just ...