今週、多様なAIの進化と新しい技術が私たちの世界を変えようとしています。OpenAIの新モデル「GPT-4.1」は、従来の限界を超えた性能を持ち、法務や金融での応用が期待されています。一方、GoogleはAIエージェントの相互運用を強化する新プロトコルA2Aを発表し、業務効率を劇的に向上させる可能性を秘めています。さらに、ChatGPTのメモリ機能の強化や、動画生成AI「Veo 2」の登場により、個人の創造力が新たな次元に引き上げられようとしています。技術の進化が私たちの生活をどのように変えるのか、注目です。
OpenAIの新モデル「GPT-4.1」シリーズ
OpenAIが発表した新しいAIモデル「GPT-4.1」は、大幅な性能向上を遂げています。このモデルには「GPT-4.1」、「GPT-4.1 mini」、「GPT-4.1 nano」の3種類があり、それぞれコーディング能力や指示の従順性に優れています。特に最大100万トークンのコンテキストウィンドウを持つことで、長文理解力が大幅に強化されています。価格も改善され、従来のモデルよりコストパフォーマンスが高く、法務や金融などの分野での実用性が期待されています[1,2,3,4,5]。
また、これらのモデルはGitHub CopilotやGitHub Modelsで利用可能となり、指示遵守や長文理解において従来のモデルを上回っていることが報告されています[2,6]。ただし、安全性に関する報告が伴っていないため、透明性の確保が求められています[7]。
AIエージェントの相互運用性:Agent2Agentプロトコル(A2A)の導入
Googleは、AIエージェントの相互運用性を実現するためのオープンプロトコル「Agent2Agent」(A2A)を発表しました。このプロトコルは、異なるベンダーのAIエージェントが安全に通信し、タスクを連携して実行できるようにするもので、50以上のテクノロジーパートナーが参加しています。A2Aは、クライアントエージェントとリモートエージェント間の通信を促進し、企業の効率性を向上させることを目指しています[8,9,10]。
このプロトコルは、Google Cloud Next 2025で発表され、製品版は2025年後半に提供予定です。製造業などでの業務統合を促進するデモアプリケーションも公開されており、AIエージェントの新たな時代を切り開く期待が高まっています[11,10]。
ChatGPTの新機能: メモリ機能の強化
OpenAIはChatGPTのメモリ機能を強化し、ユーザーの過去の会話を参照して応答をカスタマイズできるようにしました。この新機能により、ユーザーは情報を再説明する手間が省け、よりパーソナライズされたアシスタントとして利用可能になります。プライバシーへの懸念も考慮され、メモリ機能はオプションでオンオフを設定可能です。現在、この機能は有料プランの「Plus」および「Pro」ユーザー向けに段階的に提供されています[12,13,14,15,16]。
GoogleのVeo 2動画生成AIとGemini Advanced
Googleは、動画生成AIモデル「Veo 2」をGemini Advancedで利用可能にしました。ユーザーはプロンプトを入力するだけで8秒間の720p動画を生成でき、TikTokやYouTubeに共有することが可能です。AIによるクリエイティブ業界への影響が懸念される中、この技術は新たな可能性を提供しています。ただし、利用には月間で動画作成回数の制限があります[17,18,19,20]。