OpenAIの新モデル「o3」「o4-mini」と業界の推論AI競争
今週はOpenAIの新モデル「o3」と「o4-mini」がChatGPTに実装され、AIエージェントとしての機能が大幅に強化されました。o3は「o1」を上回る推論力を持ち、コーディング・数学・画像解析・視覚認識などで最先端の精度を達成。Plus・Pro・Teamユーザーは即時利用可能、有料プランごとに利用上限や機能制限があります。両モデルは20万トークンのコンテキストウィンドウを持ち、複雑なタスクや画像を含むマルチモーダル処理が可能です。さらに、軽量でコスト効率に優れた「o4-mini」やOSSの「Codex CLI」も発表され、幅広いユースケースを網羅しています[1,2,3,4,5,6,7,8]。
一方で、最新モデルのハルシネーション(誤情報生成)率が従来モデルより高いことも明らかになりました。o3は33%、o4-miniは48%という高い誤情報率を示し、ビジネス現場での信頼性や正確性の担保が課題に。OpenAIはWeb検索機能の追加や安全性対策を進めていますが、今後も品質向上のための研究が続きそうです[9,10,11,12]。
業界全体ではGoogleが「Gemini 2.5 Flash」を発表し、o4-miniよりもコスト効率が高いとアピール。ベンチマークでも同等の精度を示しつつ、開発者が「思考予算」を調整できる独自機能を持ちます。AI推論分野は急速に価格競争が進んでおり、OpenAIも高額モデル「GPT-4.5」を廃止し、低価格で高性能な「GPT-4.1」をリリースするなど、両社の攻防が激化しています。AIモデルの推論力をゲーム「逆転裁判」で評価した研究では、o1とGemini 2.5 Proが優れたパフォーマンスとコスト効率を示し、実用面でも両社が拮抗している様子が見て取れます[13,14,15,16,17,18,19,20]。
ローカル動画生成AI「FramePack」の急速進化と実用化
今週AI界隈で大きな話題となったのが、天才エンジニア・イリヤスフィール氏によるローカル動画生成AI「FramePack」の登場です。このツールは数百行のコードで構成され、NVIDIAの6GB VRAMを持つGPUでも1分間・30fpsの高品質動画がローカルで生成可能。テンセント製「HunyuanVideo」を改造したことで、解像度を上げてもフレーム落ちが少なく、商用サービスに匹敵する生成速度と性能を実現しています。インストールやセットアップも簡便化され、Windows・Linux環境での実装が容易。最大で4分間の動画生成にも対応し、キャラクターの一貫性や長尺動画の可能性も示されました[21,22,23,24,25,26]。
ただし著作権や倫理リスクへの注意も提起されており、今後ストーリーボード連携やさらなる高速化が期待されています。生成AIの動画分野における「ローカル化」の流れが一気に加速していることを感じさせる一週間でした[21,22,23,24,25,26]。
生成AIプラットフォームの多様化と業務活用
AIアシスタント関連の進展も注目です。Anthropicの「Claude」には「Research」機能が追加され、Web情報とGmail/Googleカレンダー等の内部データをまとめて検索・分析できるようになりました。これにより調査やレポート作成が効率化され、企業での情報管理や生産性向上に寄与しています。Microsoft 365 Copilotもアップデートされ、「Researcher」「Analyst」など推論エージェントを追加。複雑なデータ分析や資料管理、AI検索など、多様な業務タスクの自動化・効率化を後押ししています[27,28,29]。
AIノートサービスの「NotebookLM」は、Webやローカルファイルを横断して調査・要約・レポート作成ができ、ChatGPTなど他の生成AIとは異なる実用的な選択肢として注目されています[30]。また、SEOライターのアンケートでは、7割が記事作成にChatGPTを利用する一方、「独自性」や「検索順位」などコンテンツ品質への課題も浮き彫りとなっています。GeminiやClaudeも一定の支持を集めており、AIライティングツールの選択肢が多様化しています[31]。
AI政策・社会実装の最新動向
国内では厚生労働省が、全国のハローワークで生成AIによる問い合わせ自動対応や求人マッチングの実証実験を開始。月間アクセス7000万件を誇るネットサービスで、職員の負担軽減とサービス品質向上を目指します。AIはあくまで補助ツールとしつつも、業務プロセスの効率化や利用者体験の向上を図る動きが加速しています[32,33]。
また、OpenAI幹部がGoogleのChrome事業に対して買収の意向を表明したことも今週のニューストピックです。独占禁止法裁判の中で、Chromeを取得することでAI体験の向上を狙う姿勢が明らかになり、検索技術を巡る両社の攻防が今後さらに注目されます[34,35,36,37]。