今週はAI業界の最新進展に注目します。OpenAIのGPT-4.5が新機能で性能を向上させ、Googleは個人開発者向けにGemini Code Assistを無償提供開始。Inception LabsのMercury Coderは高速性と柔軟性で注目を集めています。さらに、MicrosoftのDragon Copilotが医療現場を支援し、GitHub Copilotのセキュリティ問題が話題に。そしてCohereのAya Visionは多言語・多モーダルAIの進化を示しています。AIの新たな可能性が広がる今週のニュースをお届けします。
GPT-4.5の性能向上と新機能
OpenAIが新たに発表したGPT-4.5は、教師なし学習を取り入れたことで、性能と会話の自然さを大幅に向上させました。このモデルは、より多くの計算能力とデータを使用して訓練されており、その結果、知識と感情的知性が向上し、誤情報を生成する頻度が低下しました。GPT-4.5はAPI経由での利用が可能ですが、その利用料金は高価です。また、ChatGPT Plusユーザー向けに展開が始まっており、計算リソースやアーキテクチャの革新で性能が向上していることが報告されています。新たな学習手法により、ユーザーの意図を汲み取る能力が向上し、創造性や美的感覚も強化されています[1,2,3,4,5]。
Gemini Code Assistの無償提供
GoogleはAIコーディング支援ツールであるGemini Code Assistを無償で提供し始めました。これは、Gemini 2.0を基盤にしたもので、個人開発者が実質無制限で様々なプログラミング言語に対応したコーディング支援を受けられるというものです。Visual Studio CodeやJetBrains IDEで利用可能で、効率的なコーディングをサポートします。この提供により、75%以上の開発者が日常的にAIを活用していることが明らかになっています[6,7]。
Mercury Coder: 拡散型言語モデルの革新
Inception Labsが発表したMercury Coderは、拡散モデルを基にした新しい大規模言語モデルで、従来のTransformer型LLMとは異なり、生成速度が1秒あたり1000トークン以上に及び、GPT-4よりも最大10倍速いとされています。このモデルは特にコード生成に特化しており、高い柔軟性と一貫性を持っていると評価されています。Mercury Coderの登場は、AIを活用したコーディングの新たな可能性を示しています[8,9,10]。
医療業界向けAI「Dragon Copilot」の登場
Microsoftは医療向けAIアシスタント「Dragon Copilot」を発表しました。これは、臨床訪問に基づくメモ作成や情報検索、タスクの自動化を支援するもので、医療従事者の負担を軽減し、患者ケアに集中するための支援を提供します。このシステムは、音声入力と環境音を利用した技術を組み合わせており、信頼できる医療情報を提供する機能も備えています[11,12]。
GitHub Copilotのセキュリティ問題
GitHub Copilotを巡る問題として、非公開リポジトリが意図せず公開されていたことが指摘されています。この問題は、Bingにより2万以上の非公開リポジトリがインデックス化され、Copilotが過去のデータを出力可能だったことから発生しました。Microsoftはこの問題を軽視しているとされ、依然としてデータへのアクセスが可能であるため、データ保護の重要性が強調されています[13]。
Aya Vision: 多言語・多モーダルAIモデルの進化
Cohereは、最新の多言語・多モーダルAIモデル「Aya Vision」を発表しました。このモデルは23言語に対応し、画像キャプション生成や視覚的質問応答などのタスクで優れた性能を発揮しています。Aya Visionは、特に32Bのパラメータモデルが他のモデルを上回る結果を示しており、研究者や開発者にとって重要な技術革新のステップとして位置付けられています[14,15]。