Weekly AI News #38
2024-04-04~2024-04-12のAIニュースまとめ
AIモデル性能向上の新機能とカスタム開発拡大に注目する週でした。Gemini 1.5 Proが180カ国以上で新機能を搭載し、開発者向けAPIも強化されました。さらに、新たな言語モデル「Command R+」が登場し、GPT-4 Turbo with VisionのAPI提供もスタート。AI「Stable Audio 2.0」も音楽創作をサポートする進化を遂げました。
AIモデル性能向上の新機能とカスタム開発拡大に注目
AIツールのファインチューニングAPIに新機能追加。特定用途向けモデル開発を支援し、カスタマイズによるコスト削減も可能。2023年8月に特定タスク向けAPI登場でカスタムモデルプログラム拡大。ユーザー自身のニーズに合わせたAIモデル構築が可能に。
OpenAIが2つの新機能を発表、モデルのカスタマイズをより容易に ー fine-tuning APIの拡張とカスタムモデルプログラムの拡大 / 2024年04月05日
OpenAI、ファインチューニングAPI機能追加と「Custom Models Program」拡張を発表 - ZDNET Japan / 2024年04月05日
OpenAI expands its custom model training program | TechCrunch / 2024年04月05日
Introducing improvements to the fine-tuning API and expanding our custom models program / 2024年04月05日
OpenAI の ファイチューニングAPI の新機能|npaka / 2024年04月05日
Gemini 1.5 Proが180カ国以上で新機能を搭載、開発者向けAPIも強化
Gemini 1.5 Proが180カ国以上で新機能を搭載し、音声理解やビデオデータ解析が可能に。開発者の制御性を向上させるJSONモードや新File APIも導入。さらに、次世代モデル「gecko」も登場し、Google Cloud Platformで活用可能。エンタープライズ向けにも対応。
Google、Gemini 1.5 Proリリース ー JSONモードやFile APIなど、開発者向けの機能が大幅に強化 / 2024年04月10日
GoogleがGemini 1.5 Proの一般プレビューを開始、音声理解・システム命令・JSONモードなどの新機能を搭載 - GIGAZINE / 2024年04月11日
GoogleのAI「Gemin 1.5 Pro」が180カ国で利用可能に。音声認識も対応 - PC Watch / 2024年04月10日
Gemini 1.5 Proの新機能 - Native Audio Understanding、System Instructions、JSON Mode、新Embeddingモデル|npaka / 2024年04月10日
新たな言語モデル「Command R+」がAIスタートアップから登場
カナダのAIスタートアップが128Kトークンのコンテキストウィンドウと10言語対応の新言語モデル「Command R+」を発表。GPT-4を凌駕する性能で多言語タスクで高スコアを記録。非営利目的で無料ダウンロード可で、企業向けサービスも提供。日本語対応でAPI提供も可能。
ASCII.jp:GPT-4レベルの衝撃 PC内で使えるオープンLLM「Command R+」 / 2024年04月08日
GPT-4レベルの衝撃 PC内で使えるオープンLLM「Command R+」(アスキー) - Yahoo!ニュース / 2024年04月09日
【Command R+】オープンソース界最強LLMがGPT-4レベルの性能を達成 | WEEL / 2024年04月09日
日本語対応でGPT-4よりも高性能な大規模言語モデル「Command R+」が登場したので使ってみた、無料でダウンロードしてローカル動作も可能 - GIGAZINE / 2024年04月08日
GPT-4 Turbo with VisionのAPI提供開始:画像理解可能なマルチモーダルモデル
最新のGPT-4 Turbo with VisionがAPI提供開始。画像理解可能なマルチモーダルモデルを展開し、価格は入力ごとに$10。画像読み取りAIの一般公開もあり、開発者が食品写真から栄養情報を提供するサービス構築可能。新バージョンで画像処理能力と数学機能が大幅に改善。
OpenAI、GPT-4 Turbo with Visionの一般提供を開始 | gihyo.jp / 2024年04月10日
OpenAIが画像読み取り可能なAI「GPT-4 Turbo with Vision」を一般公開開始、JSONモードや関数呼び出しをサポート - GIGAZINE / 2024年04月11日
OpenAI、「GPT-4 Turbo with Vision」を「OpenAI API」で一般提供 - ZDNET Japan / 2024年04月10日
AI「Stable Audio 2.0」が進化し、音楽創作をサポート
AI「Stable Audio 2.0」が最長3分の音楽生成可能に。無料プランでは月20曲、有料プランはトークン数により異なる。著作権侵害防止のためAudible Magicと提携。音楽作成AIが進化し、楽曲構造や効果音の生成が改良され、システム性能も向上。

