今週はMetaの新たなオープンソースAIモデル「Llama 3.1」の登場や、OpenAIによる軽量高性能モデル「GPT-4o mini」の発表が話題となりました。さらに、日本の伝統文化浮世絵を活用した画像生成AI「Evo-Ukiyoe」とカラー化AI「Evo-Nishikie」の登場も注目されています。これにより、AI技術と文化の融合が新たな可能性を広げています。
Llama 3.1の登場
今週、Metaが新たにリリースしたオープンソース大規模言語モデル「Llama 3.1」は、業界に大きな波紋を呼んでいます。Llama 3.1は、4050億のパラメータを持つモデルで、GPT-4と同等、あるいはそれ以上の性能を誇ります。このモデルは、Metaの公式サイトやHugging Faceで無料でダウンロード可能で、再配布や商用利用も許可されています[1,2,3]。
MetaはLlama 3.1のリリースに際し、オープンソースAIモデルの重要性を強調しています。過去には、高性能コンピューティングの初期段階でクローズドソースのUnixが多額の投資を受けていましたが、最終的にはオープンソースのLinuxが業界標準となりました。現在、AIモデルも同様の道を辿っていると考えられています[4]。Llama 3.1は、GPT-4などの主要モデルと競争できる性能を持ちつつ、オープンソースの利点を活かして多言語対応やコスト効率を実現しています[5,6,7]。
Amazon SageMaker JumpStartでは、Llama 3.1の8B、70B、405Bモデルが利用可能であり、これにより開発者は生成AIアイデアを迅速に構築、実験、スケールアップすることができます[5]。また、AWSのAIチップであるTrainiumとInferentiaを使用することで、Llama 3.1モデルのファインチューニングと推論が高性能かつ低コストで行えるようになっています[8]。
さらに、CloudflareはWorkers AIプラットフォームでLlama 3.1の8Bモデルを提供し、オープンソースコミュニティを支援する戦略を推進しています。これにより、開発者は多言語対応のアプリケーションを容易に構築できるようになりました[9]。
Llama 3.1は、Metaと協力する企業により、AWS、Azure、Google、Oracleなどの主要クラウドプラットフォームで利用可能です。Scale.AIやDeloitteもLlamaを採用し、独自のデータでカスタムモデルをトレーニングする支援を提供しています[4]。
GPT-4o miniの発表
OpenAIは、新しい軽量で安価なマルチモーダルAIモデル「GPT-4o mini」を発表しました。このモデルは低コストでありながら、GPT-3.5 Turboよりも高い性能を示し、一部のベンチマークではGPT-4を上回るスコアを記録しています[10,11,12,13]。GPT-4o miniは、テキスト、画像、音声の入力に対応し、将来的にはビデオの入出力もサポートする予定です[14,15]。
API料金は非常に低く、入力トークン100万当たり0.15ドル、出力トークン100万当たり0.60ドルと設定されており、コスト効率に優れています。また、ChatGPTユーザーに対して無料で提供され、Azure AIでも利用可能です[12,15,13]。
このモデルのリリースにより、多くの企業や開発者がAI技術をより手軽に利用できるようになり、AI導入のハードルが大幅に低くなることが期待されています[11,13]。
浮世絵生成AI「Evo-Ukiyoe」と浮世絵カラー化AI「Evo-Nishikie」の登場
Sakana AIは、日本の伝統文化である浮世絵を活用した画像生成AI「Evo-Ukiyoe」と、モノクロ浮世絵をカラー化するAI「Evo-Nishikie」を発表しました。これらのモデルは立命館大学のデジタル浮世絵画像を学習データとして使用しており、日本語プロンプトを入力すると浮世絵風の画像を生成したり、モノクロ浮世絵をカラー化します[16,17,18]。
これにより、浮世絵の新しい楽しみ方や教育用途での活用が期待されています。商用利用は想定されていませんが、ユーザーは生成結果を楽しむことができます[17,18]。