Weekly AI News #43

2024-05-09~2024-05-17のAIニュースまとめ

May 17, 2024

新AIモデル「GPT-4o」と革新的進化、AIモデル「Veo」の登場、AI技術が生命分子の未来を変えるなど、今週はAI技術の進化が目覚ましいです。

新AIモデル「GPT-4o」の革新的進化に注目！

最新モデル「GPT-4o」が音声反応速度を大幅向上し、自然な会話や通訳機能を搭載。IT業界の開発競争が一層激化する中、新型AIはChatGPTの2倍速で運用コスト半減など革新的な特長を持つ。リリースまで数週間と迫り、AI界に新たな動きが期待される。

OpenAI 最新モデル「GPT-4o」発表音声の反応速度向上し自然に会話も | NHK | 生成AI・人工知能 / 2024年05月14日
OpenAIが「GPT-4o」発表、2倍高速に　人の反応速度で会話 - 日本経済新聞 / 2024年05月14日
オープンＡＩ、新ＡＩモデル「ＧＰＴ－４Ｏ」発表－低価格で高速 - Bloomberg / 2024年05月14日
OpenAI、ChatGPTの新バージョン「GPT-4o」を発表。無料ユーザー向けにも提供、感情豊かな音声で応答、歌いながら回答も | テクノエッジ TechnoEdge / 2024年05月14日
「GPT-4o」発表。人間と同じ速度で会話可能。利用料は半額に - PC Watch / 2024年05月14日
OpenAI、次世代AIモデル「GPT-4o」を発表 / 2024年05月14日
「GPT-4o」発表　頭一つ抜けた性能をChatGPT無料版にも展開　音声と視覚を備えて“自然な対話”可能に【追記済】 - ITmedia AI＋ / 2024年05月14日
OpenAI、「GPT-4o」発表　高速応答で音声・画像・テキスト対応 - Impress Watch / 2024年05月14日
OpenAIのGPT-4oを日本語OCRとして使ってみる / 2024年05月14日
3分でわかるOpen AIの発表｢友達みたいに話せるGPT-4o｣ | ギズモード・ジャパン / 2024年05月14日
OpenAI が新たな無料モデル GPT-4o とデスクトップ版 ChatGPT を発表ーーアプリはまるで人間と会話するような反応速度に - BRIDGE（ブリッジ）テクノロジー＆スタートアップ情報 / 2024年05月14日
OpenAI、大規模言語モデル「GPT-4o」発表 - ケータイ Watch / 2024年05月15日
ASCII.jp：新しい「ChatGPT」はココがすごい　解説「GPT-4o」 (1/3) / 2024年05月15日
OpenAI「GPT-4o」が変えるビジネス・暮らし　音声AIに飛躍 - 日本経済新聞 / 2024年05月14日

AIモデル「Veo」が登場！革新的な1080p動画生成に注目

1080p解像度で1分以上の動画を生成するAIモデル「Veo」が登場しました。自然言語と視覚情報を組み合わせた映像生成や画像・音楽制作ツールも提供されています。Imgenの技術を活用し、テキストプロンプトからビデオクリップ生成やYouTube映像でのトレーニングが可能です。また、被写体の一貫性を保つ技術や特定の被写体の編集・除去が可能なクリエイティブコントロールも特長です。

自動で1080p・1分超の動画を生成できるAI「Veo」をGoogleが発表 - GIGAZINE / 2024年05月16日
Google Veo, a serious swing at AI-generated video, debuts at Google I/O 2024 | TechCrunch / 2024年05月15日
Google gets serious about AI-generated video at Google I/O 2024 | TechCrunch / 2024年05月15日
Google、動画生成AIモデル『Veo』発表。高解像度で一分超、撮影用語などプロンプト再現性と高い一貫性、動画の一部編集も | テクノエッジ TechnoEdge / 2024年05月15日
Google、テキストや画像から動画を生成するAI「Veo」発表　OpenAIの「Sora」対抗 - ITmedia Mobile / 2024年05月15日
Veo - Google DeepMind / 2024年05月15日
Google I/O 2024: Introducing Veo and Imagen 3 generative AI tools / 2024年05月15日
グーグル、入力文で１分超の高解像度動画を生成するＡＩ「Ｖｅｏ」発表…映画関係者らに提供 : 読売新聞 / 2024年05月15日

「富岳」で学習した「Fugaku-LLM」が公開される

日本のスーパーコンピュータ「富岳」で学習されたAI、「Fugaku-LLM」が公開されました。このモデルは日本語能力に優れ、130億パラメータを持ち、AI分野で日本の優位性確立に貢献します。研究や商業目的での利用が可能であり、大規模言語モデルの新たな選択肢として注目されています。

AI技術が生命分子の未来を変える

新たなAI技術「AlphaFold 3」と「xLSTM」が生命分子の予測精度向上に貢献。医薬品研究や病気理解に革新をもたらす。無料利用のAlphaFold Serverや時系列予測AIモデル「TimeFM」が注目を集める。

Google DeepMindがすべての生命分子の構造と相互作用をきわめて正確に予測できるAIモデル「AlphaFold 3」を発表 - GIGAZINE / 2024年05月10日
Googleが“一歩先の未来を予知”できる時系列予測AI基盤モデル「TimeFM」公開、LSTMの進化形「xLSTM」など重要論文5本を解説（生成AIウィークリー） | テクノエッジ TechnoEdge / 2024年05月13日
Quanta Magazine / 2024年05月09日
Google、2億パラメータのAI予測モデル"TimesFM"を発表 - InfoQ / 2024年05月11日

画像とテキストを理解する新モデルファミリーが登場

新しいビジョン言語モデルファミリーが登場しました。画像とテキストを理解し、テキスト生成が可能。異なる解像度と精度で利用できるモデルです。質問にコンテキスト回答する能力や多面的理解が可能。オープンソースで幅広い能力を持つマルチモーダルモデルも提供されます。複数の言語に対応し、カスタムデータで微調整可能。HuggingFaceとの互換性もあります。

PaliGemma – Google's Cutting-Edge Open Vision Language Model / 2024年05月15日
PaliGemma | Google for Developers / 2024年05月15日
PaliGemma: Open Source Multimodal Model by Google / 2024年05月16日
PaliGemma の概要｜npaka / 2024年05月15日

次期iPhoneのiOS 18にChatGPT統合へ

次期iPhoneのiOS 18ではChatGPTが新機能として組み込まれる見通し。6月のWWDCで注目を集める予定で、ChatGPTのアップデートも5月13日に予定されています。AI業界に大きな影響が期待されています。

アップル、iPhoneへのChatGPT搭載でオープンＡＩと合意に近づく - Bloomberg / 2024年05月11日
AppleとOpenAIの契約が最終調整へ、iOS 18にChatGPTを搭載するとみられる - GIGAZINE / 2024年05月12日
iOS 18: Apple finalizing deal to bring ChatGPT to iPhone - 9to5Mac / 2024年05月11日

IBM、LLMとGranite AIをオープンソース化！GitHubで公開

IBMがLLMとGranite AIをApache 2.0ライセンスでオープンソース化し、AI開発の障壁を下げる。開発者の参入を容易にし、Hugging FaceやGitHubで利用可能。CodeNetデータセットやWCA製品を通じてAI支援を展開。

IBM、AIモデル「Granite」をオープンソース化--商用利用も可能に - ZDNET Japan / 2024年05月15日
IBM open-sources its Granite AI models - and they mean business | ZDNET / 2024年05月14日
IBM’s Granite code model family is going open source - IBM Research / 2024年05月10日

AIによる自然な照明変更と画像加工革命

AIによる自然な照明変更と背景置き換えを実現するテキスト・背景条件付きモデルが公開されました。クリエイター向けの強力なツールで画像の光源指定や背景変更が可能に。GitHubで詳細確認可能で、デモサイトで簡単に操作ができます。さらに、新技術「IC-Light」が登場し、照明を自由に操作できるようになりました。Google Colabを使用して手軽に試せるIC-Lightは、生成AI業界に新たな動向をもたらしています。

GPT-4oの最新情報: マルチモーダル機能強化と有料版展開

最新のGPT-4oはマルチモーダル機能を強化し、写真や音声も処理可能に。有料版ユーザー向け展開がスタートし、無料版は利用制限付きで提供。PC版アプリもリリース予定で、macOS版提供後、Windows版は2024年後半に登場予定。性能・速度向上に加え、価格も下がるトレンド。MacOS用デスクトップアプリも新登場し、言語サポートが拡大され利用回数制限が緩和される。さらに、macOS向けChatGPTデスクトップアプリも登場し、キーボードショートカットで即座に質問可能。数週間後には一般ユーザーにも公開予定。

OpenAIの｢GPT-4o｣はまるで｢目を手に入れたAI｣。ChatGPT無料版でも利用可能に | Business Insider Japan / 2024年05月14日
忙しい方向け OpenAI 発表まとめ｜ぬこぬこ / 2024年05月15日
OpenAI、macOS向けのChatGPTデスクトップアプリを発表。本日よりChatGPT Plusユーザーにロールアウトが開始。 / 2024年05月14日

Discussion about this post

Ready for more?