「GPT-4o」発表とアプリの未来

続きを読む

AIを手掛けるトップランナーOpenAIが新しいAIモデル「GPT-4o」を発表した。
末尾に付いている“o”は「omni」のoらしい。画像やテキストなど異なる種類のデータを一度に処理できるマルチモーダルで、簡単に言うと、例えば人間の音声からダイレクトにAIの音声とコミュニケーションができたりするようになっている。これまでは、人間の音声から一旦テキストにして処理を行い、再度テキストから音声に変換をしていた。それがダイレクトに出来るようになったので、AIとの音声会話のレスポンススピードは格段にアップしている。

とはいえ、アプリケーションを見出すのは容易ではないだろう。例えば、私は以前から文字入力の効率化を求めているが、みんな気づいていないのかな?

続きをみる