ChatGPTがまたまた大進化を遂げたようですが

Autumnal park, Norwood Grove (10)

© Copyright Stephen Richards and licensed for reuse under this Creative Commons Licence.

ChatGPTの生みの親である米国OpenAI社が初の開発者会議「OpenAI DevDay」を米国サンフランシスコで2023年11月6日に開催したことは、ご存じの方も多いと思います。

当日、OpenAIのCEOであるSam Altman氏が行った基調講演はYoutube 「OpenAI DevDay, Opening Keynote」でご覧になれます。

日本語字幕付きの動画「【日本語字幕】231107OpenAI Dev Day フルver」もアップされました。

もっと手っ取り早く中身が知りたいという方のために、以下の通り、たくさんの方が当日の模様や内容を紹介してくれています。

11/7：Zenn 「OpenAI Dev Dayで発表されたこと15選【プロンプトエンジニア必見 | 和訳 | まとめ】」
11/7：吉田の備忘録「OpenAI Dev Day 2023 まとめ」
11/9：Nuco 「【完全解説】OpenAI DevDay 2023 まとめ」

発表された情報が盛りだくさんすぎて、まだ、すべてを消化しきれていないですが、3番目のNucoさんの説明によると：

2023年のOpenAI DevDayでは、大きく分けて3つの内容が発表されました！以下、簡単に概要を説明します。それぞれ次章以降で詳細に解説をしているので興味があるパートから順番に一読ください。

1. GPT APIのアップデート

OpenAIが提供していたAPIが大幅に改善されました。具体的には、文字数制限の緩和、カスタマイゼーション、価格の改定などが行われました。また新しく「画像生成 / 画像理解 / 音声合成」が可能となるAPIの提供も開始しました。

2. 自然言語で作成可能なAIボット

自然言語で作成可能なAIボット「GPTs」がリリースされました。GPTsとは特定の目的に合わせてChatGPTをカスタマイズする新しい方法です。GPTsが展示されるGPT Storeなるものもオープン予定です。

3. 開発者のためのAIアシスタント

開発者のためのAIアシスタントとして、エージェントが発表されました。LLMの補助ライブラリであるLangChainではすでに開発されていた機能ですが、OpenAIも満を持して発表。エージェントは特定のタスクを遂行するために、モデルやツールを自動で呼び出し可能です。今後、複雑なタスクにどんどん活用されそうですね。

ということなので、今回は、「ChatGPTをブラウザから使う場合に、どのような変化（進化）があったのか」という観点から確認したいと思います。

上図左側がこれまでのログイン後の画面で、右側が新しいログイン後の画面です。

これまでGPT-4を使う場合、DefaultかBingと一緒に使うのか、Advanced Data Analysis（旧Code Interpreter）と一緒に使うのか、何かのプラグインと一緒に使うのか、DALL-E3と一緒に使うのか選択しなければなりませんでしたが、今回の機能アップで、少なくとも、DALL-E3、Bing、Advanced Data Analysis、および、Defaultとして付け加わったGPT-4V機能に関しては、チャットのセッションを切り替えなくても、1つのチャットセッションの中で同時に使えるようになったようです。

また、トレーニングデータは、2023年4月まで延長されたようです。

ただし、例えば、ニュースサイトのリンクをたどって、海外のニュースサイトの要約を行わせるため、Webpilotのプラグインを重宝して使っていたのですが、今回のアップデートでも、Webpilotのような特定のプラグインを使いたい場合は、上図右のChatGPT4のオプションとして「GPT-4」ではなく、「Plugins」を選ばなければならないようです。

また、ブラウザから呼び出す場合のGPT-4は、今回アナウンスされたGPT-4 Turboではないようで、最大トークン長も、128Kではなく、4K（4096）が最大値のようです。

他に、従来のGPT-4（GPT-4V）以降、どのような改善点があったのか、ChatGPT（GPT-4）に訊いてみたところ、最終的に以下の回答を得ました。

【GPT-4とGPT-4 Turboの主な違い】

コンテキストウィンドウのサイズ（GPT-4 Turboは128Kトークンをサポート）
価格設定（GPT-4 Turboはより低コスト）
関数呼び出しの強化とJSONモードの導入
画像入力のサポート
ファインチューニングとカスタムモデルへのアプローチ

ここまでの情報をまとめるためにGPT-4と行った会話を以下に示します。

私#1：

あなたは、GPT-4 Turbo with 128Kモデルですか？

ChatGPT#1：

いいえ、私はGPT-4のモデルですが、128KやTurboのバージョンではありません。OpenAIによって開発されたGPT-4は、高度な自然言語処理と生成能力を備えていますが、特定の「128K」や「Turbo」といったバージョンについての情報はありません。私は最新のGPT-4アーキテクチャに基づいており、多様な質問に答えたり、情報を提供したりすることができます。どのようなお手伝いをさせていただけますか？

私#2：

OpenAI DEVDAYのアナウンスでは、GPT-4 Turboは2023年4月までのデータを学習したそうですが、現在のあなたは何年月までのデータで学習しているのでしょうか？

ChatGPT#2：

私のトレーニングデータは2023年4月までのものです。OpenAIのDEVDAYにおいて言及されたGPT-4 Turboについては、その具体的な詳細や特性について情報を持っていません。一般的に、OpenAIは定期的にモデルを更新し、新しいデータや改善を組み込んでいますが、私の現在のバージョンは2023年4月のデータを最後にトレーニングされたものです。

私#3：

あなたの受け付けるトークンの最大長はいくつですか？

ChatGPT#3：

私の現在のバージョン、GPT-4では、トークンの最大長は4096トークンです。トークンは単語や単語の一部を表す単位であり、テキストの長さや複雑さによってトークンの数は変わります。4096トークンという制限は、かなりの長さのテキストを処理するのに十分ですが、非常に長い文書や詳細なディスカッションの場合には、この制限に達することがあります。

私#4：

他にもGPT-4-Turboとあなたの機能に違いはありますか？

ChatGPT#4：

GPT-4 Turboについての詳細な情報は私のデータベースには含まれていませんが、一般的にOpenAIが新しいモデルを発表する際、以下のような改善や違いが考えられます：

処理速度と応答時間: 新しいモデルは、より高速な処理能力や改善された応答時間を持つ可能性があります。
データセットと学習範囲: 新しいバージョンは、より最近のデータまで学習している可能性があり、これにより最新の情報やトレンドに対応できるようになるかもしれません。
言語理解と生成能力: 言語理解やテキスト生成の精度が向上し、より自然で人間に近い応答が可能になることが期待されます。
特定の機能や応用領域の向上: 特定のタイプのタスクや応用領域において、改善されたパフォーマンスや新機能が導入される可能性があります。
インターフェースとユーザーエクスペリエンス: ユーザーインターフェースや利用者の体験に関する改善が施されることもあります。

GPT-4 Turboが具体的にどのような特徴や機能を持つかについては、OpenAIからの公式な発表やドキュメントを参照するのが最も確実です。

私#5：

そこで、GPT-4Vからできた機能（下図のゼムクリップのような部分をクリック）を使って、OpenAIの説明（New models and developer products announced at DevDay）をPDFにしたものをアップロードしました。

私#6：

OpenAIが公開した資料をアップしましたので、現在のあなた（GPT-4）と今回アナウンスされたGPT-4-Turboの違いを纏めてください。

ChatGPT#6：

OpenAIのDevDayで発表された新しいGPT-4 Turboモデルは、現行のGPT-4モデルと比較していくつかの改善点と違いがあります：

１．機能の強化と大きなコンテキストウィンドウ:

GPT-4 Turboはより高い性能を持ち、2023年4月までの世界の出来事についての知識が更新されています。
128Kトークンのコンテキストウィンドウをサポートしており、一度のプロンプトで300ページ以上のテキストを扱うことが可能です。

２．改善された価格設定:

GPT-4 Turboは、入力トークンがGPT-4に比べて3倍安く、出力トークンが2倍安い価格設定となっています。

３．関数呼び出しの更新:

関数呼び出し機能が強化され、アプリや外部APIの関数を説明し、それらの関数を呼び出す引数を含むJSONオブジェクトを出力することが可能になりました。これにより、一度のメッセージで複数の関数呼び出しが可能となり、効率と精度が向上しています。

４．指示に対する応答の改善とJSONモード:

GPT-4 Turboは、特定のフォーマット（例えばXML）の生成のような、指示に忠実に従うタスクで以前のモデルよりも優れた性能を発揮します。
新しいJSONモードにより、モデルが有効なJSONで応答することを保証し、関数呼び出し以外のチャット補完APIでJSONを生成する開発者にとって有用です。

５．再現可能な出力とログ確率:

‘seed’パラメータの導入により、モデルの出力を再現可能にし、モデルの振る舞いをより制御できるようになりました。これはデバッグやユニットテストの作成などに有用です。
また、GPT-4 Turboが生成する最も可能性の高い出力トークンのログ確率を返す機能も導入されています。

６．ビジョン統合:

GPT-4 Turboは、画像を入力として受け付けることができ、キャプションの生成、画像の詳細な分析、図を含む文書の読み取りなどの用途が可能になります。

７．ファインチューニングとカスタムモデル:

GPT-4のファインチューニングのための実験的アクセスプログラムが作成されています。これにより、よりドメイン固有のモデルトレーニングとカスタマイズが可能になります。
また、大規模な独自データセットを持つ組織向けに、カスタムモデルプログラムも開始されています。これには、ドメイン固有の事前トレーニングから、特定のドメインに合わせたカスタムRLポストトレーニングプロセスまで、モデルトレーニングの各ステップを変更することが含まれます。

これらの強化は、GPT-4 Turboモデルの能力と応用範囲において、現行のGPT-4バージョンと比較して顕著な進歩を示しています。

私#7：

先ほどあなたは「私のトレーニングデータは2023年4月までのものです」と言いましたが、トレーニングデータはGPT-4-Turboと同じなんですね？

ChatGPT#7：

先ほどの回答に関して、誤解を招く表現があったかもしれません。あなたが提供した資料を通じて、GPT-4 Turboに関する新しい情報を学ぶことができました。

この新しい情報に基づいて、GPT-4 Turboは以下のような特徴を持つことがわかりました：

2023年4月までの世界の出来事についての更新された知識。
128Kトークンのコンテキストウィンドウをサポート。
入力トークンと出力トークンのコストがGPT-4よりも低価格。
関数呼び出し機能の強化。
指示に対する応答の改善と新しいJSONモードのサポート。
再現可能な出力とログ確率を提供する新機能。
画像入力を受け付けるビジョン統合機能。
ファインチューニングとカスタムモデルへの新たな取り組み。

これらの特徴は、GPT-4 TurboがGPT-4と比較して進歩した点を示しています。

私#８：

ということは、あなた自身のトレーニングデータは、2023年4月までのものではなく、もっと古い情報ということですか？

ChatGPT#8：

いいえ、私のトレーニングデータは2023年4月までの情報を含んでいます。私はGPT-4モデルであり、2023年4月までのデータを基にトレーニングされました。GPT-4 Turboに関する最新の情報は、あなたが提供した資料を通じて学んだものですが、私自身のトレーニングにはそれらの情報は含まれていませんでした。

つまり、私の基本的な知識と能力は2023年4月までのデータに基づいており、それ以降のデータや情報は含まれていないということです。

私#9：

少なくともあなたにも2023年4月までのトレーニングデータが使われたとしたら、トレーニングデータそのものはGPT-4-Turboもあなた（GPT-４）も変わらないということではありませんか？

ChatGPT#9：

はい、その通りです。私（GPT-4）もGPT-4 Turboも、2023年4月までのデータでトレーニングされています。この点において、トレーニングデータそのものは同じです。

しかし、GPT-4 Turboには以下のような追加の機能や改善が施されています：

大きなコンテキストウィンドウ: GPT-4 Turboは128Kトークンのコンテキストウィンドウをサポートしており、より長いテキストを一度に処理できます。
コストの削減: 入力トークンと出力トークンのコストがGPT-4よりも低く設定されています。
関数呼び出しの強化: 複数の関数を一度のメッセージで呼び出す機能が強化されています。
JSONモード: 有効なJSONでの応答を保証する新しいモードが導入されています。
画像入力のサポート: GPT-4 Turboでは、画像を入力として受け付けることができます。
ファインチューニングとカスタムモデル: 特定の用途やドメインに合わせてモデルをより詳細に調整するためのプログラムが導入されています。

このように、GPT-4 Turboは同じトレーニングデータを基にしながらも、いくつかの重要な機能的進歩を含んでいます。これらの進歩により、GPT-4 Turboは特定のアプリケーションや開発者のニーズにより適した選択肢となる可能性があります。

私#10：

その点は了解しました。でも、「GPT-4とGPT-4-Turboの違いについて説明してください」という指示に関していうと、GPT-4-Turboの特徴の2023年4月までの取れ＾ニングデータというのは省略すべきではないですか？

ChatGPT#10：

そのご指摘は正しいです。GPT-4とGPT-4 Turboの違いを説明する際には、両者が2023年4月までのデータでトレーニングされているという点は、共通の特徴であり、特にGPT-4 Turboの区別する特徴として強調する必要はありません。

トレーニングデータが同じであることは、違いを説明する際には省略するのが適切です。ご指摘いただき、ありがとうございました。

本日は以上です。

終わり

投稿タグ: ChatGPT4

MENU

ChatGPTがまたまた大進化を遂げたようですが

Autumnal park, Norwood Grove (10)

© Copyright Stephen Richards and licensed for reuse under this Creative Commons Licence.

コメントを残すコメントをキャンセル

サイト内検索

生成AI

カテゴリー

アーカイブ

最近の投稿

MENU

ChatGPTがまたまた大進化を遂げたようですが

Autumnal park, Norwood Grove (10)

© Copyright Stephen Richards and licensed for reuse under this Creative Commons Licence.

共有:

コメントを残す コメントをキャンセル

サイト内検索

生成AI

カテゴリー

アーカイブ

タグ

最近の投稿

コメントを残すコメントをキャンセル