GPT戦争 - 全米メガクラウドベンダー勢ぞろいの戦国時代へ!
生き馬の目を抜くGPTブーム
AI業界の目まぐるしさは、生き馬の目を抜くと言う表現がまさに適切な状態です。
ChatGPTが大人気になる→GPTが大人気で画像生成系AIの勢いも止まらなくなる
┗画像生成系AIは訴訟問題に発展
Googleさんが大慌てした事もあり、MicrosoftがBing Searchを無理やり力業リリース
B2C検索エンジンは2か月弱の間でシェアが微動だにしない と言う状況が2023年3月末の現状ではありますが、GPTのブームは着々と実世界に襲いかかってきています。
それを反映して、GPTで仕事が奪われる系の記事が大量生産されている状態です。とは言え、日本国内では、本サイトが2023-02-06に記事にしていますので、話題の最先端を行ったのは誇らしいお話です。(ちょっとブームに先行し過ぎてバズりませんでしたが)
もはや、ロシアウクライナ戦争も霞む位の勢いでGPT関連のトピックが後から後から出てくる状態です。
そんな中Microsoftさんが米Microsoftは4月12日にGITHUB上で(MSの公式プレスリリースページを探しても見つからなかったので暫定的に)DeepSpeed-Chatをリリースされました。
DeepSpeed-Chatとは
DeepSpeedChatとは
DeepSpeed-HEは、数千億のパラメータを持つモデルをサポートし、複数ノード・複数GPUのシステムで、優れたスケーラビリティを実現することができます。その結果、13Bのモデルであれば1.25時間で学習でき、175Bの巨大モデルでも、1日以内に学習できます。
例えば、DeepSpeed-HEは、Azure Cloud上でOPT-13Bモデルをわずか9時間で、OPT-30Bを18時間で訓練でき、それぞれのコストは300ドル以下、600ドル以下です。
1~2時間のコーヒータイムや昼休みに、DeepSpeed-Chatで小規模なトイモデルをトレーニングしてみるのも良いでしょう。例えば、コンシューマグレードのGPUでの訓練を動かしてみるため、1つのデータセットで1.3Bのモデルを訓練する例を用意しました。これなら、昼休みから戻ったときに、できあがったモデルのチェックポイントを試してみることができます。
Githubページより引用
1~2時間のコーヒータイムに300ドル~600ドルをAzureにお賽銭してしまうと会社側で色々お説教されそうではありますが、これで自社のデータセットのみを利用したモデル生成が出来るようになる訳ですから、誤情報を作りやすいGPTの欠点を補うには十分だと思慮します。(問題は、MicrosoftさんがGITHUB上で公開しているタイプの情報やソフトは、メンテナンスが商用レベルとしての品質を維持し続けるか否かという点で若干リスクもありそうなので、この領域を本気で取り組もうとしている(はず)のパナソニックコネクト様に相談してみるのも手かもしれません。)
またベースとなる日本語データのデータ量が気になる方は以下のポイントが重要で、既存の学習済モデルを皆様の会社様で既に保持しているデータでファインチューンできる点もありがたいポイントになるかもしれません。
Githubより引用
- Step 1 教師付きファインチューニング(Supervised finetuning, SFT): 様々なクエリに対する人間の回答を慎重に選択し、事前学習された言語モデルをファインチューニングします。
- Step 2 報酬モデルのファインチューニング:同じクエリに対する複数の回答のランキングを、人間が提供したデータセットを用いて、別のモデル(報酬モデルと呼ばれ、通常はSFTより小さい)を学習します。
- Step 3 RLHF訓練: Proximal Policy Optimization(PPO)アルゴリズムを用いて、報酬モデルからのフィードバックによりSFTモデルをさらにファインチューニングします。
とは言え、生成系AI独自の、『嘘を作ってしまう』癖は抜けないとは思いますので、『複数の検索エンジンを横ぐしで、検索して取得した結果をGPTに食わせて要約してもらう』+『根拠となっているINDEX結果を表示する』と言う使い方が一番素直な気がしていますが、ここらへんの領域は日進月歩で進化するため、継続したモニタリングが必要になるかもしれません。
『嘘を言わないようにする』ポイントは、やはりそこまで簡単ではないとは思慮しておりますが。
AWSもGPTサービスに参入
2023年4月13日 Amazon Web Services(AWS)さんも、ジェネレーティブAIをAPI経由で利用できる新サービス「Amazon Bedrock」を発表し、ChatGPTに代表されるジェネレーティブAI市場に本格参入することを明らかにしました。
合わせて、Amazonの20年にわたる機械学習の経験を基に開発されたとされる、人間と自然言語で対話し質問に回答でき、要求に応じた文章の生成や要約などが可能で、不適切な入力や出力を検出し拒否するように設定された大規模言語モデル「Amazon Titan」も発表しました。
同時にVSCodeに対応した、AWS版GitHub Copilotとも言える「Amazon CodeWhisperer」を正式版として投入。個人ユーザーは無料で開放を宣言してくれているので、こちらも一気に便利になってきた状態です。
GCPはまだGPTサービスの投入を公表していないので、(記憶していないだけなら申し訳ありません)、もししていたらコメント等で教えてください、絶対的な自信を持ったサービスを投入してくれると信じて待っています。
Watson陣営
一方のWatson陣営ですが、三井化学、GPTとIBM Watsonを組み合わせて新規用途探索を高精度化・高速化する実用検証を開始との事。
この取り組みは、2022年からの物で、当初からゴールは変わっていないと思われますが、ここで利用されているWatsonがExplorerなのか、IBM Watson - AlchemyAPIなのかで成果は変わってくるのではないかと言う気もしてしまいます。
いずれにせよ、社内検索と、GPTの融合が進む事は非常に好ましいと思いますが、プレスリリース内の事をカバーしたい場合は、DeepSpeedChatを上手に組み込むほうが無難な気もしていたりします。(そうすると、そしたらWatsonどこに使うの?問題が出るのでそこは組み合わせを検討するアーキの方が色々お知恵を出してくれる事と、成果がどうなったかというプレスリリースを楽しみにしています)
・2023年04月15日:イーロンマスクが新法人X. AIを設立
と言うニュースが舞い込んできました。
マスクさんですが、2023年03月末には、GPT-4を超えるAIの即時開発停止を全技術者に対して6カ月間求める書簡を出したばかりなのですが
4月10日頃にはGPUを約1万個ものGPUを買い入れて独自のジェネレーティブAIの開発を進め始めている事がすっぱ抜かれ、
「AI研究の6カ月停止」を要請したイーロン・マスク、自分は1万個のGPUを買い込み独自のAIプロジェクトを進めていることが判明 - GIGAZINE
Googleの親会社・Alphabet傘下のAI企業であるDeepMindからAI研究者のイゴール・バブシュキン氏を引き抜き、OpenAIの研究者に対しても自身のAIプロジェクトへの参加を呼び掛けているという節操の無さが凄いですね。
そして今週イーロン・マスクが新しいAI企業「X.AI」を設立 と言う流れなので、本当に、応仁の乱の頃の武将達があっちについたりこっちについたり、の様相を想像してしまいます。
銀行さんもGPT
国内では、比較的新しい技術に取り組まない傾向の強い銀行様も、今回はGPTにはやたらに高速に乗っかってきています。
SMBCさんはNECさんと組んでSMBC GPTを開始(2023年4月11日のリリース)
MUFGさんも2023年4月11日に
三菱UFJフィナンシャル・グループは11日、人工知能(AI)を使った対話型ソフト「チャットGPT」を今年の夏までに社内で導入すると明らかにした。三井住友フィナンシャルグループやみずほフィナンシャルグループも対話型ソフトの導入を検討
みずほ銀行少し遅れて(4月14日)
みずほ、GPT導入へ みずほFGがAzure OpenAI活用検討
みずほフィナンシャルグループは、マイクロソフトの「Azure OpenAI Service」の活用の検討を開始した。
https://www.watch.impress.co.jp/docs/news/1493800.html
これで一旦Microsoftさんが銀行GPTの全てを制覇した感じだと思います。
GPT戦争はB2Bビジネスにあり!
B2C市場で話題沸騰のChatGPTシリーズですが、結局行きつくところB2Bでの市場でどうマネタイズするかと言う点が勝負の肝になるのは自明になってきておりまして、現段階ではMicrosoftさんが6か月先行しているという現状だと認識しています。
Bing Search巻き返し!とかでだまし討ちして、Googleさんを慌てさせるだけ慌てさせて、本命になる銀行、大手企業(パナソニックさんとか)を法人契約で一気に契約取得すると言うここまでの一連の流れはMicrosoftに軍配が上がっている状態のようにも見えてきます。
※検索市場は多分Googleさんの一人勝ちは全く微動だにしないと推測しておりますが、こちらは結果が出てくるのを半年位待ってモニタリングしたいと思います。