GPT戦争 - 全米メガクラウドベンダー勢ぞろいの戦国時代へ!

grey jet plane

生き馬の目を抜くGPTブーム

AI業界の目まぐるしさは、生き馬の目を抜くと言う表現がまさに適切な状態です。
ChatGPTが大人気になる→GPTが大人気で画像生成系AIの勢いも止まらなくなる
 ┗画像生成系AIは訴訟問題に発展
Googleさんが大慌てした事もあり、MicrosoftがBing Searchを無理やり力業リリース
B2C検索エンジンは2か月弱の間でシェアが微動だにしない と言う状況が2023年3月末の現状ではありますが、GPTのブームは着々と実世界に襲いかかってきています。

 それを反映して、GPTで仕事が奪われる系の記事が大量生産されている状態です。とは言え、日本国内では、本サイトが2023-02-06に記事にしていますので、話題の最先端を行ったのは誇らしいお話です。(ちょっとブームに先行し過ぎてバズりませんでしたが)

もはや、ロシアウクライナ戦争も霞む位の勢いでGPT関連のトピックが後から後から出てくる状態です。

 そんな中Microsoftさんが米Microsoftは4月12日にGITHUB上で(MSの公式プレスリリースページを探しても見つからなかったので暫定的に)DeepSpeed-Chatをリリースされました。

ChatGPTのようなモデルを高速生成するツール、Microsoftが開発 「既存技術の15倍以上」うたう - ITmedia NEWS

米Microsoftが、ChatGPTのようなモデルを生成できるツール「DeepSpeed-Chat」を公開した。一般販売されているGPU1台で100億以上のパラメータを持つモデルの学習ができる上…

DeepSpeed-Chatとは

DeepSpeed/blogs/deepspeed-chat/japanese/README.md at master · microsoft/DeepSpeed · GitHub

DeepSpeed is a deep learning optimization library that makes distributed training and inference easy, efficient, and effective. - microsoft/DeepSpeed

 

DeepSpeedChatとは

DeepSpeedChat
DeepSpeed-Chat1枚解説

DeepSpeed-HEは、数千億のパラメータを持つモデルをサポートし、複数ノード・複数GPUのシステムで、優れたスケーラビリティを実現することができます。その結果、13Bのモデルであれば1.25時間で学習でき、175Bの巨大モデルでも、1日以内に学習できます。

 例えば、DeepSpeed-HEは、Azure Cloud上でOPT-13Bモデルをわずか9時間で、OPT-30Bを18時間で訓練でき、それぞれのコストは300ドル以下、600ドル以下です。

 1~2時間のコーヒータイムや昼休みに、DeepSpeed-Chatで小規模なトイモデルをトレーニングしてみるのも良いでしょう。例えば、コンシューマグレードのGPUでの訓練を動かしてみるため、1つのデータセットで1.3Bのモデルを訓練する例を用意しました。これなら、昼休みから戻ったときに、できあがったモデルのチェックポイントを試してみることができます。

Githubページより引用

 1~2時間のコーヒータイムに300ドル~600ドルをAzureにお賽銭してしまうと会社側で色々お説教されそうではありますが、これで自社のデータセットのみを利用したモデル生成が出来るようになる訳ですから、誤情報を作りやすいGPTの欠点を補うには十分だと思慮します。(問題は、MicrosoftさんがGITHUB上で公開しているタイプの情報やソフトは、メンテナンスが商用レベルとしての品質を維持し続けるか否かという点で若干リスクもありそうなので、この領域を本気で取り組もうとしている(はず)のパナソニックコネクト様に相談してみるのも手かもしれません。)

 またベースとなる日本語データのデータ量が気になる方は以下のポイントが重要で、既存の学習済モデルを皆様の会社様で既に保持しているデータでファインチューンできる点もありがたいポイントになるかもしれません。

  • Step 1 教師付きファインチューニング(Supervised finetuning, SFT): 様々なクエリに対する人間の回答を慎重に選択し、事前学習された言語モデルをファインチューニングします。
  • Step 2 報酬モデルのファインチューニング:同じクエリに対する複数の回答のランキングを、人間が提供したデータセットを用いて、別のモデル(報酬モデルと呼ばれ、通常はSFTより小さい)を学習します。
  • Step 3 RLHF訓練: Proximal Policy Optimization(PPO)アルゴリズムを用いて、報酬モデルからのフィードバックによりSFTモデルをさらにファインチューニングします。
Githubより引用

 とは言え、生成系AI独自の、『嘘を作ってしまう』癖は抜けないとは思いますので、『複数の検索エンジンを横ぐしで、検索して取得した結果をGPTに食わせて要約してもらう』+『根拠となっているINDEX結果を表示する』と言う使い方が一番素直な気がしていますが、ここらへんの領域は日進月歩で進化するため、継続したモニタリングが必要になるかもしれません。

 『嘘を言わないようにする』ポイントは、やはりそこまで簡単ではないとは思慮しておりますが。

AWSもGPTサービスに参入

 2023年4月13日 Amazon Web Services(AWS)さんも、ジェネレーティブAIをAPI経由で利用できる新サービス「Amazon Bedrock」を発表し、ChatGPTに代表されるジェネレーティブAI市場に本格参入することを明らかにしました

 合わせて、Amazonの20年にわたる機械学習の経験を基に開発されたとされる、人間と自然言語で対話し質問に回答でき、要求に応じた文章の生成や要約などが可能で、不適切な入力や出力を検出し拒否するように設定された大規模言語モデル「Amazon Titan」も発表しました。

 同時にVSCodeに対応した、AWS版GitHub Copilotとも言える「Amazon CodeWhisperer」を正式版として投入。個人ユーザーは無料で開放を宣言してくれているので、こちらも一気に便利になってきた状態です。

 GCPはまだGPTサービスの投入を公表していないので、(記憶していないだけなら申し訳ありません)、もししていたらコメント等で教えてください、絶対的な自信を持ったサービスを投入してくれると信じて待っています。

Watson陣営

 一方のWatson陣営ですが、三井化学、GPTとIBM Watsonを組み合わせて新規用途探索を高精度化・高速化する実用検証を開始との事。

三井化学、GPTとIBM Watsonを組み合わせて新規用途探索を高精度/高速化する検証 | IT Leaders

三井化学と日本IBMは2023年4月12日、生成AIの1つであるGPTと、IBMのAI/コグニティブ技術「IBM Watson」を組み合わせることで、三井化学製品の新規用途を探索する業務を高…

 この取り組みは、2022年からの物で、当初からゴールは変わっていないと思われますが、ここで利用されているWatsonがExplorerなのか、IBM Watson - AlchemyAPIなのかで成果は変わってくるのではないかと言う気もしてしまいます。

 いずれにせよ、社内検索と、GPTの融合が進む事は非常に好ましいと思いますが、プレスリリース内の事をカバーしたい場合は、DeepSpeedChatを上手に組み込むほうが無難な気もしていたりします。(そうすると、そしたらWatsonどこに使うの?問題が出るのでそこは組み合わせを検討するアーキの方が色々お知恵を出してくれる事と、成果がどうなったかというプレスリリースを楽しみにしています)

2023年04月15日:イーロンマスクが新法人X. AIを設立

と言うニュースが舞い込んできました。

マスクさんですが、2023年03月末には、GPT-4を超えるAIの即時開発停止を全技術者に対して6カ月間求める書簡を出したばかりなのですが

「コントロールの喪失」の恐れがあるとしてGPT-4を超えるAIの即時開発停止を全技術者に対して6カ月間求める公開書簡、イーロン・マスクやスティーブ・ウォズニアックなど1300人以上が署名 - GIGAZINE

4月10日頃にはGPUを約1万個ものGPUを買い入れて独自のジェネレーティブAIの開発を進め始めている事がすっぱ抜かれ、

「AI研究の6カ月停止」を要請したイーロン・マスク、自分は1万個のGPUを買い込み独自のAIプロジェクトを進めていることが判明 - GIGAZINE

 Googleの親会社・Alphabet傘下のAI企業であるDeepMindからAI研究者のイゴール・バブシュキン氏を引き抜き、OpenAIの研究者に対しても自身のAIプロジェクトへの参加を呼び掛けているという節操の無さが凄いですね。

 そして今週イーロン・マスクが新しいAI企業「X.AI」を設立 と言う流れなので、本当に、応仁の乱の頃の武将達があっちについたりこっちについたり、の様相を想像してしまいます。

銀行さんもGPT

国内では、比較的新しい技術に取り組まない傾向の強い銀行様も、今回はGPTにはやたらに高速に乗っかってきています。

 SMBCさんはNECさんと組んでSMBC GPTを開始(2023年4月11日のリリース)

三井住友オリジナルの「SMBC-GPT」、NECらと実証実験へ “金融AI”目指す - ITmedia NEWS

三井住友フィナンシャルグループが自社オリジナルのAIアシスタントツール「SMBC-GPT」を、日本総合研究所、日本電気(NEC)と共同で構築。本格導入に向けた実証実験を開始…

MUFGさんも2023年4月11日に

三菱UFJフィナンシャル・グループは11日、人工知能(AI)を使った対話型ソフト「チャットGPT」を今年の夏までに社内で導入すると明らかにした。三井住友フィナンシャルグループやみずほフィナンシャルグループも対話型ソフトの導入を検討

みずほ銀行少し遅れて(4月14日)

みずほ、GPT導入へ みずほFGがAzure OpenAI活用検討

みずほフィナンシャルグループは、マイクロソフトの「Azure OpenAI Service」の活用の検討を開始した。

https://www.watch.impress.co.jp/docs/news/1493800.html

 これで一旦Microsoftさんが銀行GPTの全てを制覇した感じだと思います。

GPT戦争はB2Bビジネスにあり!

 B2C市場で話題沸騰のChatGPTシリーズですが、結局行きつくところB2Bでの市場でどうマネタイズするかと言う点が勝負の肝になるのは自明になってきておりまして、現段階ではMicrosoftさんが6か月先行しているという現状だと認識しています。

 Bing Search巻き返し!とかでだまし討ちして、Googleさんを慌てさせるだけ慌てさせて、本命になる銀行、大手企業(パナソニックさんとか)を法人契約で一気に契約取得すると言うここまでの一連の流れはMicrosoftに軍配が上がっている状態のようにも見えてきます。

 ※検索市場は多分Googleさんの一人勝ちは全く微動だにしないと推測しておりますが、こちらは結果が出てくるのを半年位待ってモニタリングしたいと思います。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です