ニュースや記事で、一杯出ていますから。また、記事では、
「AIが仕事を奪う」など、ショッキングなタイトルにしたり
します。まったくこういうものを書くライターは勉強しません。
歴史を学べばいいじゃないですか。過去、産業革命などで
旧来の仕事を大々的に奪いましたが、再構築がなされたんです。
そして、新しいものが導入されたとき、人口が爆増している
じゃないですか。個々人の泣き笑いはあるかもしれませんけどね。
大事なのはどういう能力、どういう点が人間より優れて
いるかです。その優れている点を維持するには人間が必要に
なるんです、それが、産業革命などで人口が爆増した仕組みです。
そこで、現状はどうなのかを覗いて見ましょう。
そもそもAIの開発はどんな機能を求めているのか?
ChatGPTの場合、主なタスクは次のようなものです。
- テキスト要約
- 情報抽出
- 質問応答
- テキスト分類
- 会話
- コード生成
- 推論
といったことです。全部できるといいうのではなく、
現段階では、まだ稚拙なものがあります。
たとえば、推論は正確さが足りてないといいます。
また、最近私もハマっている画像生成AIでは、
そのものずばり、画像生成がタスクとなります。
似たものに、動画編集AIもありますが、
これは動画編集がタスクですね。
ユーザーたちの見方
先のAIのタスクの話は、エンジニアリングの観点です。
ユーザーからの見たらどうなるのでしょうか?
ChatGPTは広範囲にわたって優れた精度を発揮してます。
しかし、明らかに不十分な面もあります。そういう時には、
補完とか代替するものが出てくるものです。
以下の表は、Facebookに載っていたものを基にしました。
ChatGPTのジャンル別代替AIサービスをそれぞれ4つづつ。
アメリカでのAIサービスですから令和5年4月現在日本に
ないものもあります。
しかし、現在、日本にあるAIサービスも、元々は英語の
サービスで、それを日本語翻訳しているといいます。
なので、いつ日本語対応になるかもしれませんので
そのまま載せました。なお、個々のサービスの説明は、
今回はしません。
◇ChatGPTのジャンル別代替サービス
タスクジャンル | 主なAIサービス |
文章作成 | ChatSonic、ChatABC、Jasper AI、Quillbot |
コンテンツ作成 | WriteSonic、Tome、Copysmith、TextBlaze |
リサーチ | PaperPal、Perplexity、YouChat、Elicit |
プレゼン作成 | Beautiful AI、Simplified、Slidesgo、Sendsteps |
レジメ作成 | KickResume、Rezi AI、Resume AI、Enhance CV |
効率化 | Synthesia、Otter、Bardeen、Copy AI |
コード生成 | (Github) CoPilot、Tabnine、MutableAI、SafurAI |
Tweetmonk、TribeScaler、Postwise、Tweetfly | |
イメージ生成 | StockImg、MidJourney、NightCafe、Photosinic |
ビデオ生成 | Steve AI、Pictory、DeepBrain、Lumen5 |
オーディオ生成 | Murf AI、Speechify、Lovo AI、Media AI |
音楽生成 | Boomy AI、Soundraw、Beatoven、Soundful |
進歩の激しい分野ですから、いつどこから凄いのが出てくるか
分かりません。まあ、ユーザーにとっては楽しみですけどね。
でも、この区分はユーザー目線とエンジニアのそれの違いを
くっきりと見せていて、面白いものです。
しかし、ジャンル別のAIサービスは、ChatGPTのような
爆発的な拡大はしていません。マーケティング上の問題なのか、
価格戦略の問題なのか、分かりません。しかし、恐らく、
多分ですが、精度も関係していると推測します。
ユーザーがChatGPTの精度を上げる
AI、特に大規模言語モデルの場合、精度をあげることとプ
ロンプト(命令文)の工夫をすることは大きく関係します。
つまり、下手な質問や命令をしては、下手な答えしか
返ってこなくなるということです。
以下に簡単な方法を書きます。これはAIの開発者もやっている
ことですが、ユーザーも努力すべきことです。
ゼロショットのプロンプト
質問形式を簡単に言えば、ゼロショットとフューショットがあります。
ゼロショットとうのは、「適当にやっといてよ」とか「上手くやっとけ」
みたいな、ダメ上司の命令です。ダメ上司のやり方はAIの世界でも
精度は高くないようです。
フューショットのプロンプト
フューショットとは、本題の質問や命令の前に、簡単な例を示してやる
やり方です。例えば、
「これは素晴らしい:ポジティブ、これはヒドイ:ネガティブ、
あの映画は最高だ:ポジティブ、なんてヒドイ番組なんだ:」
というように、最後に「なんてヒドイ番組なんだ」をポジティブか
ネガティブの判断をさせようというものです。
これは簡単すぎますが、実際に何かをAIに聞くときには例を示すのが
良いということです。例えば、ゼロショットでは、精度が60%くらいしか
ない場合でも、フュ―ショット形式の問いにすれば、精度が10%程度は
向上するという研究もあります。例はランダムでもいいです。順番を
気にする必要もありません。AIがきれいに判断してくれますから。
例がありさえすれば、精度が上がるといいうことです。
更なる技術、Chain-of-Tought
フューショットでも精度は完ぺきではないです。先にも言いましたが、
70%くらいのイメージです。そこで、これを改善するプロンプト技術に、
Chain-of-Toughtという技術が出てきました。
これは判断の仕方を示すやり方です。例えば、
「このグループの奇数を全部加えると偶数になります。
:4、8、9、15、12、2、1 A:奇数は、
9、15、1、であり合計は25ですからフォルスです。
:17、10、19、4、8、12、24 A:奇数は、
17、19であり合計は36ですから、トゥルーです。
このグループの奇数を全部加えると偶数になります。
:15、32、5、13、82、7、1 A:」
と質問すると、返答は(15、5、13、7、1)の合計41に
なります。答えはフォールスです、と答えるというのです。
ゼロショットやフューショットだと判断の仕方までは示し
ません。そのため、間違うことが多いのですが、
このChain-of-Toughtにすると、精度が上昇します。
ジャンル別AIサービスの精度の向上って、何?
ジャンル別AIサービスもプロンプト・エンジニアリングは重要です。
しかも、それぞれのジャンルにはAI以前からのいい作品の基準の
ようなものがあります。エンジニアには分かっていないかもしれません。
これをくみ取り、吸収するというのは難しく直ぐにはできないのです。
なので、すぐには本当に優れたAIサービスとはならないと思います。
もちろん、現在でもAIのサービスにより米国の有名大学の
MBAの試験に高得点で受かったとか、イラストか絵画のコンテスト
に出品して金賞になったとか言いますが、これはマーケティング
的な狙いが大きいと思います。やはり、普及した状態ではないと
思うんですよね。
加えて、私自身、ジャンル別のAIサービスをあまり試していないんです。
なので、今後、試してみて記事を書いていきたいと思います。
それまで、請うご期待です。