AIの展開!ジャンル別ツールについて

AIは、Artificial Intelligenceということは誰でも知っています。
ニュースや記事で、一杯出ていますから。また、記事では、
「AIが仕事を奪う」など、ショッキングなタイトルにしたり
します。まったくこういうものを書くライターは勉強しません。
歴史を学べばいいじゃないですか。過去、産業革命などで
旧来の仕事を大々的に奪いましたが、再構築がなされたんです。
そして、新しいものが導入されたとき、人口が爆増している
じゃないですか。個々人の泣き笑いはあるかもしれませんけどね。
大事なのはどういう能力、どういう点が人間より優れて
いるかです。その優れている点を維持するには人間が必要に
なるんです、それが、産業革命などで人口が爆増した仕組みです。
そこで、現状はどうなのかを覗いて見ましょう。

そもそもAIの開発はどんな機能を求めているのか?

ChatGPTの場合、主なタスクは次のようなものです。

  • テキスト要約
  • 情報抽出
  • 質問応答
  • テキスト分類
  • 会話
  • コード生成
  • 推論

といったことです。全部できるといいうのではなく、
現段階では、まだ稚拙なものがあります。
たとえば、推論は正確さが足りてないといいます。

また、最近私もハマっている画像生成AIでは、
そのものずばり、画像生成がタスクとなります。
似たものに、動画編集AIもありますが、
これは動画編集がタスクですね。

ユーザーたちの見方

先のAIのタスクの話は、エンジニアリングの観点です。
ユーザーからの見たらどうなるのでしょうか?

ChatGPTは広範囲にわたって優れた精度を発揮してます。
しかし、明らかに不十分な面もあります。そういう時には、
補完とか代替するものが出てくるものです。

以下の表は、Facebookに載っていたものを基にしました。
ChatGPTのジャンル別代替AIサービスをそれぞれ4つづつ。
アメリカでのAIサービスですから令和5年4月現在日本に
ないものもあります。

しかし、現在、日本にあるAIサービスも、元々は英語の
サービスで、それを日本語翻訳しているといいます。
なので、いつ日本語対応になるかもしれませんので
そのまま載せました。なお、個々のサービスの説明は、
今回はしません。

◇ChatGPTのジャンル別代替サービス

タスクジャンル 主なAIサービス
文章作成 ChatSonic、ChatABC、Jasper AI、Quillbot
コンテンツ作成 WriteSonic、Tome、Copysmith、TextBlaze
リサーチ PaperPal、Perplexity、YouChat、Elicit
プレゼン作成 Beautiful AI、Simplified、Slidesgo、Sendsteps
レジメ作成 KickResume、Rezi AI、Resume AI、Enhance CV
効率化 Synthesia、Otter、Bardeen、Copy AI
コード生成 (Github) CoPilot、Tabnine、MutableAI、SafurAI
Twitter Tweetmonk、TribeScaler、Postwise、Tweetfly
イメージ生成 StockImg、MidJourney、NightCafe、Photosinic
ビデオ生成 Steve AI、Pictory、DeepBrain、Lumen5
オーディオ生成 Murf AI、Speechify、Lovo AI、Media AI
音楽生成 Boomy AI、Soundraw、Beatoven、Soundful

進歩の激しい分野ですから、いつどこから凄いのが出てくるか
分かりません。まあ、ユーザーにとっては楽しみですけどね。

でも、この区分はユーザー目線とエンジニアのそれの違いを
くっきりと見せていて、面白いものです。

しかし、ジャンル別のAIサービスは、ChatGPTのような
爆発的な拡大はしていません。マーケティング上の問題なのか、
価格戦略の問題なのか、分かりません。しかし、恐らく、
多分ですが、精度も関係していると推測します。

ユーザーがChatGPTの精度を上げる

AI、特に大規模言語モデルの場合、精度をあげることとプ
ロンプト(命令文)の工夫をすることは大きく関係します。
つまり、下手な質問や命令をしては、下手な答えしか
返ってこなくなるということです。

以下に簡単な方法を書きます。これはAIの開発者もやっている
ことですが、ユーザーも努力すべきことです。

ゼロショットのプロンプト

質問形式を簡単に言えば、ゼロショットとフューショットがあります。
ゼロショットとうのは、「適当にやっといてよ」とか「上手くやっとけ」
みたいな、ダメ上司の命令です。ダメ上司のやり方はAIの世界でも
精度は高くないようです。

フューショットのプロンプト

フューショットとは、本題の質問や命令の前に、簡単な例を示してやる
やり方です。例えば、
「これは素晴らしい:ポジティブ、これはヒドイ:ネガティブ、
あの映画は最高だ:ポジティブ、なんてヒドイ番組なんだ:」
というように、最後に「なんてヒドイ番組なんだ」をポジティブか
ネガティブの判断をさせようというものです。

これは簡単すぎますが、実際に何かをAIに聞くときには例を示すのが
良いということです。例えば、ゼロショットでは、精度が60%くらいしか
ない場合でも、フュ―ショット形式の問いにすれば、精度が10%程度は
向上するという研究もあります。例はランダムでもいいです。順番を
気にする必要もありません。AIがきれいに判断してくれますから。
例がありさえすれば、精度が上がるといいうことです。

更なる技術、Chain-of-Tought

フューショットでも精度は完ぺきではないです。先にも言いましたが、
70%くらいのイメージです。そこで、これを改善するプロンプト技術に、
Chain-of-Toughtという技術が出てきました。

これは判断の仕方を示すやり方です。例えば、

「このグループの奇数を全部加えると偶数になります。
:4、8、9、15、12、2、1 A:奇数は、
9、15、1、であり合計は25ですからフォルスです。
:17、10、19、4、8、12、24 A:奇数は、
17、19であり合計は36ですから、トゥルーです。
このグループの奇数を全部加えると偶数になります。
:15、32、5、13、82、7、1 A:」

と質問すると、返答は(15、5、13、7、1)の合計41に
なります。答えはフォールスです、と答えるというのです。

ゼロショットやフューショットだと判断の仕方までは示し
ません。そのため、間違うことが多いのですが、
このChain-of-Toughtにすると、精度が上昇します。

ジャンル別AIサービスの精度の向上って、何?

ジャンル別AIサービスもプロンプト・エンジニアリングは重要です。
しかも、それぞれのジャンルにはAI以前からのいい作品の基準の
ようなものがあります。エンジニアには分かっていないかもしれません。
これをくみ取り、吸収するというのは難しく直ぐにはできないのです。
なので、すぐには本当に優れたAIサービスとはならないと思います。

もちろん、現在でもAIのサービスにより米国の有名大学の
MBAの試験に高得点で受かったとか、イラストか絵画のコンテスト
に出品して金賞になったとか言いますが、これはマーケティング
的な狙いが大きいと思います。やはり、普及した状態ではないと
思うんですよね。

加えて、私自身、ジャンル別のAIサービスをあまり試していないんです。
なので、今後、試してみて記事を書いていきたいと思います。
それまで、請うご期待です。

スポンサーリンク
スポンサーリンク




シェアする

  • このエントリーをはてなブックマークに追加

フォローする

スポンサーリンク
スポンサーリンク