先日GPT-4を導入してから、毎日のように対話型AIと向き合って作業をしています。
特に言葉を生業とする弊社のようなビジネスでは、AIによる業務支援の効果は絶大で
営業用のSNSやブログ記事、新番組のタイトル案、企画のネタ出しなど
「これに依存するのはちょっと危険だな」と思うほどです。
もちろんそれは、我々がユニークなクリエイティブで戦っていかなければならないからですが。
で、毎日弊社の業務効率化のために様々なプロンプトを作成しているのですが
そうすると「対話型入力装置」。つまり声で入力できるキーボードのようなものがあったらいいのにな、と思うようになりました。
プロンプトは、作って・走らせてみて・改良して……を繰り返します。
それを会話でできるととても楽なのではないかと考えています。
そうすると、TTSならぬSTT(Speech to Text)の装置が必要になってくる訳ですが
既存のデバイスで考えると、Amazon EchoやGoogle homeといったスマートスピーカーが一番好適な訳です。
一時期に比べてちょっと盛り上がりにかけるスマートスピーカーですが、
対話型AIの入力デバイス(STTキーボード)として考えると、いろいろな可能性が見えてきます。
・プロンプト作成をリアルな対話で進めることができる。
・プロンプトの実行を口頭で指示できる。
・STTを繰り返しながらユーザーの声をサンプリングして、ユーザーの声のTTSを実現できる。
・ユーザーの声のTTSで、繁忙時の留守電応答やボイスチャットをサポートできる。
・チャットボットを進化させたボイスチャットボットを作成できる。
素人の私でもここまで考えることができるのですから、スマートスピーカーの開発担当者の皆さんは
既にそれらの研究に着手していらっしゃるかもしれません。
その際、LLM的な「ボイスによる試行錯誤」が必要な際は、ぜひSEVENにお声掛けください。
人間もTTSもAIも、音声のことなら幅広くカバーしていますので、必ずお役に立ちます。
- 投稿タグ
- 音声化, 対話型入力装置, ChatGPT, STTキーボード, GPT-4, Bard, 対話型AI, スマートスピーカー, AmazonEcho, Googlehome, STT, TTS, Speech-to-Text, text-to-speech, LLM