テキストを柳 英俊の声で再生する「Text-To-だるやなぎスピーチ」を作った

2016/11/23DevelopmentTwilio,だるやなぎ

プログラミング生放送勉強会 第41回@サイボウズ株式会社 松山オフィス で発表したネタです。昨年11月から温めていました。

柳 英俊(だるやなぎ)とは

柳 英俊(通称 だるやなぎ)は、自由に使えるフリー素材です。2014年10月開催の「国際だるやなぎ会議 2014」で、ライセンスの決定を提案し、事例として「大崎一番太郎」を紹介。のちに、CC0 (Creative Commons Zero) に決まりました(おまえらも、フリーであれ! – だるろぐ)。

柳 英俊による有名な Blog 記事はこちら。

音声利用の提案

これまで、柳 英俊の写真・映像の利用はいくつか事例がありますが、柳 英俊をより活用できるよう、音声の利用を提案しました。

Text-To-だるやなぎスピーチ

そこで、音声利用のコンセプト Web サービスとして作成したのが「Text-To-だるやなぎスピーチ」です。一般公開はしていません。

使い方は簡単。入力したテキストを、柳 英俊の声で再生します。

だるやなぎスピーチ

Text-To-だるやなぎスピーチの仕組み

仕組みの紹介動画を用意しました。

  1. テキストに対応する音声ファイルがあれば再生 (→ 終了)
  2. テキストに対応する音声ファイルがない場合、柳 英俊の携帯電話に発信
  3. 入力されたテキストを発音するよう自動音声で指示し、録音する
  4. 録音された音声ファイルを再生 (→ 終了)

Twilio の利用

Twilio を利用しています。次のような TwiML を発信を行う REST API を呼び出すと、指定した URL 宛に結果が渡されます。


<Response>
<Say language="ja-JP">だるやなぎスピーチです。次のメッセージを発音してシャープキーを押しなさい。こんばんは</Say>
<Record action="http://example.jp/handler" finishOnKey="#"/>
</Response>

view raw

twiml.xml

hosted with ❤ by GitHub

肝の部分は以上です。実行するたびに使用料が発生するのと、サーバーを用意する必要があるので少しめんどうですね。

勉強会での資料とデモ

デモは、3:00 頃から。

さっそく、これを見た kintone エバンジェリスト okiyasu さんが(当日は、kintone + Twilio のデモなどをセッションで披露)、地下アイドルのサービスとかに使えそうと言っていて、アイデアをぱくられそうです。

課題

  • お金がかかる(上に収益化が見込めなさそう)
  • デモ用のため、同時リクエスト時のキューイング処理などが未実装(通話中にさらに発信しようとするとエラーで終了する)

以上です。