オンライン記事を読み上げてくれる4つの音声合成アプリ - TechRepublic

オンライン記事を読み上げてくれる4つの音声合成アプリ - TechRepublic

読むよりも聞く方が良い場合もあります。例えば、歩くとき、自転車に乗るとき、車を運転するときなどは、周囲の世界に目を向けておく方が安全です。

音声合成(TTS)は、音楽、ポッドキャスト、オーディオブックを聴く代わりに活用できます。TTSは、読みたい記事をすぐに読み上げるのに最適な方法です。例えば、Mozillaの「後で読む」サービス「Pocket」には、記事を音声で聞く機能が含まれています。

TTSは、Android TalkBack、iOS VoiceOver、Chromevox、Windowsナレーター、Mac VoiceOverなど、主要プラットフォームで利用可能な音声補助機能とは少し異なる問題を解決します。これらのツールは通常、ページ上のコンテンツとナビゲーションを含むすべての情報を読み上げます。

以下の4つのTTSアプリは、選択した記事や文書の読み上げに特化したアプリです。いずれもテキスト読み上げ機能を備えていますが、それぞれのアプリのニーズは少しずつ異なります。読み上げられたテキストをそのまま表示するアプリもあれば、様々な音声を提供するアプリもあります。

これらのアプリはすべてiOSで動作し、iOSネイティブの共有システム機能を介してブラウザからアプリに記事を共有する機能をサポートしています。重要なのは、2017年7月現在、これら4つのアプリすべてが積極的に開発中であるということです。それぞれのiOSアプリは、2017年6月または7月に少なくとも1回アップデートされています。

1. モトリード

(iOS、Chrome、Safari デスクトップ拡張機能)

Motoreadは記事のポッドキャッチャーのようなものだと考えています。記事をアプリに送信し、保存した記事を後で聴くことができます。ChromeとSafariの拡張機能を使えば、デスクトップブラウザからワンクリックでMotoreadリストに記事を追加できます。(2017年7月初旬現在、Androidアプリが「近日公開」と記載されています。)

このアプリは記事を単一の音声で読み上げますが、再生速度を調整できます。また、聞きながら記事のテキストを表示することもできます。アプリは無料ですが、アップグレード(月額1.99ドルまたは年額19.99ドル)すると、記事を無制限に追加できるようになります。

2. 音声夢占い

(iOS、Android)

Voice Dream Readerは、読み上げ中の記事のテキストを表示し、読み上げられるたびに各単語をハイライト表示します。このアプリはもともと補助ツールとして開発されたため、再生中に表示されるテキストのサイズ、フォント、間隔、色を調整できます。Voice Dreamは再生速度の調整に対応しており、文間の休止時間もカスタマイズできます。複数のシステム音声から選択し、好みの速度、ピッチ、音量を設定できます。Dropbox、Google Drive、Evernoteなどのソースからドキュメントを追加して聞くこともできます。

Voice Dream Reader の通常価格は 14.99 ドルですが、1 音声あたり最大 4.99 ドルで、さまざまな追加音声も購入できます。

3. スピーチセントラル

(iOS、macOS、Windows、Android)

Speech Centralは、ここで紹介する他のアプリよりも多くのプラットフォームで動作し、iOS、macOS、Windows、Android(ただし、アプリはGoogle PlayストアではなくAmazonから入手可能です)で利用可能です。また、Word、PDFなど、他の形式のテキストの読み上げ機能もサポートしています。iOSでは、システム音声をサポートしていますが、音声ピッチを調整したり、デフォルトの1倍速を少し速くしたり遅くしたりすることもできます。

Speech Centralはテキストを表示し、読み上げられる段落のテキストの左側に、かすかな色の縦線を表示します。長めの記事の場合は、計算された読了時間を読み上げてくれるので、移動中に聞く場合に便利です。また、再生速度を変更することもできます(デフォルトの速度は0.8倍から2倍)。Speech Centralは音声をシャッフルする機能も備えているため、同じ合成音声で複数の記事を続けて聞く必要はありません。

デスクトップ プラットフォーム アプリは無料ではなく、macOS では 6.99 ドル、Windows 10 では 9.99 ドルかかります。ただし、モバイル アプリは無料で、オプションで 4.99 ドルを 1 回支払うことで、無制限の記事を追加できるようになります。

4. オーディオブックメーカー

(iOS版)

Audiobook Makerは、4つのアプリの中で唯一、デフォルトの音声設定で「live」と「livestream」を正しく発音しました。他のアプリはすべて、文脈から見て「live」という4文字の単語を「give」と韻を踏んでいるかのように誤って発音しました。一方、Audiobook Makerは正しく発音し、「Live」は「hive」と韻を踏んでいます。

Audiobook Makerは、画面中央に単語を1つずつ表示するオプションを備えた唯一のアプリでもありました。また、読み上げ中の単語をハイライト表示し、周囲のテキストをサイズ調整可能なフォントで表示するオプションも備えていました。他のアプリと同様に、読み上げ速度の調整や、複数の音声と言語の選択も可能です。

Audiobook Makerはまだ開発中です。例えば、このアプリにはカメラを使って読み上げたい本のページの写真を撮る機能も含まれています。しかし、私が本のページを撮影すると、「残り1分未満」というメッセージが表示されたまま、消えませんでした。公平を期すために言うと、iOSアプリのタイトルは「Audiobook Maker – Early Adopters」です。とはいえ、テキスト読み上げの基本機能は動作し、アプリは無料です(2017年7月現在)。

開発者向けテキスト読み上げ

アプリにテキスト読み上げ機能を追加するのも、かつてないほど簡単になりました。AmazonのPolly、MicrosoftのBing Speech、IBMのText to Speechなど、大手企業がテキスト読み上げAPIサービスを提供しています。Responsive Voiceのような小規模な競合企業もこの分野に存在します。また、検索大手のGoogleとBaiduはそれぞれ、「Deep WaveNet」と「Deep Voice 2」と呼ばれる、より自然な音声を実現するテキスト読み上げ機能の開発進捗を宣伝する研究論文を発表しています。

記事や文書を聞く際に、音声合成(TTS)をご利用ですか?もしそうなら、どのような音声合成システムやアプリをご利用ですか?また、開発者の方は、上記のAPI音声合成サービスのいずれかをアプリに統合していますか?もしそうなら、どのサービスとその理由をTwitter(@awolber)または以下のコメント欄で教えてください。

Tagged: