コンピュータ研究会公開フォーラム 音声認識技術の実用化が進んでいる

IT

7月に北区の北とぴあで開かれた。
そこで、アドバンスト・メディア 鈴木さんが「スマートデバイスとヒューマンコミュニケーション」と題して、同社が開発した音声認識技術を使った様々な商品や使い方を発表した。
音声認識が実用レベルになったという発言は、誇大では無く、1980年代半ばから1990年代にかけて人工知能や機械翻訳に触れた者にとっては、びっくりものだった。以前は、特定話者による学習(機械と利用者双方)が必要だった。不特定話者、発語のスピード・抑揚・アクセントの違いに対応というのは、実演をしてもらって、その通りだと思った。ある程度なまった発音も、きちんと認識していた(このなまった読み上げ実演は、会場をほのぼのとした笑いに包んだ)。
カルテや議事録の音声入力によって格段のスピードアップが図られたという。実用化がさらに進むと思われる。
他に、ナビなど手が離せない状態で、もっと活用の場が広がりそうだ。
鈴木さんが強調していたのは、マンマシンインターフェースをもっと人間寄りに取り戻すと言うこと。IT業界に長く居ると、手書きよりもブラインドタッチが早くなって、苦にならないが、多くの人は戸惑いがある。事例として、ロジスティクスにおける出庫指示など、かなりスムーズに実用になっていた。
また、音声による入力は、日本語入力におけるカナ漢字変換という思考の分断を取り除いてくれるので、思考作業にも大きな貢献をするだろう。集団によるブレーンストーミングでも、記録係が不要で、スクリーンにどんどん発言が表示されていくと、大いに活性化するものと思われる。
フォーラム後の懇親会も含めて、なかなか、刺激に富んだ一日であった。

« »