« 監視の時代とプライバシー ⑦ | トップページ | 認識システムの最先端 第2回 ② »

2017年6月26日 (月)

認識システムの最先端 第2回 ①

 

 
”人間と科学” 第277回” 著者 梅崎太造(名古屋工業大教授・東大特任教授)さんの続き: コピー・ペー
■初めての産学連携

 名古屋大学大学院の博士課程時代、普及してきた16ビットパーソナルコンピュータ(パソコン)を使って、聾学校に通う難聴児童を対象とした発話訓練機器を作れないかとの相談を友人より受けた。養護学校教員の友は、学校で発話訓練を指導していたが、訓練用のハードウエアあまりにも高価なため、自分の貯金はおろか学校の予算でさえ購入できないということだった。中には定価で1000万円以上するものもあった。当時、著者(梅崎)は機械による自動音声認識のアルゴリズムを研究していたので、その応用として興味を持ちソフトウエアの開発をもちろん無料で引き受けた。このとき、アルバイトで数値計算の指導をしていた名古屋のC社が、福祉教育に貢献できるのであれば支援するということで、開発費と開発メンバーを調達してくださった。これにより、初めて産学連携による開発がスタートした。但し、この時点では商品化する予定はなく、数台作って教育機関で試してもらおうというぐらいのつもりであった

■開発が始まってから…

  勢いに乗ってソフト開発を引き受けたが、音声認識技術を組み込んだシステムであるため、A/D変換器(マイクロホンで入力したアナログ信号の音声をデジタル信号に変換してコンピュータに取り込む装置)とD/A変換器(コンピュータの外部記憶装置(HD)に記録されているデジタル音声データをアナログ信号に変換してスピーカー等で聴けるようにする装置)が必要であった。現在ではノートブックパソコンでさえ、これらのハードウエアを標準で搭載しているが、1983年頃のデスクトップ型パソコンには、付属しておらず、外部スロット装着型のボードを購入する必要があった。これらの2枚の変換器ボードだけでもパソコン本体より高価であった。やっとの思いで開発環境を揃えたのだが、実際の開発に苦労したのは、ソフトウエア開発ではなく、違うところにあった。発音訓練の標準的指標を作るために必要な健聴児童の音声データベースが無かったのである。さらに、前記データベースだけではなく、難聴児童の発話内容が、統計的にどれだけずれているかの調査する為のデータベースも無かった。





« 監視の時代とプライバシー ⑦ | トップページ | 認識システムの最先端 第2回 ② »

日記・コラム・つぶやき」カテゴリの記事

トラックバック


この記事へのトラックバック一覧です: 認識システムの最先端 第2回 ①:

« 監視の時代とプライバシー ⑦ | トップページ | 認識システムの最先端 第2回 ② »