トップ > NICTのイベント > 平成22年度 > 情報通信ベンチャー交流ネットワ... > 開催報告

交流ネットワークサロン:ベンチャー向けNICT最新技術セミナー第3回「けいはんな研究所」 〜 開催報告

講義風景 講師 交流会の様子
日時 10月22日(金) 15:00〜18:00
場所 独立行政法人情報通信研究機構(NICT)麹町会議室

アイコン概要

独立行政法人情報通信研究機構 けいはんな研究所 けいはんな研究所長 兼 知識創成コミュニケーション研究センター 中村 哲を講師にお招きし、ICTベンチャーの技術の飛躍のため、NICTの研究者による最新の技術セミナーを開催しました。ベンチャー経営に係わる参加者が集まり、いつでも、どこでも、だれでも、何語でも自由にコミュニケーションができる環境を実現するため、NICTで進めている音声・言語・知識処理についてお話を伺いました。講義終了後、参加者と名刺交換をされるなど、交流を深めました。

 

■ベンチャー向けNICT最新技術セミナー第3回

「音声・言語・知識処理技術紹介」

【講 師】独立行政法人情報通信研究機構 けいはんな研究所
けいはんな研究所長 兼 知識創成コミュニケーション研究センター長
中村 哲

★DSCF0038

■勉強会でのポイント

 ■NICT けいはんな研究所 知識創成コミュニケーション研究センター 概要

 ユビキタス情報通信基盤の上に、言語や知識、能力などあらゆる壁を越えることができるコミュニケーション環境を構築するために、多言語翻訳、音声及び非言語対話、信頼できる情報の収集、直感的情報提示をはじめとする多様なコミュニケーション技術の研究開発を実施。

  ◇けいはんな研究所
   http://kccc.nict.go.jp/keihanna-lab/
  ◇知識創成コミュニケーション研究センター
   http://kccc.nict.go.jp/

(1) MASTARプロジェクト(Multi-lingual Advanced Speech and Text reseARch Project)の狙い
   http://mastar.jp/

  1. NICTを音声・言語資源、技術に関する世界拠点とする
  2. 産業界、社会とリンクした形で持続的に、音声・言語資源を蓄積、成長していく仕組みを作る
  3. 具体的には、
  • 世界的言語資源を構築し社会に還元
  • 産業界とマニュアルなどを対象としたWEB2.0型の機械翻訳サービス
  • 音声対話インタフェース技術の技術開発、社会実験、社会還元
  • ネットワーク音声翻訳に関する技術開発、社会実験、社会還元

(2)社会・産業インフラとしての言語資源基盤

(3) 新たな機械翻訳研究のアプローチ

  • MASTARの自動翻訳:ルールベース翻訳からコーパスベース翻訳へ
    A) 効率的対訳コーパスの構築(自動化などによる)と高精度翻訳(新しいアルゴリズム創出)
    B) 汎用システムから多分野・専門システムへ(カバー率重視→精度重視、低品質→高品質)
    C) 1文単位の翻訳から文脈を考慮する翻訳へ(WEBやコーパスからの知識獲得により可能に)

(4)より身近になる音声コミュニケーション技術

  • MASTARの音声研究
    A) ルールベース対話制御からコーパスベース対話制御へ(ルールと統計的モデルの組み合わせによる効率的な制御)
    B) 音声認識、音声合成の高度化(実データを収集して成長・学習、雑音・地域アクセントなどへの頑健性、多言語に対応)
    C) 新しい対話制御、音声認識、音声合成アルゴリズムの創出(マルチモーダルな入力情報の利用、文脈、対話履歴の利用)

(5)音声翻訳システムを育てる社会還元加速プロジェクト

  • どのような会話の内容でも正確でより自然な音声翻訳を可能とする基本技術を確立し、言葉を超えた自由で円滑なユニバーサル・コミュニケーション環境の実現を促進
 

(6)Web情報の信頼性を分析

  • 従来型検索エンジンでは、リスト表示されたページを一つずつ閲覧するが、玉石混淆のWeb情報について信頼性を判断するのは困難
    →情報信頼性分析システムWISDOMの開発
  • 自然言語解析によってWeb情報の発信者・内容・外観を分析し、情報の組織化、情報の俯瞰的提示を行うことで、情報信頼性の判断を支援
    <現在試験公開中>
    http://wisdom-nict.jp

(7)言語資源、ソフトウェア、サービスを配信、接続

  1. 言語を対象にしたサービスコンピューティング:言語グリッド
  • 辞書や機械翻訳などの言語資源を言語サービスとして登録し、共有可能にするインターネット上の多言語サービス基盤。ユーザは言語サービスを組み合わせて利用することができる。
    http://langrid.nict.go.jp/jp/
  1. 高度言語情報融合フォーラムALAGIN 
  • 人間同士あるいは人間と機械の「言葉の壁」、Web情報に内在する「量や質の壁」を克服する技術、具体的には、テキスト翻訳、音声翻訳、音声対話、適切に情報を検索する技術や信憑性判定を含めた情報分析の技術及びこれらの技術の前提となる今までにない規模の言語資源(辞書、コーパスなど)を研究開発
    http://www.alagin.jp/

(8) 今後の方向性

  • 超多言語環境での高度な言語依存処理、辞書
  • 文字だけでなく、音や画像をキーにした検索
  • より高度な検索UIの実現
  • クラウドコンピューティングでの言語サービスプラットフォーム

Q&A

質疑応答では、活発な意見交換が行われました。
 

Q:具体的にどこまで事業化が進んでいるか。

A:  事業化まではまだ実現しておらず、主たる事業者を探しているところである。
原則NICTからのライセンスとなるが、何らかのかたちで共同研究しなければうまく技術が移転されない。
音声認識そのものをビジネスにするというより、それを(対話式アプリなどに)うまく組み上げて事業化したい。

 

Q:VoiceTraのような音声翻訳ソフトを動かすために、サーバ側のシステムにはどのくらいの処理性能が必要か。

A:  ハイエンドノートPCの最小構成程度でよい。雑音がある場合には、それに強いプログラムを走らせるが、これはかなり身近な技術である。

 

Q:やり取りするデータ量はどの程度か。

A:  アルゴリズムで統計データにして落としているので、実際のデータ量は多くない。音声合成ではアナウンサーの声を20時間分取り込むなどしているため、データ量が最も大きい。

Q:100万以上の文例を収集・分析したということだが、どの言語でも100万以上の文例があるということか。

A:  基本的には、会話集などを参考に日英対訳を100万以上収集しており、これが最も多い。他言語には英語を元に翻訳しているが、これよりも少なくなっている。
英語から他言語への翻訳にあたっては、うまくシチュエーションに合わせた表現にならないなどの問題もある。

Q:旅行会話以上のニュアンス、シチュエーションによって意味が変わる表現などを扱えるようになるとさらに有用だが、今後の方向性はどうか。

A:  現在の技術は最初の一歩であり、今後は状況、文脈をもう少し抽象化した上で使い分けられるようにしたい。

 

参加者の声

  • 昔よく言われたエキスパートシステムやAIの技術による方法との違いはどこにあるのでしょうか。
  • 画像認識系等のシステム、技術についても扱って欲しい。