MENU

小町 守 研究室

小町 守 准教授

小町 守 准教授

自然言語処理(機械翻訳)/言語学習支援/情報抽出/ウェブマイニング/機械学習

コンピュータの高度化とビッグデータの台頭により、人工知能分野の研究開発が世界的に注目を浴びています。自然言語処理はコンピュータを用いて人間の言語を理解・生成する研究分野で、ことばを数理的に表現し、プログラムを書くことによって処理します。検索エンジン・機械翻訳・対話システム・自動要約・日本語入力など、様々なアプリケーションの基盤となる理論と技術です。本学で、最先端の人工知能の研究に取り組みましょう。


高校生に向けて

自然言語処理はコンピュータを使って人間の話すことばを解析します。日本語入力やウェブ検索エンジン、情報推薦など、皆さんが毎日使うシステムの一部になっています。そこにあるのが当たり前すぎて重要性に気がつかないが、ないと困る、水や空気のような存在の技術です。

数学を使って言語を理解するので、理工系出身の人が多いですが、言語学・教育学・法学・経済学など様々な人文社会科学系出身の人もいる、学際的な学問分野です。図1は本研究室で開発している日本語学習者のための大規模誤用検索エンジンで、作っているのは外国語学科出身の学生で、日本語教師として働いていた大学院生もいますし、研究室には留学生が2割くらいいます。女性も3割います。

図1: 日本語学習者のための大規模誤用検索エンジン

大学院生に向けて

自然言語処理においても2012年以降深層学習の波が押し寄せてきて、機械翻訳を筆頭として様々なアプリケーションで従来手法の性能を大きく凌駕し、記録を塗り替えていきました。自然言語処理の中で深層学習によって特に大きな恩恵を受けているのは、出力がテキストである言語生成と呼ばれるタスクで、機械翻訳以外には文書要約や対話、画像キャプション生成があります。これまでの統計的な手法では流暢な出力を得ることが困難でしたが、深層学習を用いることで流暢なテキストが得られるようになり、言語処理が注目されています。

このような深層学習の発展を支えるのは、数理的な定式化とプログラミングの枠組みに加え、大規模で質の高いデータと、出力の適切な評価の存在があります。本研究室では、大規模なデータが存在しない場合でも適用可能な深層学習の手法の研究、深層学習に限らず広く用いることのできる質の高い言語資源の構築の研究、そして言語生成の定量的な評価尺度の研究に力を入れて研究を進めています。図2は本研究室で開発しているウェブテキストを対象にしたニューラル機械翻訳システムで、国内における数少ない(片手で数えるほどしかありません)機械翻訳の研究をしている大学の一つとして、国内外の機械翻訳コンテストにも参加しています。

図2: ウェブテキストを対象にしたニューラル機械翻訳の高精度化

教員一覧へ戻る