オノマトペ
語義曖昧性
自然言語処理
工学部 電子情報工学科
内田 ゆず教授
Yuzu Uchida
コーパス分析からオノマトペの魅力に迫る曖昧な表現を使いこなす人工知能を目指して
私たちはオノマトペを使うことによって日々のコミュニケーションを豊かなものにしています。しかし、オノマトペの使い方や意味には明確な定義がなく、機械での処理は難しいといいます。いま、オノマトペの用法・語義を体系化する試みが進行しています。
- 生活に根づいているオノマトペに注目
- オノマトペは擬音語・擬態語をまとめた言葉です。語源はフランス語で、古くは古代ギリシア語の「名前を造ること」という意味にまでさかのぼるとされています。オノマトペは日本語の語彙に豊富に存在していて、私たちの生活に深く根づいています。
オノマトペは微妙な感情を言い表すときや、細かなニュアンスを伝えるときに役立ちます。例えば、「うきうき」「そわそわ」と聞くとその人の気持ちがダイレクトに伝わりますし、お菓子のパッケージに書かれた「もっちり」「サクサク」に惹かれてついつい手が伸びることもあります。これらのオノマトペを他の言葉に置き換えることは難しいでしょう。
このように、オノマトペは優れた伝達力をもった便利な言葉です。しかし、コンピュータにとってはその多義性、曖昧さゆえに非常に扱いにくい言葉となっています。そこで、内田教授は日本語オノマトペをコンピュータで処理するための知識を体系化しようと考えています。
- オノマトペの語義曖昧性解消を目指す
- オノマトペには、意味を明確に定義できない、複数の意味をもつ、意味が変化しやすいといった特徴があります(語義曖昧性)。たとえば、「ごろごろ」というオノマトペには、①雷が嗚る音、②大きくて重いものが転がる音、③何もせずに無駄に過ごしている様子、④猫がのどを鳴らす音、⑤異物があって違和感がある様子など、多くの意味があります。このような語義曖昧性が、コンピュータでオノマトペを処理する際の障壁となっています。
オノマトペの文中での意味は、係り先動詞や表層格といった周辺文脈で決まります。「ごろごろ」が「鳴る」に係れば①、デ格が「家」なら③、ガ格が「目」なら⑤の意味だと解釈できます。つまり、オノマトペの文脈情報と意味の関係を整理することで、オノマトペの語義曖昧性を解消できるわけです。
内田教授は、自然言語処理の技術を利用して[オノマトペ-文脈情報-意味]のデータを大量に集めています。
- 自動+手動で、大規模データ分析
- 大量のオノマトペ用例を短時間で得るための方法として、形態素解析器(≒入力文を単語単位に分割し、品詞を判別するソフトウェア)を用いた自動抽出が考えられます。しかし、オノマトペはひらがな・カタカナで表記される短い単語である上、品詞が一つに定まらないため、既存の形態素解析器では正しく単語分割できないことがあります。一方で、字面の一致のみを手掛かりにすると「風邪がぶり返す」から「がぶり」を抽出するような誤りが起こります。そこで内田教授は、品詞や係り受け構造の情報を駆使しながら細かな規則を列挙して、高精度なオノマトペ抽出手法を確立しました。ただし、言語現象に例外はつきものですから、この手法でも100%の精度にはなりません。最終的には人手ですべての用例をチェックすることになります。
こうして用例を大量に収集した後、それぞれのオノマトペの意味を分析します。このとき、オノマトペ辞典の定義を基準としますが、辞典に掲載されていない意味で使用されている例もあります。この場合は、言語学の研究者に協力を仰ぎ、新たな意味を定義することもあります。
以上のような手法を用いて、書籍、雑誌、新聞、白書、ブログ、ネット掲示板、教科書、法律などのジャンルにまたがる1億430万語のテキストデータからオノマトペ用例を自動抽出し、意味と周辺文脈の関連を分析しました。
- 文脈情報付き現代日本語オノマトペデータベース
- 現在進行している科研費研究では、オノマトペが、どのような語と強く結びつき、どのような文脈で使用可能なのか、文脈によってどのように語義が変化するのかを明らかにしようとしています。研究の成果として、文脈と意味の情報を付与したオノマトペデータベースを公開する予定です。データベース完成後もオノマトペの使い方や意味は変化するでしょうし、新語も生まれるでしょう。オノマトペを観察し続けてデータを更新する必要があります。
このデータベースは機械翻訳の精度向上や、対話システムの言語理解・発話生成能力の向上、感情分析への応用など、人工知能分野の研究に貢献すると考えられます。また、日本語学習者にとっても実用的なオノマトペ学習ツールになることが期待され、公開が待たれます。
- Profile
-
工学部 電子情報工学科
内田 ゆず1983年生まれ。2010年北海道大学大学院情報科学研究科メディアネットワーク専攻博士後期課程修了。博士(情報科学・北海道大学)。青山学院大学理工学部電気電子工学科助手・助教を経て、2014年より現職。『クラスタ分析を用いた商品レビューに含まれるオノマトペに基づく商品カテゴリの類型化』(人工知能学会論文誌 2015)、『2種のコーパスを対象とした係り先動詞のエントロピーに基づくオノマトペの特徴分析』(第33回ファジィシステムシンポジウム 2017年)など、論文・学会発表多数。
Other Interview