RESEARCH 研究紹介 RESEARCH 研究紹介

情報学部

コンピュータはどのように
人の言葉を理解するのか?

横野 光

情報学部 情報学科
データサイエンス学環
准教授 /博士(工学)
計算言語学研究室

ビジネス文書における「良い」文章とは何か。日本語学習者はいかにして高度な複文や長文を作れるようになるのか。横野 光准教授は、人間が日常的に使っている自然言語を計算機でモデル化し、その性質を解き明かす研究に取り組んでいる。

メインイメージ

言語処理技術を使って
人間が使う言語を解析

2022年11月にChatGPTが公開され、たちまち世界中で使われるようになったことは記憶に新しい。膨大なデータを学習し、あたかも人間のように言葉を操り、文章を執筆し、人と対話する生成AI(人工知能)の活用が今、急速に広がっている。

このように計算機に人間の言語活動を行わせるためには、人間がどのように言葉を理解し、コミュニケーションをとっているかを知る必要がある。横野 光准教授は、人間が日常的に使っている自然言語を計算機でモデル化し、その性質を解き明かす研究に取り組んでいる。

最近の成果の一つに、クラウドソーシングの発注文書から、ビジネス文書における「良い」文章の特徴を分析した研究がある。

「クラウドソーシングとは、インターネット上で不特定多数の作業者に業務を発注するものです。発注文書の目的は、業務を請け負ってくれる受注者を獲得すること。そこで、応募数の多さを判断基準として、『良い発注文書』と『悪い発注文書』に分類し、とりわけ文書内で使われている副詞と文末表現に着目して、良い・悪い文書との関係を明らかにしようと試みました」と横野准教授。クラウドソーシング運営会社から提供された2万8,768件の大量の発注文書のテキストを計算機を使って分析した。

まず正例(良い発注文書)と負例(悪い発注文書)において、どのような副詞・文末表現などが特徴的に使用されているかを調べた。「文末表現については、正例では『お待ちしております(致します)』『ご応募ください』といった、発注者の受注者に対する『謙譲的な配慮表現』が多く使用されていることがわかりました」。また副詞では『たくさん』『コツコツ』『しっかり』『丁寧に』といった、発注者が求める受注者像に関わる表現の使用が多く見られたという。「つまり副詞・文末表現それぞれ単独で使われる場合は、丁寧かつ配慮が示されていることが大切であると考察できます」

この研究ではさらに副詞・文末表現の組み合わせについても分析した。「例えば正例に特徴的な言語表現である『致します』と『是非』を組み合わせると、興味深いことに負例に特徴的な言語表現になることが分かりました」。つまり良い発注文書に特徴的な言語表現同士が、組み合わせによって悪い発注文書の特徴にもなり得ることが示唆された。「このように計算機で大量の文書・テキストを解析することによって、人間が文章を読むだけは気づかない文章や言語表現の新たな知見を見出すことができます」と説明する。

クラウドソーシングの発注文書からビジネス文書における「良い」文章の特徴を分析した研究の概要
クラウドソーシングの発注文書からビジネス文書における「良い」文章の特徴を分析した研究の概要

日本語習得・文章作成の
プロセスを分析

現在は、国立国語研究所などとの共同研究プロジェクトで、日本語学習者の作文プロセスの分析に取り組んでいる。このプロジェクトでは、日本語学習者が4年間でどのように日本語を習得し、どのような文章を書けるようになるのかを経時的に捉えようとしている。韓国、中国、台湾などアジア諸国の計14大学で日本語を学ぶ学生から、日本語の授業で作成した作文データを収集しており、横野准教授はこのデータからタイピングのふるまいを分析している。「学生一人ひとりのキーを打つ速度や打ち込んだ字数、カーソルの位置・移動距離といった履歴を記録しています。それを解析することで、考えたり推敲しているところ、打ち間違えたり書き直したりした足跡を辿ります」。また日本語学習者が作成した文章を擬似的に再生するシステムも構築している。そこから、どのような筆致で文章作成を進めているのか、どこでつまずきやすいのかを分析するという。

また言語処理技術を使って、テキストの内容も評価する。「どのような単語が頻繁に使われているかといった表層的な分析だけでなく、どのようなプロセスでより難度の高い複文や長文を作れるようになるのかも詳らかにしようとしています」

このプロジェクトと並行し、言語学習者がどのくらい語彙を知っているのかを把握する研究も続けている。さらに横野准教授は、これらの研究から得た知見を教育に生かそうとしている。「母語話者は、意識せずに母語を習得し、直感的に『良い文章』『悪い文章』など判断しているため、その理由を論理的に説明することが困難なことがあります。そうした人間が無自覚に行っている言語活動や文章作成を言語処理技術で解析することで、言語学習者向けの新しい教材や言語教育に携わる人を支援するシステムの開発につなげたいと考えています」と語る。

人間がどのように思考し
世界を認識するのかを問う

自然言語処理の研究は、人間がどのように言語を理解しているのか、そもそも言葉を理解するとはどういうことかを追究することでもある。「それは、私たちがどのように思考し、世界をどのように認識しているのかという問いとも重なります。哲学や言語学、心理学などの分野で議論されてきた根源的なテーマに、言語処理技術で迫る。それが研究の面白いところです」と横野准教授は言う。

「生成AIは、われわれ人間の思考とはまったく異なるメカニズムで世界を認識しているのかもしれません。そうだとすると、新しい言語やコミュニ―ションのあり方を生み出す可能性もあります」。言語処理技術の応用の可能性は、ますます大きく広がっている。

横野 光

情報学部 情報学科
データサイエンス学環
准教授 /博士(工学)
計算言語学研究室

横野 光

専門分野

知能情報学、言語学、学習支援システム、日本語教育

キーワード

計算言語学、自然言語処理、知能情報学、知識構築、談話解析、言語教育支援

研究室HP

計算言語学研究室

教員情報

明星大学教員情報 横野 光

2024年3月掲載

*内容・経歴は取材もしくは執筆時のものです。