文節








文節(ぶんせつ)とは、日本語の文法(文語体ならびに現代日本語文法)において、言葉を細かく区切った際に不自然にならない最小の単位(単語とは異なる)。また音声言語的にも句切ることなくひとつらねで発音される単位である。言語学と用語に少しズレがあり、言語学で言う「語」に近い。



概要


日本語のいわゆる四大文法のいずれにおいてもだいたい同様に区切られるが、「文節」という名でその単位を明確にしたのは橋本文法である。橋本文法では文節を「文を句切りながら発音して、実際の言語としてはそれ以上に句切ることはない個々の部分」としている。学校文法における指導などでは「ね」「さ」「よ」などを挟むことができる所で切る、と説明されている。


文節は、1個の自立語(あるいは「詞」、名詞や動詞など)に、0個以上の付属語(あるいは「辞」、助詞と助動詞 (国文法) )、および接辞(丁寧語の「お-」など)によって構成される(あるいは、それらに分解できる)。


初期の橋本文法では、文を、文節があたかも1本の列のようにつながったような構造のものとして扱っていたが、後に「連文節」により、言語学で言う「句」のような、「複数個の文節がまとまって1個の文節のような働きをするもの」が導入された。学校文法でも連文節を導入することもある[1]



日本語の自然言語処理と文節


日本語の自然言語処理では、日本語がもっぱらわかち書きなどをせずベタ書きすることから、(英語では、文節に相当する単語でまず区切られており、それを形態素の単位に細分するのに対し)まず形態素解析を行い、そこから文節となるカタマリを形成させるチャンキングが文節の解析である。







  1. ^ たとえば https://www.tokyo-shoseki.co.jp/question/j/kokugo.html#q6 を見よ。




Popular posts from this blog

MongoDB - Not Authorized To Execute Command

How to fix TextFormField cause rebuild widget in Flutter

in spring boot 2.1 many test slices are not allowed anymore due to multiple @BootstrapWith