本文由云山讲座教授宋柔教授编写。
本文提出话头-话体关系、NT小句和小句复合体的概念,将线性文本表示成平面信息,归纳出NT小句构造的4种模式。大量语料的标注实践说明,汉语和英语的篇章是按照4种模式生成的NT小句复合的结果,小句复合体中的话头-话体关系具有不可穿越性、成句性等性质,这些性质可以从大脑认知机制的视角做出可信服的解释。英汉小句复合体的结构差异对于机器翻译造成困难,也为机器翻译技术的改进提供思路。 文章全文及汉语小句复合体语料详见附件。