О ПРОЕКТЕ

Исследование языковых выражений, буквальное значение которых оказывается неинформативным, избыточным или противоречивым, что не мешает им активно использоваться в коммуникации, является важной задачей в области автоматической обработки текста, поскольку анализ их структуры и значения требует выхода за рамки традиционной пропозициональной семантики.

 

В рамках проекта будут рассмотрен подкласс данных языковых выражений, а именно различные структуры с лексическими повторами: тавтологии, конструкции с тождественными словоформами, грамматически обусловленные повторы. Мы предложим объяснение их функционированию в речи в рамках современных лингвистических теорий, проанализируем факторы, побуждающие говорящих выбирать данные структуры для наличии более простых альтернативных формулировок, в том числе при переводе, а также сформируем информационную базу данных, где аккумулируем и структурируем информацию, полученную в ходе проекта, используя опыт создания конструктиконов — электронных баз данных конструкций на материале разных языков.

Полученные результаты будут полезны для решения задач RTE (Recognizing Textual Entailment ‘логический вывод по фрагменту текста’), когда проверяется (не)соответствие гипотезы H определённой информации, содержащейся во фрагменте текста T: например, мы покажем, каким образом говорящий выводит соответствующие инференции при взаимодействии данных единиц с другими структурными и семантическими элементами (в частности, с модификаторами, выражающими субъективную оценку). Представленные в информационной базе данные о структурных и семантических свойствах рассматриваемых выражений будут полезны для развития систем машинного обучения. Наконец, анализ реальных стратегий перевода рассматриваемых структур по данным параллельных корпусов внесет вклад в развитие систем машинного перевода.

КОНТАКТЫ

Университетская наб., 11, ауд. 107

199034, Санкт-Петербург, Россия

lexicalrepetitions@gmail.com

© 2019 RepLeCon