ИТиС

«Информационные технологии и системы - 2010»
33-я конференция молодых ученых и специалистов ИППИ РАН
20 – 24 сентября 2010г.

 

 

 

 

 

 

Просмотров:
Скачиваний:

Компьютерная лингвистика и моделирование естественного языка


Четверг, 23 сентября Компьютерная лингвистика и моделирование естественного языка - 1
10:00 - 11:50 (Cессия 15)
Малый конференц-зал Председатель секции: д.филол.н. Л.Л. Иомдин

Б. Л. Иомдин
Русская бытовая предметная лексика: онтология и описание Открыть работу
Бытовая предметная лексика – слова, называющие артефакты, регулярно используемые большинством городских жителей независимо от их профессиональной и социальной принадлежности – ставит перед исследователем и лексикографом интересные и сложные задачи. Описывается проект словаря-тезауруса бытовой терминологии русского языка, который начала составлять группа молодых исследователей под руководством автора работы. Приводятся и анализируются первые результаты анкетирования информантов и предлагается онтологическая классификация бытовой предметной лексики, необходимая и в качестве базы для создания словаря-тезауруса, и для различных прикладных целей.

Петроченков В.В., Сизов В.Г.
Использование статистической информации о конкурирующих синтаксических связях в синтаксическом анализаторе ЭТАП-3 для получения наиболее вероятной синтаксической структуры фразы. Открыть работу
Для построения наилучшей синтаксической структуры предложения синтаксический анализатор ЭТАПа-3 использует специальную систему весов, чтобы определить, какие из противоречащих друг другу гипотетических синтаксических связей, построенных в ходе его работы, войдут в итоговую синтаксическую структуру. В статье описывается способ усовершенствования существующей системы весов, основанный на использовании статистики конкуренции связей, полученных в процессе синтаксического анализа.

Казенников А.О.
Эксперименты по созданию гибридной системы синтаксического анализа на основе системы ЭТАП-3 Открыть работу
В работе представлены результаты экспериментов по созданию гибридной системы синтаксического анализа на основе правиловой системы ЭТАП-3[1] и статистических методов синтаксического анализа. Статистический компонент на основе машинного обучения используется в двух режимах: для сохранения заведомо корректных связей и удаления заведомо некорректных связей. Основным результатом представленных экспериментов является небольшое улучшение качества синтаксического анализа. Кроме того, наблюдается сокращение времени синтаксического анализа.

Диконов Вячеслав, Павел Дяченко
Эксперимент по построению синтаксической структуры английских предложений с использованием заранее известных фрагментарных данных. Открыть работу
Основная гипотеза данной работы состоит в том, что использование дополнительной информации об анализируемом предложении в процессе автоматического построения его синтаксической структуры и далее семантического графа позволяет повысить качество получаемой структуры. Мы проверили эту гипотезу на основе материала, представляющего собой корпус английских предложений, для которого ранее были получены различные знания о свойствах отдельных слов. Обработка материала в нашей работе проводилась лингвистическим процессором ЭТАП. Получены числовые оценки количества и качества изменений в результате использования имевшихся корпусных данных при текущем уровне развития синтаксического анализатора ЭТАП, английского комбинаторного словаря и словаря UNL.

Фролова Татьяна, Шеманаева Ольга
Лексико-функциональная разметка текстов в СинТагРус Открыть работу
В 2009-2010 гг. в Лаборатории компьютерной лингвистики ИППИ РАН ведется работа по лексико-функциональной разметке русских текстов. В предложениях с построенной древесной синтаксической структурой выявляются и отмечаются словосочетания, допускающие интерпретацию в терминах лексических функций- коллокатов. К настоящему моменту получено около 2000 размеченных таким образом предложений с 2500 вхождениями лексико- функциональных словосочетаний. Полученный корпус можно использовать для решения лингвистических и преподавательских задач, связанных с лексическими функциями.