Skip to content

Latest commit

 

History

History
141 lines (112 loc) · 11.3 KB

Практические_и_индивидуальные_задания_по_предмету_ЛЗКС.mediawiki

File metadata and controls

141 lines (112 loc) · 11.3 KB
layout title
default
Практические и индивидуальные задания по предмету ЛЗКС

Table of Contents

Практические задания

Задание 1. Проверка правописания и автокоррекция

Составить словарь автокоррекции слов для алгоритма Metaphone

  • выбрать 3 слова (имена существительных, английские слова, больше 8 букв)
  • для каждого из них и всех их морфологических форм расчитать индекс Metaphone
  • для каждого из них подобрать 2 варианта неправильного правописания и расчитать слова-подсказки для автокоррекции
Алгоритм - http://linguistics.mk.ua/cl_spelling_and_autocorrection.pdf

Разработать алгоритм автокоррекции на основе Metaphone для украинского языка

  • конвертировать английские правила преобразования в аналогичные украинские (если есть возможность)
  • проверить работоспособность алгоритма
  • найти 2-3 специфических правила для украинского языка
    • найти пример слова, для которого алгоритм не работает
    • добавить правило преобразования, решающего эту проблему

Задание 2. Создание контекстно-свободного языка

Целью выполнения задания является создание простого контекстно-свободного языка, построение его грамматики и порождение предложений этого языка.

При выполнении задания вы выступаете конструктором языка, определяете его правила, стиль и эстетику. Особые усилия необходимо приложить к семантике языка, в идеале обеспечив связь между семантикой и синтаксисом. Авторы, получившие такую связь подтвердят тезис Хомского о глубинных синтаксических структурах, а не получившие - опровергнут!

Структура задания:

  • Словесное описание языка и его грамматики
  • Формальное описание грамматики языка определением группы G(L)=(N,T,S,P)
  • Пример правильного порождения предложения языка
    • Нерекурсивный пример
    • Рекурсивный пример
  • Заключение о связи семантики языка и его синтаксиса
Варианты языков:
  • Язык инопланетянина Эндо (общающегося четырьмя символами ICFP)
  • Язык лабиринта минотавра
  • Пиктографический язык (ala древний египет)
  • Язык голодной кошки
  • Язык простого арифметического калькулятора
  • Язык разозленного верблюда
  • Язык головоломки пятнашки
  • Язык игры в крестики нолики
  • Язык робота-пылесоса
  • Язык кофе-машины
  • Язык "азбуки морзе"
  • Язык лампочки-сигнализатора
  • (предложите ваш язык)

Задание 3

Задание 3.1 Использование регулярных языков для поиска в тексте

В предположении что у вас есть документ в формате Microsoft Word Document или Open Office Document, написать поисковый запрос для нахождения:

  1. всех слов, начинающихся с "кар"
  2. всех слов, заканчивающихся на "ия"
  3. словосочетаний вида
    catch the mouse
    catch mouse
    catch this mouse
  4. телефонных номеров
  5. дат
  6. фамилий известных писателей
  7. всех падежных форм существительного "свет"
Полезные ссылки:

Задание 3.2 Использование контекстно-зависимых грамматик для решения проблемы формализации естественных языков

Целью задания является попытка решения следующих проблем контекстно-свободных грамматик:

  • генерация предложений с существительными в неправильном падеже
  • генерация предложений с правильным спряжением глаголов (русский язык)
  • генерация предложений с глаголами в правильном времени (английский язык)
  • генерация предложений с правильной подстановкой артиклей (немецкий или французский язык)
  • генерация неверных по смыслу предложений когда субъект выполняет недопустимые в реальном мире действия над объектом
  • генерация неверных по смыслу предложений когда к объекту применяются недопустимые в реальном мире характеристики
При выполнении задания вы применяете сложный формализм для решения проблем представления естественного языка на компьютере.

Задание:

  • для каждой проблемы взять предложение естественного языка (НЕ из перечисленных ниже примеров);
  • решить проблему созданием контекстно-зависимой грамматики выбранного предложения (см. "Структура Решения" ниже).
Структура решения :
  • Словесное описание проблемы и способа ее решения
  • Формальное описание контекстно-зависимой грамматики языка определением группы G(L)=(N,T,S,P)
  • Пример правильного порождения предложения языка
  • Заключение о невозможности порождения неправильных предложений
  • Вывод о применимости контекстно-зависимой грамматики для решения выбранной проблемы
ПРИМЕРЫ проблемных предложений (при выполнении задания выбрать свои предложения):
  • склонение существительных:
    • Мама мыла раму
    • Мама мыла рама
    • Деньги - корень зла
    • Деньги - корень зло
  • спряжение глаголов (русский):
    • Маша видит мяч
    • Маша видешь мяч
  • время глаголов (английский):
    • I was waiting for you last night
    • I will wait for you last night
  • артиктли (немецкий, французский):
    • Ich gehe in das Hotel
    • Ich gehe in der Hotel
    • Je vois le fromage
    • Je vois les fromage
  • недопустимые действия субъекта:
    • The cat eat the mouse
    • The mouse eat the cat
  • недопустимые характеристики объекта:
    • Ученые сделали грандиозное открытие
    • Ученые сделали черно-бурое открытие
    • Яна купила сумку малинового цвета
    • Яна купила сумку соленого цвета

Задание 4. Создание грамматики связей для естественного языка

Задание 3 является упрощенной формой задания создания грамматики связей украинского языка.

Упрощение заключается в следующем:

  • для анализа необходимо брать 2 любых предложения на украинском языке
  • промежуточные этапы выполнения сдавать по отдельности не нужно, сдается вся работа сразу

Темы докладов

  • Может ли компьютер общаться на естественном языке? Сопоставление мнений ученых 1950х годов и современности.
  • Как дети учатся языку - заложены ли в них врожденные способы понимать язык или нет? Аргументы Хомского и контраргументы против него.
  • Язык - прерогатива человека или нет? Эксперименты с обучением обезьян.
  • Язык определяет мышление или мышление определяет язык? Взгляд со стороны "немыслящего" компьютера.
  • Трансформационные грамматики для украинского и русского языков. Современное состояние и перспективы.
  • Проблема вычислимости на компьютере и компьютерный анализ естественных языков. Адекватность моделей языков и скорость компьютерной обработки.
  • Компьютерный морфологический анализ - идеи и алгоритмы.
  • Значение национального корпуса языка для компьютерного анализа. Современное состояние работ над корпусом украинского языка.
  • Автоматизированное создание и автоматизированная проверка грамматик языка с применением национального корпуса языка.