Рождение модели «Смысл ↔ Текст»: люди, идеи, контекст
Ключевые тезисы:
- Модель «Смысл ↔ Текст» зародилась в СССР в 1960-е годы как революционный подход в лингвистике, идущий от смысла к тексту, а не наоборот.
- Ключевую роль в её создании сыграл небольшой круг учёных: Игорь Мельчук, Александр Жолковский, Юрий Апресян.
- Развитию лингвистики в СССР невероятно способствовала лаборатория машинного перевода (ЛМП) Виктора Розенцвейга, ставшая оазисом интеллектуальной свободы.
- Игорь Мельчук считает, что истинная лингвистика возможна только при описании родного языка, так как язык — это то, что «у меня в голове».
- Эмиграция Мельчука была вынужденной и стала следствием его диссидентской позиции (письмо в The New York Times в защиту Сахарова).
Ключевые создатели модели
Первые шаги были сделаны Игорем Мельчуком и математиком Ольгой Кулагиной. Решающий вклад внёс Александр Жолковский, который «подтолкнул в правильную сторону». Активно подключился Юрий Апресян, а следующее поколение составили его студенты (например, Игорь Богуславский). Также важную роль сыграли Николай Перцов, Нина Леонтьева и жена Мельчука Лида.
Круг был небольшим, что объясняется неожиданностью подхода (движение от смысла к тексту), общей консервативностью советской науки и отсутствием у Мельчука таланта к «проповедованию» своих идей.
Роль Виктора Розенцвейга и ЛМП
Виктор Розенцвейг — бывший разведчик, имевший «охранную грамоту» от Сталина — создал в Институте иностранных языков лабораторию машинного перевода (ЛМП).
ЛМП стала уникальным явлением:
- Это был оазис в советской научной системе.
- Розенцвейг впервые в СССР внедрил систему грантов, нанимая внештатных сотрудников (минуя отдел кадров).
- Он наладил выпуск «Бюллетеня по машинному переводу», где публиковались новаторские работы.
- Через ЛМП прошли почти все видные лингвисты того времени (Елена Падучева, Юрий Мартемьянов, Олег Жолковский и др.).
- Розенцвейг и его жена-хирург фактически поддерживали жизнь целого сообщества учёных.
Зарождение идеи: от машинного перевода к лексическим функциям
Идея модели выросла из практических проблем машинного перевода.
- Проблема многозначности: При переводе слова heavy (тяжёлый, сильный, серьёзный) требовалось сотни контекстных правил.
- Озарение (1961 г.): Мельчук понял, что можно абстрагироваться и описать общий смысл (например, MAGNUS — 'очень большой/сильный') для русского языка, а затем ставить его в соответствие английским словам.
- Лексические функции: Так была открыта первая лексическая функция. Позже Жолковский развил эту идею, увидев в ней «золотую жилу».
От лексических функций к «Смыслу ↔ Тексту»
Работа над детальным описанием слов привела к идее Толково-комбинаторного словаря (ТКС), к созданию которого подключились десятки энтузиастов.
Параллельно под влиянием коллег (Мартемьянов, Леонтьева) и давления Жолковского Мельчук пришёл к выводу, что нужна формальная семантическая запись как основа модели. Это и привело к ключевой идее: двигаться от смысла к тексту (синтез), а не от текста к смыслу (анализ).
Почему синтез? Говорящий точно знает, что хочет сказать, и контролирует процесс. Понимание чужой речи — задача неизмеримо сложнее, требующая фоновых знаний.
Как устроена модель «Смысл ↔ Текст»
- Смысл — это инвариант синонимических преобразований, то есть общее, что есть у всех текстов с одинаковым смыслом.
- Семантическая запись — формальный язык для записи смысла. Это сеть, состоящая из:
- Предикатов (смыслы с «дырками», например, «помогать»).
- Имён (объекты).
- Стрелок (нумерованные семантические актанты, заполняющие «дырки» в предикатах).
- Многоуровневость: Преобразование сети смысла в линейный текст происходит через промежуточные уровни:
- Семантическое представление (сеть).
- Синтаксическое представление (дерево зависимостей) — иногда в двух вариантах (например, для идиомы «дать по шапке»).
- Морфологическое представление (слова с грамматическими характеристиками).
- Фонетическое/графическое представление (цепочка звуков или букв).
Пример силы подхода: Анализ испанских полугласных. При синтезе речи необходимо заранее знать, является ли звук в основе глагола гласным или полугласным (например, bailo vs. maíno), что доказывает их фонемный статус — факт, упускаемый при традиционном анализе.
Взгляд на язык и лингвистику
- Язык — в голове: Мельчук настаивает, что лингвистика должна описывать внутреннее знание языка носителем, а не только корпусы текстов. Корпусы полезны, но вторичны.
- Лингвист — «технарь»: Задача лингвиста — писать чёткие правила преобразования смысла в текст. Мельчук сознательно отстраняется от вопросов усвоения языка ребёнком или работы искусственного интеллекта, считая это другими, смежными областями.
- ИИ vs. ребёнок: Успехи ИИ в переводе впечатляют, но это «большая машина для угадывания». Ребёнок учится языку на эмоциональной основе, стремясь к одобрению и близости, что принципиально иначе.
Путь в Монреаль: вынужденная эмиграция
- Истоки диссидентства — в разочаровании советской системой, усилившемся после «ленинградского дела» и травли Сахарова.
- Переломный момент: Написание письма в The New York Times в защиту Сахарова (1977 г.). Текст вывез американец Дик Китридж.
- Последствия: Мельчука уволили с работы, начали преследовать как «тунеядца».
- Эмиграция (1977 г.): С семьёй и 80 долларами на всех он выехал в Вену.
- Выбор Монреаля: По приглашению Андре Класса, основателя кафедры лингвистики в Монреальском университете. Мельчук выбрал Монреаль за отсутствие жёсткой конкуренции, царившей, по его мнению, в американских университетах, и проработал там до 2009 года.
Выводы:
- Модель «Смысл ↔ Текст» — это плод гениальной интуиции, выросшей из практических задач, и упорного труда небольшой группы энтузиастов.
- Её развитие в СССР было возможно благодаря уникальной «экосистеме», созданной вокруг лаборатории Розенцвейга.
- Философская основа модели — опора на интроспекцию и убеждение, что язык как ментальный объект познаётся через родное сознание.
- Судьба создателя модели неотделима от истории страны, а его научный путь — пример сохранения интеллектуальной свободы в несвободных условиях.
Почему синтез? Говорящий точно знает, что хочет сказать, и контролирует процесс. Понимание чужой речи — задача неизмеримо сложнее, требующая фоновых знаний.
Пример силы подхода: Анализ испанских полугласных. При синтезе речи необходимо заранее знать, является ли звук в основе глагола гласным или полугласным (например, bailo vs. maíno), что доказывает их фонемный статус — факт, упускаемый при традиционном анализе.