«Syntax» від MIT Press: чи можна навчити мову без «трансформацій»?
Аудиторія для першокурсників аспірантури в МІТ завжди стартує однаково – із запитання про те, як слова знаходять одне одного в нашій пам’яті. За вікном зима, на дошці – схеми, що нагадують дерева, а в центрі історії – професор, який три десятиліття пояснює структуру речень як живу систему. Саме з цих лекцій виросла перша книга «Syntax», яку MIT Press випустило 16 грудня у форматі відкритого доступу. Автор ділиться правилами, що описують, як слова поєднуються, і чому наш мозок віддає перевагу коротким зв’язкам між ними. Це не просто підручник – це спроба звести до лаконічної моделі те, що студенти роками бачили на дошці як прості, але промовисті дерева залежностей.
Дерево речення – карта для пам’яті
Ключова ідея книги – залежнісна граматика: у кожному реченні є «корінь» і слова, що залежать від нього, вибудовуючись у просте дерево. У цій картині мова узгоджується з пізнавальними обмеженнями: чим довший «місток» між пов’язаними словами, тим складніша і продукція, і розуміння. Автор пропонує дивитися на синтаксис через призму обмежень робочої пам’яті – і ця оптика пояснює, чому мови світу мінімізують середню довжину залежностей. Англійські «Mary eats an apple» і японські порядки слів можуть відрізнятися, але системні правила в кожній мові «підтягують» пов’язані слова ближче одне до одного. Так формується проста, проте потужна модель дерева, здатна описати те, що ми щодня робимо інтуїтивно – з’єднуємо сенси через близькість слів. У книзі ці інтуїтивні спостереження конвертовані у чіткі правила, де головне – не надмірна формальна складність, а когнітивна економія.
Цей підхід, запропонований ще у 1950-ті, тут отримує когнітивне обґрунтування: мовні структури, які «коротші», легше опрацьовуються. Тому моделі, що мінімізують відстані між залежними елементами, природно узгоджуються з тим, як працює людська пам’ять. Книга показує, що багато «дивних» конструкцій перестають бути загадкою, якщо виміряти їх довші або коротші зв’язки, а не шукати приховані рівні представлення.
Поза «трансформаціями»: стара суперечка на нових даних
«Syntax» уважно розбирає ідейну спадщину 1957 року – працю Syntactic Structures Нома Чомскі, де «трансформації» стали центральним механізмом граматики. Класичний аргумент: із прихованих глибинних структур елементи «переміщуються» до поверхні, і це нібито унеможливлює повноцінне навчання граматики лише з вхідних даних. Автор натомість пропонує спростити: у багатьох випадках достатньо припустити дві версії слів або недовизначені ролі без постулювання переміщень; тоді відмінності значень пояснюються різними деревами залежностей. До дискусії додаються сучасні свідчення: великі мовні моделі здатні відтворювати продукцію мови, дуже близьку до дорослих носіїв, працюючи з обсягами даних, порівняними з людським досвідом. Це не «доказ» тотожності машин і людей, але вагомий сигнал: правила синтаксису можуть бути простішими, ніж здавалось, і доступними для навчання. Автор визнає, що у наукової спільноти є контраргументи, однак наполягає: без суворої необхідності у «трансформаціях» вони зайві.
«Якщо немає демонстрації, що трансформації необхідні, отже, вони не потрібні». «Я – за вільні знання для всіх».
Ці дві тези працюють як програмна заява книги: спочатку – вимога до пояснювальної економії в теорії, а потім – позиція щодо доступності результатів. Разом вони відображають курс на перевірюваність і відкритість, у межах якої когнітивні обмеження пам’яті та емпіричні дані мають пріоритет над складними припущеннями.
Клас, що став книгою
Витоки «Syntax» – у лекціях курсу 9.012 «Cognitive Science» для першокурсників аспірантури відділу мозку та когнітивних наук (BCS) МІТ. Там мову системно ділять на три компоненти: звук, структуру та значення; автор роками відповідає за дві з них – структуру й значення. Прості правила, які десятиліттями відточувалися на дошці, нарешті зведені в одному місці – із прикладами та мотивацією через обмеження пам’яті. Поштовхом до рукопису стала порада найближчої дослідницької партнерки – доцентки BCS та дослідниці Інституту мозку Макговерна, яка, за словами автора, першою наполягла: «напишіть статтю». Стаття переросла у книгу – з гладкою оповіддю, що поєднує мінімальну формальність із когнітивною інтуїцією. Це також перша книга автора – підсумок 30-річного викладання, який від початку розрахований на читача поза межами аудиторії МІТ.
За формою «Syntax» – місток між аудиторією та дослідженням: від вправ зі схемами до чітко сформульованих принципів. Її рамка лишається послідовною – дерево залежностей, мінімізація відстаней, економія пам’яті – але приклади підібрані так, щоби не вимагати спеціальної підготовки.
Читайте також наші статті:
Відкритий доступ як принцип
Книга вийшла у відкритому доступі: автор свідомо обрав максимальне охоплення замість гонорару. Він є одним із редакторів журналу відкритого доступу, заснованого кілька років тому, і послідовно відстоює ідею «вільних знань для всіх». MIT Press – неприбуткове університетське видавництво – підтримало цей формат, що дозволяє студентам, викладачам і дослідникам читати «Syntax» безкоштовно. Така модель підсилює головну мету книги: зробити правила поєднання слів прозорими та доступними як для фахівців, так і для широкої аудиторії.
Коли дані говорять: LLM і навчуваність граматики
Окремий акцент у «Syntax» – на сучасних даних із великих мовних моделей. Їхня здатність породжувати тексти, подібні до мови дорослих носіїв, свідчить: значна частина синтаксису піддається навчанню зі «звичайних» обсягів даних. Автор не стверджує, що моделі тотожні людині – навпаки, визнає тонкі розбіжності, – проте наголошує на емпіричному факті: правила синтаксису можуть бути простішими за традиційні уявлення. На цьому тлі гіпотеза про вроджені «трансформації» втрачає статус єдиного пояснення – поряд з нею постають економніші, когнітивно мотивовані моделі. У підсумку LLM стають не заміною теорії, а ще одним джерелом даних, яке дисциплінує гіпотези. Для лінгвістики це означає перехід від дедуктивних схем до перевірки простих моделей на великих корпусах мовлення.
Такий рух до емпіричних перевірок допомагає розвести те, що «зручно уявляти», і те, що справді підтримується результатами. У цій оптиці питання не в тому, чи «можливі трансформації», а чи необхідні вони для пояснення явища з урахуванням пам’яті та статистики мови.
Практичні наслідки: від аудиторії до досліджень
Якщо прийняти залежнісну рамку, змінюється і викладання, і експериментальний дизайн у психолінгвістиці. Студенти отримують інструмент, що напряму пов’язує побудову фраз із когнітивними обмеженнями, а дослідники – перевірні гіпотези про мінімізацію довжин залежностей у різних мовах. Лінгвістичні описи стають компактнішими: там, де раніше постулювали «переміщення», можна моделювати варіанти лексичних ролей та їхні деревні структури. Для обчислювальної лінгвістики це означає ясну мету – алгоритми, що оптимізують локальність зв’язків і відбиті у статистиці корпусів. А для міжмовних порівнянь – точніші прогнози щодо порядку слів і складності обробки речень. Так «Syntax» пропонує дорожню карту для наступних експериментів: від лабораторних тестів пам’яті до корпусних перевірок на десятках мов.
- Спростити навчальні курси, поєднавши правила синтаксису з обмеженнями пам’яті.
- Будувати експерименти, що вимірюють ефект дистанції між залежними словами.
- Тестувати моделі на багатомовних корпусах для перевірки універсальності мінімізації залежностей.
Фінальний штрих: дерево, що росте вільно
«Syntax» з’являється не лише як наукова пропозиція, а й як жест відкритості – книга у вільному доступі, написана мовою доказів і простих правил. У центрі – ідея, що мова віддзеркалює архітектуру пам’яті, а короткі зв’язки між словами роблять її зрозумілою й керованою. Традиційні теорії на кшталт «трансформацій» отримують коректну, аргументовану альтернативу, підсилену сучасними даними і навчальним досвідом автора. Залишається головне запитання до спільноти: які висновки витримають випробування новими корпусами, експериментами і моделями? Відповіді, схоже, уже проростають у гілках того самого дерева залежностей, яким ми описуємо кожне речення.
Автор Порталу Netora Media
Маєте ідею або бренд, про який варто дізнатись ширше? Netora Media відкритий до партнерств: редакційні інтеграції, спецпроєкти, колаборації. Ми створюємо зміст, який читають і запам’ятовують.
Хочете отримувати найцікавіше з Netora Media першими? Підпишіться на нашу розсилку — ми надсилатимемо лише те, що справді варте вашої уваги: новини, огляди, поради та добірки.

