Л
Лингвоподкаст
@lingvo_podcast550 подп.
1.4Kпросмотров
20 декабря 2024 г.
question📷 ФотоScore: 1.6K
Как Розеттский камень помог расшифровать древний язык и что это значит для компьютерной лингвистики? 🧩 Розеттский камень нашли в 1799 году во время экспедиции Наполеона в Египет. Это черная каменная плита с тремя одинаковыми по смыслу текстами, написанными древнеегипетскими иероглифами, египетским демотическим письмом и на древнегреческом. На камне высечена благодарочка от египетских жрецов монарху Птолемею V Эпифану. 🔴Как эти языки оказались вместе? В эллинистический период (а камень датируется как раз 196 г. до н.э.) греческая и египетская культуры были сильно связаны. Греческий был официальным языком суда, египетские иероглифы использовали жрецы, а демотическое письмо было просто на каждый день. Такой «тройной перевод» сделал его ключом к пониманию иероглифов, которые на тот момент оставались загадкой. 🔴Как расшифровали иероглифы? Ученые в принципе быстро поняли, что все три текста говорят об одном и том же. Но главное открытие сделал французский ученый Жан-Франсуа Шампольон. Он заметил, что некоторые иероглифы соответствуют именам в греческой части текста. Шампольон понял, что иероглифы обозначают не только слова и объекты, но и слоги и отдельные звуки. Сложив знания о звуковой структуре и системе символов и приправив все это своими знаниями о коптском языке, он восстановил язык, который молчал десятки веков. 🔴Как Розеттский камень связан с NLP? Розеттский камень — это своего рода первый мультиязыковой датасет. В NLP такие датасеты используются для обучения моделей автоматического перевода (мы, кстати, обсуждали это на подкасте про машинный перевод): нейросеть анализирует массив параллельных текстов, разбитых на предложения, и пытается находить в них закономерности.
1.4K
просмотров
1721
символов
Да
эмодзи
Да
медиа

Другие посты @lingvo_podcast

Все посты канала →