МУРКО

Лингвисты для изучения языка пользуются корпусами. Они бывают текстовыми, звуковыми, мультимедийными, всяческими. Один из таких российских корпусов – нарезка материалов из советских фильмов.А пишу я этот пост для того, чтобы рассказать, что Мультимедийный русский корпус называется МУРКО 🙂

Основная единица материала в нём: кликст (=клип + транскрипция к нему). Там, кстати, очень подробная аннотация по речевым действиям и жестам.

Например, можно выбрать действие “Похвала”, в котором есть подразделы: комплимент, одобрение, похвала, похвальба, тост, удовлетворение. Большое количество социальных ситуаций – от разговора с начальством до заказа в ресторане. Можно отобрать манеру говорить, скажем, запыхавшийся человек или “интимная речь” 🙂 Жесты прописаны гораздо лучше, чем в международном многоязычном словаре жестовых языков, где такая разметка в принципе отсутствует 🙂

Если хотите поиграться, то вот: ruscorpora.ru/new/instruction-murco.html

Хуификация

В самых сладких снах не могла мечтать, что настанет тот день, когда по работе придётся прописывать правила хуификации.

Предыдущий день счастья случился тогда, когда меня не послали за замечание, что если уж разрабатывать правило для слов с дефисом, то надо делать работу качественно, а то вот кхое-кхто добавил в корпус-хуёрпус пару предложений невысокого регистра, а грамматика их не исправила. Негоже. Держите баг-репорт 🙂

Яжлингвист сидит теперь и формулирует 🙂

В качестве иллюстрации прилагаю прекрасные настройки с сайта-хуификатора.

Рейхсгенерал-фельдмаршал

Мозг работает очень по-разному в ситуациях, когда нужно что-то создать и когда нужно что-то сломать.

– Эй, лингвисты! Что ещё должно писаться через дефис?
– Составные должности. Штабс-капитан, генерал-лейтенант и т.д., со всеми вариациями.
– Ок.

– Эй, лингвисты! Мы сделяль, проверяйте.
– В 1663 году в звании имперского рейхсфельдмаршал -лейтенанта под началом рейхсгенерал- фельдмаршала Раймунда Монтекуколли участвовал в разгроме османской армии в битве при Сентготтхарде. Кавалерист – девица штабс -ротмистр Александр Андреевич Александров (Надежда Андреевна Дурова) : с приложением 17 рисунков и документов / А. Сакс. – СПб. : Т-во Р. Голике…

Эвиденциальность у матсес

« Читал тут книгу про структурный разбор языков. Узнал, что есть такое племя матсес в Африке, у которых есть не только три прошедших времени, но эвиденциальные различия в глаголах. В смысле, что нельзя сказать ничего так, чтобы не обозначить источник фактов и степень их достоверности. А теперь прекрасная цитата:

«Есть отдельные глагольные формы, зависящие от того, рассказываете ли вы о непосредственном опыте (вы видели проходящего мимо своими глазами), о чем-то, выведенном из материальных следов (вы видели отпечатки на песке), о предположении (люди всегда проходят мимо в это время дня) или о свидетельствах других лиц (ваш сосед сказал вам, что он видел кого-то, проходящего мимо).

Если утверждение сделано в неверной эвиденциальной форме, оно считается ложным. Так что если, например, вы спросите матсеса, сколько у него жен, то если только он не видит их всех в этот момент, то он будет отвечать в прошедшем времени и скажет нечто вроде: daëd ikoşh – «было две» (прямой недавний опыт). То есть то, что он скажет, значит: «Было две, когда я последний раз проверял». В конце концов, учитывая, что жены не присутствуют, он не может быть абсолютно уверен, что ни одна из них не умерла и не сбежала с другим с тех пор, как он последний раз ее видел, даже если это было всего пять минут назад. Поэтому он не может сообщить об этом как об известном факте в настоящем времени». »

Автор: Serge Abdulmanov, Телеграм-канал “Красные пики”

Information density

​“Languages vary a lot in terms of the information that they pack into a syllable and also in the r​​ate that they are spoken at. But the interesting thing is that the two kind of balance each other, so that more information dense languages are spoken slower, and those that are less informationally heavy are spoken faster. This means that there is a steady information rate that is very similar among languages,” says study co-author Dan Dediu, a researcher at Lyon’s Laboratoire Dynamique du Langage.

Кто победил, l’Académie française или феминистки?

Годами наибольшее доверие у меня вызывали учёные и авторы, которые на заданные вопросы отвечали сперва что-то вроде “Здесь нет однозначного ответа”, а потом уже делились соображениями. Или вот типичное для физики: “Мы не знаем. И никто не знает. Но пока вроде выходит, что…”
.
И вот сейчас я заканчиваю собственную статью. Хочется взглянуть на себя эдак искоса и, позвякивая льдом, спросить: “Ну так чё там у тебя в итоге? Кто победил, l’Académie française или феминистки?”
.
И даже не знаешь, что себе ответить. Потому что с одной стороны вот феминистки просили так, а Академия говорила “нельзя”, но как же нельзя, посмотрите на Квебек, но грамматика, ну и что твоя грамматика в нашем районе?, а на это Граво, а ей Дюмезиль, а в Ассамблее, а народ же использует, но это же чудовищный суффикс, да ладно вам, нормально, им и Вольтер не гнушался, и кошмар, короче.
По всей видимости, физики просто слишком хорошо знают свою тему, чтобы определиться между да и нет.
.
Язык победил. Он всегда побеждает. Que l’usage tranche.

Grass that holds the earth together

О людях-придурках магических ритуалах, правильных названиях, блестящей монополии и о том, что следовало переназвать птицу, когда Гоголь умер.

[Tarahumara] are said to use the same word for “dancing” and for “working”—obviously because the distinction between these two activities is not immediately apparent to them, since in their scheme of things dance and agriculture serve essentially the same purpose of providing the means of livelihood. The growth and prosperity of their crops seems to them to depend as much or more on the correct performance of their dances, their magical and religious ceremonies, than on prompt and proper attention to the soil.

In the Kate language, which is current in New Guinea, there is a word bilin, which denotes a certain kind of grass with tough stems and roots that are wedged firmly in the soil; the latter are said to hold the earth together during earthquakes, so that it does not break apart. When nails were first introduced by Europeans, and when their use became popularly known, the natives applied this word to them—as also to wire and to iron rods, in short, to everything that served the purpose of holding things together.

Georg von der Gabelentz, in his book on the science of language, mentions the edict of a Chinese emperor of the third century B.C., whereby a pronoun in the first person, that had been legitimately in popular use, was henceforth reserved to him alone.

The dead may, at any moment, be literally “invoked,” the moment those who survive him speak his name. As everyone knows, the fear of such visitation has led many savages to avoid not only every mention of the departed, whose name is tabooed, but even the enunciation of all assonances to his name. Often, for instance, an animal species whose name a defunct person had borne has to be given a different appellation, lest the dead man be inadvertently called upon by speaking of the beast.” In many cases procedures of this sort, entirely mythic in their motivation, have had a radical influence on language, and modified vocabularies considerably.
Ernst Cassirer, “Language and Myth”

Mañana into Gaelic

A notable Irish joke is that it is not possible to translate mañana into Gaelic as the Irish “don’t have a word that conveys that degree of urgency”. (W)

Известная ирландская шутка гласит, что слово “завтра” невозможно перевести на гэльский, так как у ирландев “нет слова, передающего такую степень срочности”.