Плотность речи

Photo 139@05 08 2025 21 51 26

Учёные изучили 17 языков, включая английский, итальянский, японский и вьетнамский с точки зрения скорости передачи информации. Сравнивали насколько сложно устроены языки: количество вариантов слогов и темп речи. И просили носителей рассказывать об одинаковых вещах на родном языке.

Выяснилось:
– Слоги в языках имеют разный “вес”: средний японский слог кодирует 5 бит, английский — 7 бит, а вьетнамский со сложной системой тонов — все 8 бит.
– В английском языке 6949 вариантов слога, в японском — 643. В 10 раз меньше, Карл!
– Чем выше плотность информации, тем медленнее речь. И наоборот.
– То есть, темп речи не влияет на информативность. Ученые измеряли как итальянцы тараторят на высокой скорости, а немцы говорят как будто замедленно. И все языки передают одинаковое количество данных в единицу времени.
– Язык — это кодек для информации. Если общение идёт с одной плотностью вне зависимости от алгоритма кодека, то ограничение находится не в самом языке.
– А значит нет более эффективного языка с точки зрения обмена информацией!
– Удалось посчитать и измерить скорость обмена данными между людьми — 39.15 бит в секунду. Телеграфное общение на азбуке Морзе в два раза медленнее. Домашний интернет на 100 мегабит в секунду — это 100 000 000 бит в секунду.
– Многие из нас ускоряют видео и аудиокниги. Мы можем слушать более быструю речь, чем говорим сами. Значит, кодирование потребляет больше ресурсов, чем декодирование.
– Реальный ограничитель не в программном обеспечении, а в аппаратном. На какой-то скорости мы уже не успеваем обдумывать услышанное, поэтому в плеерах максимальное ускорение 200%, а не 1000%.

От себя добавлю, что у компьютеров нет такого биологического ограничителя. Именно поэтому роботы общаются между собой на языке gibber, как R2D2 или AI-агенты в нашумевшем ролике.
Откройте на двух устройствах этот сайт и понаблюдайте за похожими диалогами между роботами.

Оригинальное исследование в журнале Science (на английском языке).