ВходНаше всё Теги codebook 无线电组件 Поиск Опросы Закон Четверг
28 марта
742976
mut (17.03.2017 22:31 - 22:45, просмотров: 4239)
Понравился комментарий с Хабра, взято по ссылке. https://habrahabr.ru/post/324200/
xx3l
Статистика без понимания природы вещей — страшная вещь. Бородатый пример (см. ниже), который мне в начале 2000-х подвернулся (спасибо, перезалили).
Бородатый пример:
Мыть и какать Группа исследователей-энтузиастов составляла частотный словарь произведений Михаила Шербакова: загнала в компьютер все доступные тексты и заставила умную программу подсчитать для каждого слова, сколько раз оно в этих текстах встречается. Программа была настолько умная, что сама определяла грамматическую принадлежность слова (существительное, глагол и т.п.) и распознавала потом это слово во всех его формах: падежах, лицах, числах и т.д. Когда работа была сделана, её авторы, проверяя возможности своего детища, поинтересовались в частности, какой глагол у Щербакова самый употребительный. И получили ответ: глагол "мыть". Авторы переглянулись: они неплохо знали тексты Щербакова и что-то не замечали там обилия этого глагола. Тогда они спросили, какой глагол следующий по употребительности, и программа уверенно ответила: глагол "какать"... Только шок, пережитый авторами работы, заставил их вспомнить, что а) программа считает деепричастия не самостоятельными словами, а формами соответствующих глаголов, и б) никто не сказал ей о такой штуке, как ударение, которым и различаются "какая"-местоимение и "какая" - деепричастие. Тогда-то выяснилась и причина лидерства глагола "мыть" - у него кроме деепричастия есть ещё и подходящая форма повелительного наклонения...
:)