No Image

Я ем капусту а чиновник мясо

СОДЕРЖАНИЕ
0 просмотров
21 января 2020

Почти под каждым постом, который затрагивает вопрос средней зарплаты в уездном городе N, обязательно появится комментарий с подобной шуткой (или любой другой ее вариант — про макароны по-флотски или среднюю температуру по больнице с учетом умерших). Давайте разберемся, почему эта шутка плохая. И дело не только в том, что она не смешная и повторяется вместе с каждой публикацией статистических показателей.

Многие уже поняли, что среднее арифметическое зарплат и его динамика не лучший способ анализа благосостояния граждан уездного города N, и начали требовать медианных значений. Это здравое желание, но, к сожалению, медиана тоже не всегда дает результат, нужный недовольным комментаторам. Как же перестать ненавидеть Росстат и зажравшихся энчан и полюбить статистику?

«Есть три вида лжи: маленькая ложь, большая ложь и статистика» (2-е место в хит-параде шуток про статистику).

Сами по себе данные не хорошие и не плохие. Вопрос только в том, что мы видим за этими числами. Чтобы лучше понимать, о чем нам хочет сказать очередной пресс-релиз комитета статистики уездного города N, нужно говорить со статистической наукой на одном языке. Конечно, среднее арифметическое — это далеко не все, а лишь одна из характеристик выборки. К сожалению, в школе вся математическая статистика сводится исключительно к нему. Возможно, именно потому, что жители N не знают других терминов, пресс-секретарь статистического ведомства публикует именно эту характеристику (нет, совсем не потому, что мэру нужно отчитаться).

Допустим, сегодня вышел пресс-релиз:

на центральной площади перед ратушей уездного города N провели выборочный опрос и выяснилось, что средний заработок энчан составляет 60 у. е. В паблике «Подслушано N» сразу начались словесные баталии. Появились комментарии о том, что ни у кого из знакомых автора зарплаты больше 30 у. е. нет, а такое значение возможно только потому, что статистическое ведомство лжет или у мэра зарплата в 10 000 у. е. Ну и обязательная шутка про голубцы, куда же без нее.

Кто же лжет в славном городе N: мэр, статистическое ведомство или же кто-то еще?

Чтобы разобраться, начнем с понятия выборки . Правильно сформировать выборку для опроса — особый квест. Очевидно, что если бы мы могли опросить всех горожан, то получили бы информацию о доходах всей популяции. Эта выборка точно была бы репрезентативной. Однако мы можем опросить не всех, а только некоторую часть жителей. И чем меньше людей участвует в опросе, тем ниже репрезентативность данных.

Можно ли считать выборку случайных людей на центральной площади репрезентативной? Однозначного ответа нет. На этот показатель может влиять день недели (будний/выходной), приезд делегации из столичного города M и еще очень много других факторов. В идеале после опроса все демографические соотношения (мужчины/женщины, дети/взрослые/пенсионеры и прочие) должны совпадать с общегородской статистикой — для этого и проводится перепись населения. Если выборка не отвечает этим требованиям, то она нерепрезентативна, а значит, это ошибка и доверять такому отчету нельзя.

Допустим, что выборка была репрезентативной, но данные для большинства горожан всё равно удивительные. Они таких зарплат даже не видят. Чтобы понять, почему среднее арифметическое позволяет довольно точно оценить знания школьников, посчитав средний балл за контрольную, не очень помогает оценить среднюю температуру по больнице и совершенно не работает при оценке доходов населения, нам понадобится понятие дисперсии.

Дисперсия — это мера «разброса» случайной величины от ее самого вероятного значения. У учеников оценка может быть от 2 до 5. Если мы считаем, что наиболее вероятная оценка у школьников 3,5, то мы имеем дисперсию, равную 1,5. Это небольшая дисперсия. Она позволяет нам говорить о том, что среднее арифметическое класса достаточно показательно, если мы хотим сравнить, какой класс знает математику лучше. При помощи такой аргументации гораздо проще объяснить маме тройку, чем доказывать, что у всех вообще два. Согласитесь, «Мама, я сделал вывод, что моя тройка с плюсом выше среднего арифметического в классе, что говорит о том, что я заслуживаю поощрения, а не наказания» звучит гораздо убедительнее, чем «Мама! Да у всех вообще двойки!».

Читайте также:  Церковный праздник на каждый день 2018 года

В случае со средней температурой по больнице всё становится интереснее. Дисперсия температуры у живого человека не такая уж большая — от примерно +34 до +42 °С при максимально ожидаемой +36,6 °С. Это позволяет нам говорить, что среднее арифметическое достаточно показательно для оценки ситуации. Можно сказать, что в среднем пациенты в инфекционном отделении теплее пациентов в травматологическом. Однако всё меняется, если добавить труп с комнатной температурой. Это увеличивает дисперсию и приводит к тому, что среднее становится совершенно нерепрезентативным.

Точно так же можно посмотреть на статистику среднего возраста рождения первого/второго/третьего ребенка у женщины. Почему все учитывают именно женщин, а не мужчин? С агрегацией данных по мужчинам возникает много проблем: разная дисперсия по сравнению с женщинами (у женщин период, когда они могут иметь детей, гораздо короче, чем у мужчин), принципиально разное количество детей, которые могут появиться в течение жизни, сложности с достоверным установлением отцовства.

Несколько лет назад одна лаборатория опубликовала статистику, согласно которой около 10 % тестов на отцовство были отрицательными. Человек, который не знаком со статистикой, мог бы предположить, что 10 % детей воспитываются не своими родителями. Это одна из классических ловушек восприятия статистической информации, которая хорошо накладывается на предыдущие выводы по поводу однородности выборки:

«Никогда не переносите данные опроса на всю популяцию, если не убедились в корректности выборки».

В нашем случае отцовство действительно не подтвердилось в 10 % тестов, но что это была за выборка? Это люди, которые уже настолько сомневались в отцовстве, что пошли проверять его в лабораторию.

Перейдем к нашему вопросу с зарплатами. Дисперсия у зарплат может более чем в 10 раз превышать наиболее вероятный доход. Именно из-за этого говорить о среднем арифметическом как о репрезентативном показателе зарплаты гражданина из массы совершенно бессмысленно.

Понять, что происходит с зарплатами в городе N, помогут медиана и мода.

Медиана — это значение, при котором половина измерений будут больше нее, а половина — меньше нее.

Мода — самое часто встречающееся значение.

Посмотрим, что насчитал нам статистический орган города N. Пресс-секретарь утверждает, что распределение по полу, возрасту, месту жительства и виду деятельности совпадает с общегородским, то есть опрос репрезентативен.

На горизонтальной оси отображается уровень зарплаты, который указал житель во время опроса, а на вертикальной — количество людей с указанными зарплатами

В нашем городе получились следующие показатели:

Средняя зарплата составила 60 у. е., однако такой зарплатой и выше могут похвастаться только 12 тысяч из 43 тысяч опрошенных, то есть около четверти населения N. Такое неравенство не может не вызывать удивления у жителей, и чем больше будет дисперсия по зарплатам в нашем городе, тем меньше энчане будут доверять значению средней зарплаты.

Посмотрим теперь на моду и медиану.

Медиана составит 40 у. е., а мода — 30 у. е. Мода — высокий пик на графике в 15 тысяч человек, примерно такого результата горожане и ожидают.

В моде практически каждый житель города узнает себя, своего знакомого или, по крайней мере, не удивится такому значению.

В нашем случае мода немного больше, но тоже не вызовет особого возмущения.

Каждая характеристика распределения позволяет что-то понять о распределении, однако даже все вместе они могут подводить. Например, модальное значение может быть совершенно случайным на малых выборках или если мы попробуем спрашивать о зарплате у людей с точностью до копейки. Тогда три человека с абсолютно одинаковой зарплатой могут иметь самое частое значение в выборке.

Читайте также:  Что подарить из дрожжевого теста

Другая ситуация — если у нас есть два равных пика. Например, в N не одно, а два градообразующих предприятия, причем одно из них в четыре раза успешнее другого. Мы получим вот такое распределение по зарплатам:

Здесь у нас получатся две моды: 30 и 120. Медиана будет 65, а средняя зарплата по городу будет 76. Полноценную картину может дать только общий набор данных.

Где и как мы можем применить эти знания в реальной жизни? Главным хранилищем «живых» данных в России является Госкомстат. Статистические показатели со всей страны собираются там и оседают на серверах ГКС. К сожалению, исходные данные по большинству вопросов не публикуют из соображений конфиденциальности, но что-то можно вытащить и оттуда. На gks.ru очень много разной статистики.

Кроме того, на сайтах ГСК, ВЦИОМа и прочих структур, которые связаны с оценкой и исследованием чего-либо в обществе, есть методологии, которым рассчитывается тот или иной показатель. Например, Франция при подсчете ВВП учитывает наличие собственного жилья у человека как его доход, что существенно повышает показатели.

Так что просто сравнивать ВВП, которые посчитаны по различным методологиям, тоже не лучшая затея.

C сайта ГКС можно скачать куб и базу данных. Пространство для игр с данными там просто безгранично.

Не стоит воспринимать контринтуитивную статистику как заведомый обман, но и доверять ей на все сто не надо. Статистика ради статистики — удел весьма своеобразных людей, вся остальная статистика собирается под конкретные запросы и задачи. Если же всплывают какие-нибудь данные, которые вызывают массовые бугурты, — возможно, эту информацию собирали не для общего пользования. Опять же, любые данные, которые вызвали у вас вопросы, можно проверить на адекватность, размер выборки и сохранение пропорций. Если отнестись к этому с чуть большим уважением и любопытством, можно открыть для себя огромный мир данных, из которых можно получать очень любопытные зависимости и последовательности.

Средняя зарплата в России — это когда 1 человек получает 2 миллиона, а 100 других по 8000р. Тогда в среднем они все получают по 27 000р. А теперь простым языком: — У Пети 10 яблок, а у Васи 0. В среднем у обоих по 5 яблок. — Чиновники едят мясо, я — капусту. В среднем мы едим голубцы. — Жена директора колхоза Глаша ебётся со всеми, а доярка Маша не дает никому, но в среднем они обе бляди.

Средняя для кого?

Kalipso8
• 11/03/13 14:51, #425412 Рейтинг: 4

Средняя зарплата в России-это,когда один человек получает 2.000.000,а 100 других по 8000 руб.Тогда в среднем они получают по 27000 рублей.А теперь простым языком:у Пети 10 яблок,а у Васи 0,в среднем у обоих по 5 яблок.Чиновники едят мясо,а я капусту,в среднем мы едим голубцы.Жена директора колхоза Глаша спит со всеми,а доярка Маша не даёт никому,но в среднем они обе бляди. Так и живём 🙁

buonapartik
• 11/03/13 15:02, #425414 Рейтинг: 0

Kalipso8 (2013-03-11 14:51) Средняя зарплата в России-это,когда один человек получает 2.000.000,а 100 других по 8000 руб.Тогда в среднем они получают по 27000 рублей.А теперь простым языком:у Пети 10 яблок,а у Васи 0,в среднем у обоих по 5 яблок.Чиновники едят мясо,а я капусту,в среднем мы едим голубцы.Жена директора колхоза Глаша спит со всеми,а доярка Маша не даёт никому,но в среднем они обе бляди. Так и живём 🙁

Подскажите, в чем вопрос?
Вам важна 100% верность стат.данных? Для этого необходимо, чтобы всех по уровню з/п поделили на слои, причем, сделали бы это достоверно, то есть, с предоставлением справок о доходах и пр. . Вы уверены, что нармассы это воспримут с восторгом?

Тимофей
• 11/03/13 15:17, #425419 Рейтинг: 3

При ЕБНе (либералах) не платили до полгода зарплату на предприятиях, а при Пу. (патриотах) ввели новый ТК РФ, теперь зарплату отобрали у работяг и перенаправили эффективным менеджерам. Если в СССР у нашего директора зарплата была выше основной рабочей в 4 раза, то теперь по-путински разница реальная в 12-15 раз, это без учета покупки за беспроцентную ссуду себе начальством пристижного жилья из средств предприятия в центре Москвы. Доход уже раз в 20 – 25 выше. По даче, по автомобилю. А у работяг отобрали: столовую, сверхурочные, дополнительный отпуск, детский сад, пионерлагерь, санаторное лечение, жилье от работы, материальную ответственность и ту, повесили на работяг всю. Поликлинику начальство себе организовали, дополнительный отпуск назначили, да еще премии два раза в месяц. Не ошибусь сильно, если предположу, что реальная разница в зарплате доходит до 40 раз – конкурсы и тендеры.

Читайте также:  Чернослив в сметане с грецкими орехами рецепт

Все видят это и если крякнется все, жалеть не быдут, а то еще и пинка поднададут.

Vovcike
• 11/03/13 16:19, #425424 Рейтинг: 0

Kalipso8 (2013-03-11 14:51) Средняя зарплата в России-это,когда один человек получает 2.000.000,а 100 других по 8000 руб.Тогда в среднем они получают по 27000 рублей.А теперь простым языком:у Пети 10 яблок,а у Васи 0,в среднем у обоих по 5 яблок.Чиновники едят мясо,а я капусту,в среднем мы едим голубцы.Жена директора колхоза Глаша спит со всеми,а доярка Маша не даёт никому,но в среднем они обе бляди. Так и живём 🙁

Не нужно поступать на работу, где вместо бублика дырку дают.

Тимофей
• 11/03/13 17:34, #425431 Рейтинг: 1

Vovcike (2013-03-11 16:19) Не нужно поступать на работу, где вместо бублика дырку дают.

А нет ни где нормальной работы, буржуи даже свой ТК соблюдать не хотят и не умеют, вон либерал главный Прохер, хочет 12 часов устроить, как до Ленина.

Не_ОНА
• 11/03/13 18:43, #425436 Рейтинг: 0

Тимофей (2013-03-11 17:34) . хочет 12 часов устроить, как до Ленина.

Великий театральный художник Тышлер, создавая эскизы декораций, в углу рисовал маленькую зеленую собачку. И когда кто–нибудь из приемной комиссии спрашивал: «Мне все нравится, но причем здесь эта собака?», художник со вздохом сожаления замазывал ее. На этом процесс обсуждения обычно заканчивался, работу принимали, оставляя у вопрошающего сладкий привкус плодотворной творческой дискуссии с маэстро. (с)

aventura
• 11/03/13 21:16, #425454 Рейтинг: 1

Vovcike (2013-03-11 16:19) Не нужно поступать на работу, где вместо бублика дырку дают.

а вы знаете такие места,где бублики вместо дырок дают? подскажите,с удовольствием приду туда работать.

насчет 12ти часового рабочего дня..может и интересная идея,но: 1.зарплата не вырастет 2.дети окажутся вовсе заброшены родителями,так как они будут постоянно на работе 3.никаких дополнительных льгот не появится 4.при 8ми часовом графике работы,все равно приходится отпрашиваться,чтобы попасть по личным делам (в ту же поликлинику,например),при 12ч – об этом можно забыть вовсе (либо день за свой счет,а это значит,что зарплату урежут).

Тимофей
• 05/04/13 00:27, #431268 Рейтинг: 0

Вот это похоже на правду.

сегодняшний прожиточный минимум в размере 6705 рублей

Нынешний состав потребительской корзины товаров и услуг, необходимых для сохранения здоровья человека и обеспечения его жизнедеятельности, по своей калорийности и питательной ценности не только уступает аналогам экономически развитых и развивающихся стран. По целому ряду компонентов он уступает даже пайку немецкого военнопленного в советских лагерях в 1942-1943гг.

По оценкам экс-главы НИИ Статистики Росстата Василия Симчеры, реальный разрыв в уровне доходов наиболее состоятельных россиян, встроившихся в паразитическую модель «экономики трубы», и тех, кому не досталось места на суверенном «нефтегазовом Титанике», достигает 80-100 раз. С таким диагнозом долго не живут – по оценкам ООН, при достижении децильным коэффициентом отметки в 10 раз начинается ускоренный рост социальной нестабильности и общественной напряжённости.

По оценкам независимых экспертов, а также Института Социологии РАН, реальный размер прожиточного минимума в России должен составлять от 11,5 до 15 тыс. рублей

Комментировать
0 просмотров
Комментариев нет, будьте первым кто его оставит

Это интересно
Adblock detector