|
|
|
|
|
|
Город, где проходит телефонный опрос, имеет очень разную застройку. Как это повлияет при простой случайной выборке номеров телефонов домохозяйств. |
|
Постов: 2114 Дата регистрации: 01.09.2005 |
для: Юрий Рязанов©
Добрый вечер.
Улыбнемся в пятницу!
Вместо 2000 предложил 3000. С обязательной проверкой совпадения таких-то величин по блокам по 500 взятых интервью (сказалось вредное влияние многолетнего общения с Михаилом).
Подошел еще осторожнее. Рекомендовал сначала спросить есть ли в домохозяйстве компьютер, а далее приблизительно, как у тебя. Детали опустим. Поднимаю данные, какое было в Москве в 2000 – 2007 году соотношение имеющих компьютер дома и имеющих доступ в Интернет дома, ШПД доступ.
У Вас в городе как относится процент имеющих компьютер дома и имеющих доступ в Интернет дома? Встречались надежные/полунадежные данные по Екатеринбургу? |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
03.10.2008 19:47 | |
|
|
|
Маркетолог - международник Постов: 5658 Дата регистрации: 27.01.2007 |
Цитата, автор Странник:А если не делать больше никаких предположений для оценки ШПД? Только отношение обзвоненных квартир с ответами, что там есть ШПД, к квартирам с ответами, что там нет ШПД? |
Тогда ошибка будет ещё выше. В твоём примере, для города, где все ШПД находятся в пункте "А" (доме, части города, районе, и т.д.) и на каждый телефон в пункте А приходится 1 ШПД:
В городе 100 000 телефонов, обзваниваем 1 000 из них (1%). В пункте А всего 100 телефонов, т.е. на него попадает 1 звонок (1%) или 0 звонков (не берут трубку - заняты на ШПД - тогда мы заключаем, что в городе совсем нет ШПД) или 2 звонка.
В случае, если в пункт А случайно попадают 2 звонка, проникновение = 2/1000 = 0,2%.
В действиительности, в пункте А 100 ШПД, и проникновение должно быть равно = 100/100 000 = 0,1%.
Ошибка опять в 2 раза! |
|
-------- marketer marketiri lupus est ... |
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
03.10.2008 19:47 | |
|
|
|
Постов: 2128 Дата регистрации: 07.04.2005 |
Цитата, автор butaev:
для: Юрий Рязанов©
.....
Вместо 2000 предложил 3000....
|
Я писал про 2000 случайных телефонов в БД CATI в прок. У тебя будет 50-60% отказов, вот в сухом остатке ~1000 потенциальный интервью. А уж сколько захочешь - 500 или 1000 анкет дело хозяйское.
У Вас в городе как относится процент имеющих компьютер дома и имеющих доступ в Интернет дома? Встречались надежные/полунадежные данные по Екатеринбургу?
|
Я никогда не исследовал эту тему. Рад бы помочь, увы.
|
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
03.10.2008 21:02 | |
|
|
|
Каждому своё Постов: 2464 Дата регистрации: 10.02.2007 |
Цитата, автор IgorRudy:
В городе 100 000 телефонов, обзваниваем 1 000 из них (1%). В пункте А всего 100 телефонов, т.е. на него попадает 1 звонок (1%) или 0 звонков (не берут трубку - заняты на ШПД - тогда мы заключаем, что в городе совсем нет ШПД) или 2 звонка.
В случае, если в пункт А случайно попадают 2 звонка, проникновение = 2/1000 = 0,2%.
В действиительности, в пункте А 100 ШПД, и проникновение должно быть равно = 100/100 000 = 0,1%.
Ошибка опять в 2 раза! |
Ошибка для А или для всего города? Для пункта А погрешность равна 1/sqrt(1)*100% = 100% - так что всё нормально. Но мы же меряем не для пункта А, а для всего города!
P.S. Кстати, если при 1000 звонках мы получили до 7% жителей с широкополосным доступом то, как я прочитал в лекциях по медиапланированию у Балабанова, этой цифре доверять в принципе нельзя. |
|
-------- О всемогуществе модераторов: "Вас уже банили, по всему форуму и навсегда. Будут банить и далее" (с) Page Up |
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
03.10.2008 21:39 | |
|
|
|
Маркетолог - международник Постов: 5658 Дата регистрации: 27.01.2007 |
Цитата, автор Странник:
Цитата, автор IgorRudy:
В городе 100 000 телефонов, обзваниваем 1 000 из них (1%). В пункте А всего 100 телефонов, т.е. на него попадает 1 звонок (1%) или 0 звонков (не берут трубку - заняты на ШПД - тогда мы заключаем, что в городе совсем нет ШПД) или 2 звонка.
В случае, если в пункт А случайно попадают 2 звонка, проникновение = 2/1000 = 0,2%.
В действиительности, в пункте А 100 ШПД, и проникновение должно быть равно = 100/100 000 = 0,1%.
Ошибка опять в 2 раза! |
Ошибка для А или для всего города? Для пункта А погрешность равна 1/sqrt(1)*100% = 100% - так что всё нормально. Но мы же меряем не для пункта А, а для всего города! |
Для всего города. В действительности проникновение ШПД в городе 0,1%, а обзвон даёт 0,2% - т.е. ошибка 100%.
Всё зависит, сколько случайных звонков попадёт в пункt А. Если 3, то ошибка по всему городу будет 200%. Если 4, то 300%. |
|
-------- marketer marketiri lupus est ... |
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
03.10.2008 21:44 | |
|
|
|
Каждому своё Постов: 2464 Дата регистрации: 10.02.2007 |
Цитата, автор IgorRudy:
Для всего города. В действительности проникновение ШПД в городе 0,1%, а обзвон даёт 0,2% - т.е. ошибка 100%. |
А какова статистическая погрешность для 1000 звонков? 30 звонков! А в Вашем примере всего-то на пару звонков ошиблись. Бывает. |
|
-------- О всемогуществе модераторов: "Вас уже банили, по всему форуму и навсегда. Будут банить и далее" (с) Page Up |
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
03.10.2008 22:47 | |
|
|
|
Маркетолог - международник Постов: 5658 Дата регистрации: 27.01.2007 |
Цитата, автор Странник:
Цитата, автор IgorRudy:
Для всего города. В действительности проникновение ШПД в городе 0,1%, а обзвон даёт 0,2% - т.е. ошибка 100%. |
А какова статистическая погрешность для 1000 звонков? 30 звонков! А в Вашем примере всего-то на пару звонков ошиблись. Бывает. |
Так в этом и весь прикол - вместо 1-ого звонка, сделали 2 (а как иначе, мы же не знаем, где эта аномалия находится, могли и 3 и 4 раза туда позвонить) - в результате, проникновение завышено в несколько раз.
Возможен и обратный процесс - когда в аномалию звоним реже, чем в среднем (например там телефон не берут или заняты бизнесом) - в результате проникновение получается заниженым в несколько раз ...
Самое обидное, что стандартная теория ошибок, данные случаи из жизни не покрывает ...
У меня был такой случай: клиент потратил пол миллиона $ на ад-хок исследование поведения врачей, которых они не таргетят (non-target physicians), исследование утверждает, что non-target врачи ничем не отличаются от target врачей - т.е. лечат в среднем то же число пациентов, даже иногда больше. Отдел продаж (пара тысяч человек) стоял на ушах - получается, что они таргетят не тех врачей!
Стали разбираться в чём проблема. Оказалось - в своём исследовании они звонили/приходили в оффис к врачам с бOльшим числом пациентов в 2-3 раза чаше чем к врачам, с меньшим числом пациентов. В результате, получилось, что в среднем врач лечит 20-30 пациентов с данной болезнью, а на самом деле, учитывая врачей, которые лечат одного пациента с данной болезнью, среднее должно было быть около 3 пациентов! Т.е. ошибка была в 10 раз как раз из-за неравномерного распределения врачей. |
|
-------- marketer marketiri lupus est ... |
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
03.10.2008 23:24 | |
|
|
|
Каждому своё Постов: 2464 Дата регистрации: 10.02.2007 |
Цитата, автор IgorRudy:
Самое обидное, что стандартная теория ошибок, данные случаи из жизни не покрывает ... |
Стандартной теории ошибок, как и стандартной теории вероятности, абсолютно всё равно, как в реальности распределены квартиры. Ну абсолютно всё равно. Там нигде в условиях применимости не оговаривается тип реального распределения квартир. |
|
-------- О всемогуществе модераторов: "Вас уже банили, по всему форуму и навсегда. Будут банить и далее" (с) Page Up |
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
03.10.2008 23:29 | |
|
|
|
Маркетолог - международник Постов: 5658 Дата регистрации: 27.01.2007 |
Цитата, автор Странник:Стандартной теории ошибок, как и стандартной теории вероятности, абсолютно всё равно, как в реальности распределены квартиры. Ну абсолютно всё равно. Там нигде в условиях применимости не оговаривается тип реального распределения квартир. |
При чём здесь квартиры. Мы говорили о 2-ух распределениях - телефонов и ШПД. Если данные распределения не совпадают, то нельзя использовать телефонные опросы для определения ШПД. |
|
-------- marketer marketiri lupus est ... |
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
03.10.2008 23:33 | |
|
|
|
Постов: 2128 Дата регистрации: 07.04.2005 |
Цитата, автор IgorRudy:
К сожалению, распределение ШПД по городу не случайно и не гауссово, и там нельзя включить перемешивание.…..
Цитата, автор IgorRudy:
При чём здесь квартиры. Мы говорили о 2-ух распределениях - телефонов и ШПД. Если данные распределения не совпадают, то нельзя использовать телефонные опросы для определения ШПД.
|
Игорь, не только ШПД, абсолютно все признаки: доход, образование, возраст, потребительские предпочтения и т.д. и т.д. распределены по территории в общем случае не монотонно. И Гаусс тут абсолютно не причем. Он не отвечает за корь и коклюш :) .
Гаусс дает нам право:
1. Использовать в качестве среднего - простое среднеарифметическое
2. Вычислять ошибку среднего
И вот этими двумя удовольствиями мы абсолютно законно, имеем право пользоваться, если при построении выборки реализован принцип случайного отбора - равновероятность респа быть отобранным.
Общее замечание:
А по большому счету, нам вообще "плевать на Гаусса" ;) . Результаты вычислений на основе предположения о гауссовском распределении, на самом деле слабо зависят от его точного вида. Главное что бы распределение:
- было приемлемой формы
- позволяло легко проводить вычисления
Экспериментаторы верят в гаусса – полагаясь на математиков
Математики – полагаются на экспериментально обоснование
Замкнутый круг!
Но мы пользовались и будем пользоваться Гауссом. Это красивый закон. А все что красиво – правильно.
|
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
04.10.2008 01:33 | |
|
|
|
Постов: 2114 Дата регистрации: 01.09.2005 |
для: Юрий Рязанов©
Доброй ночи.
По моему мнению ты несколько упрощаешь задачу. А потом почему ты Гауссу приписываешь заслуги Пафнутия Львовича Чебышева. Я его большой поклонник. Как известно он антиначетчик в N-ой степени. За жизнь прочел всего 2-е книги по математике (два тома учебника по мат. анализу) и все. Остальное головой да ручками. Ну, это так, в шутку. И одновременно всерьез.
Вычислять среднее арифметическое нам позволяет чебышевский Закон больших чисел. И чем мы дальше от больших чисел (ты понимаешь о чем идет речь и для тебя я понятие "большие" расшифровывать не буду) тем больше риск не репрезентативности наших результатов выборочных исследований. Из практики социологов известно, что если в любой категории, которую мы так или иначе используем в своих рассуждениях, менее 70 ее представителей, давших нам интервью, о репрезентативности говорить не прилично. (Отсюда 7% Балабанова-Странника. Кто это из социологов-методологов задолго до них предложил и обосновал, не помню).
И когда мы мысленно простраиваем свое исследование, у нас должно появиться ограничение на минимум взятых интервью. Если проникновение по микрорайонам частной застройки предположительно 10%, а их доля в городе 20% получаем 3500 взятых интервью.
Дорого и долго. Поэтому упрощаем задачу, объединяя две (N) разные категории в одну. Говоря, о средней по городу без деталей (т. е. считаем, что неравномерности нет), федеральному округу и т. д. На самом деле грешим против истины. Спасает ли стратифицированная случайная вот вопрос?
|
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
04.10.2008 02:34 | |
|
|
|
Постов: 2 Дата регистрации: 06.10.2008 |
Имею честь заявиться как один из тех самых приятелей достойнешего Модератора, что практически пытается решить описанную задачу, имея жесточайшие ограничения по времени. Эдуарду спасибище! Всем обсуждавшим - спасибо тож, надеюсь на возможность помочь при случае советом или данными.
По факту: случайная выборка для телефонного опроса дала весьма адекватное распределение по типам застройки (у респондентов спрашивали этажность их дома). Остановились на 1,5%, но получили возможность проверить "в поле" (по квартирам). Если оценки телефонника будут "очень юлизки" к результатам трехдневного "поля" - будем считать, что полученные ориентиры рабочие! |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
06.10.2008 01:11 | |
|
|
|
маркетолог Постов: 1945 Дата регистрации: 30.03.2004 |
для: Papa_Voevoda©
так, а почему этажность-то? :)
а у нас есть карта пожарных, там этажность и кол-во подъездов в каждом доме показаны, а вот года постройки нет, к сожалению :) |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
06.10.2008 08:10 | |
|
|
|
Постов: 2128 Дата регистрации: 07.04.2005 |
для: butaev©
Эдуард, похоже ты искренен в своем упрямстве. Игорь же, в упрямстве в квадрате. Искренне сожалею, что мои аргументы на вас так и не подействовали. http://www.forumsostav.ru/12/24161/1/ Другой аргументации у меня нет.
И конечно это не конец света ;).
|
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
06.10.2008 19:21 | |
|
|
|
Маркетолог - международник Постов: 5658 Дата регистрации: 27.01.2007 |
Цитата, автор Юрий Рязанов:Игорь, не только ШПД, абсолютно все признаки: доход, образование, возраст, потребительские предпочтения и т.д. и т.д. распределены по территории в общем случае не монотонно. |
В случае дохода, образования, возраста, потребительских предпочтений - распределения данных величин близки к распределению телефонов среди населения - поэтому можно использовать обзвон для получения репрезентативной выборки.
В случае же интернета - может оказаться сложнее.
Например. Будете ли вы использовать интернет-опрос для сбора информации о распределении населения города по возрасту? Конечно же нет! т.к. распределение интернета среди населения не совпадает с распределением населения по возрасту (больше молодёжи использует интернет).
Такая же проблема и с телефонами и ШПД. Можно ли использовать телефонные опросы для определения распределения ШПД? Если мы знаем, что распределения телефонов и ШПД близки - то можно, иначе - опасно. |
|
-------- marketer marketiri lupus est ... |
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
06.10.2008 22:52 | |
|
|
|
Маркетолог - международник Постов: 5658 Дата регистрации: 27.01.2007 |
для: Papa_Voevoda©
Цитата, автор Papa_Voevoda:Остановились на 1,5%, но получили возможность проверить "в поле" (по квартирам). Если оценки телефонника будут "очень юлизки" к результатам трехдневного "поля" - будем считать, что полученные ориентиры рабочие! |
Очень хороший подход по проверке телефонников! А как вы планируете выбирать квартиры для поля? |
|
-------- marketer marketiri lupus est ... |
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
06.10.2008 22:54 | |
|
|
|
Постов: 2128 Дата регистрации: 07.04.2005 |
Цитата, автор IgorRudy:
....Такая же проблема и с телефонами и ШПД. Можно ли использовать телефонные опросы для определения распределения ШПД? Если мы знаем, что распределения телефонов и ШПД близки - то можно, иначе - опасно.
|
Это просто праздник какой-то!!!
Попробую еще разок на Муж. и Жен.
Соберем в ГС 10 000 человек с мобильниками. Пусть мы заранее не знаем какова в ГС доля мужчин и женщин.
Моя Задача: Найти долю муж.
Игорь, вы возьмете всех женщин, сколько бы их не было, и увезете их к себе в Чикаго . Поселите их на самом высоком небоскребе.
А Эдуард, всех мужчин спрячет на Рублевке в бесплатном лесу .
Неравномерность признака муж и жен. по территории более чем обеспечена .
Я возьму все номера их мобильных телефонов и тщательно перемешаю... А где находятся абоненты плевать .
Мне остаются решить, какой величины взять выборку? По сути, решить с какой погрешностью меня устроит результат.
Для этого я должен сделать предположение относительно доли признака в ГС. Буду исходить с худшего. Пусть мужиков будет минимум a=1% (100 чел.).
Согласно приведенном мной здесь формуле (см. ссылку в моем посте выше)
na=4.3 - для (95%) и n>100; тогда ф-ла ошибки D=+-1.96(a(1-а)/n)^0.5 (1)
Т.о. я должен взять минимум n=4.3/1%=430 случайных телефонов, что бы с погрешностью D=+-1.96(a(1-a)/n)^0.5 получить долю мужчин в ГС.
Положим мой опрос из 430 случайный интервью дал мне а=50%, тогда с ошибкой запишем результат:
Доля мужчин: a = 50%+-(4.7%)
END
Теперь по ШПД. Рискну предположить, что на Украине в городе Х минимум 25% проникновение интернета среди ГС12+. Снова предположу, что с подключением ШПД не менее 10% из этих 25%. Получаем, что минимальная доля признака ШПД по ГС12+ a=10%*25%=2.5%
Учитывая, что мой мин. прогноз доли признака а=2,5%, а в самом первом посте Эдуард пожелал иметь точность +-20%, получаем что нам нужна величина выборки (n) которая бы обеспечивала нам D=2,5%*20%=+-0,5%
Из формулы (1) найдем n = 3.84*a(1-a)/D^2=3700 анкет
В рамках принятой гипотезы о минимальности признака в 2,5% от ГС12+ надо случайным образом опросить 3700 домохозяйств.
И глубоко по барабану какова неравномерность заполнения ШПД в городе. Выборка случайная.
|
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
07.10.2008 01:02 | |
|
|
|
Маркетолог - международник Постов: 5658 Дата регистрации: 27.01.2007 |
Цитата, автор Юрий Рязанов:И глубоко по барабану какова неравномерность заполнения ШПД в городе. Выборка случайная.
|
Т.е. можно проводить опрос по интернету для того что бы узнать какой % населения использует интернет, или какой средний возраст населения или каков средний доход?
Выборка же случайная. |
|
-------- marketer marketiri lupus est ... |
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
07.10.2008 02:08 | |
|
|
|
Постов: 2128 Дата регистрации: 07.04.2005 |
Цитата, автор IgorRudy:
Т.е. можно проводить опрос по интернету для того что бы узнать какой % населения использует интернет, или какой средний возраст населения или каков средний доход?
Выборка же случайная.
|
Игорь, ты из бронепоезда то потихоньку вылазь, ага.... Мы здесь говорим о случайной выборке по ГС. В задаче: ГС – это домохозяйства. У домохозяйств есть ЧТО? Правильно телефон!
Вывод: делаем случайную выборку домашних телефонов. По умолчанию принимаем, что телефонизация в ~70% репрезентует ГС (см. мой пост выше "про стихийное бедствие").
Причем здесь опрос по интернету! Ну причем? ??? ??? ???
|
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
07.10.2008 02:27 | |
|
|
|
Маркетолог - международник Постов: 5658 Дата регистрации: 27.01.2007 |
Цитата, автор Юрий Рязанов:Причем здесь опрос по интернету! Ну причем? ??? ??? ???
|
Юра, просто для аналогии: интернет <--> телефон, ШПД <--> возраст старше 60.
Распределение пользователей по интернету отличается от распределения пользователей по возрасту так же как распределение телефонов отличается от распределения ШПД.
Раз нельзя использовать интернет для определения % старше 60, то так же опасно использовать телефон для определения % ШПД. |
|
-------- marketer marketiri lupus est ... |
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
07.10.2008 21:40 | |
|
|
|
| Только зарегистрированные пользователи могут оставлять сообщения в этом форуме |
|
|
|
|
|
© "ООО Состав.ру" 1998-2024
тел/факс: +7 495 225 1331 адрес: 109004, Москва, Пестовский пер., д. 16, стр. 2
При использовании материалов портала ссылка на Sostav.ru обязательна! Администрация Sostav.ru просит Вас сообщать о всех замеченных технических неполадках на E-mail
|
|
|