|
|
|
|
|
|
Город, где проходит телефонный опрос, имеет очень разную застройку. Как это повлияет при простой случайной выборке номеров телефонов домохозяйств. |
|
Постов: 2128 Дата регистрации: 07.04.2005 |
Цитата, автор IgorRudy:
....Элементарно, Ватсон!
|
Холмс , мне немного не ловко, ну ладно, поиграем.
Охват города Интернетом 100% и всего 100 домов.
Пусть подряд (друг за другом) 10 домов имеют ШПД у остальных его нет: НОЛЬ. Аналог дельтообразного распределения.
Опросили 100 домохозяйств. Получили что :
У 90% доля ШПД=0% , а у 10% доля =100%
Среднее = 90%*0%+10%*100%=10%
Я здесь тыщу+1 раз писал, чтобы надежно (с точностью до статистической ошибки) идентифицировать признак, достаточно сформировать случайную выборку. Про ее величину я тут 100 + 1 формульное обоснование привел.
И помнится, ты тогда, не нашел мне ничего возразить. Поройся в архиве форума. Убедись ;) .
|
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
01.10.2008 23:45 | |
|
|
|
Маркетолог - международник Постов: 5658 Дата регистрации: 27.01.2007 |
для: Юрий Рязанов©
Мой пример при котором твой подход не работает совершенно другой.
Eсли в городе 10 000 домов, а звонков всего 1 000, то мы можем позвонить (А) всего лишь в 1000 домов, т.е. по одному звонку на дом, (Б) или в 100 домов, по 10 звонков в дом.
В случае (А): мы не можем определить средний % ШПД в доме.
В случае (Б) - мы можем посчитать % ШПД в доме, но тогда на всю "рублёвку" приходится лишь 10 звонков в 1 дом.
9 из 10 звонков дают "да" на наличие ШПД . Т.к. мы не знаем сколько домов "в рублёвке", то мы не можем умножить 9 на число домов "в рублёвке" что бы получить полное число ШПД в рублёвке.
Что мы делаем: складываем 9 положительных звонков в одном доме из "рублёвки" с 99 домами со средним 2 ШПД на дом. В итоге совокупное среднее получается: (9*1 + 2*99)/100 = 2,07 ШПД на 1 дом. И полное число ШПД в городе = 2,07 * 10 000 = 20 700.
В действительности же, 50% всех ШПД находится в "рублёвке" и при среднем числом ШПД в остальных домах = 2, совокупное среднее = 4, и полное число ШПД в городе = 4 * 10 000 = 40 000.
Т.е. твой метод случайной выборки даёт среднее число ШПД на дом = 2,07 и полное число ШПД в городе = 20 700 ; а действительное число ШПД на дом = 4 и полное число ШПД в городе = 40 000 ! Т.е. ошибка = 93,2%! |
|
-------- marketer marketiri lupus est ... |
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
02.10.2008 00:53 | |
|
|
|
Каждому своё Постов: 2464 Дата регистрации: 10.02.2007 |
для: IgorRudy© Плотность выборки была такова, что при 100% охвате квартир телефонами на 1 подъезд 17 этажного дома приходится 1 звонок. На 1 "хрущёвку" тоже 1 звонок. |
|
-------- О всемогуществе модераторов: "Вас уже банили, по всему форуму и навсегда. Будут банить и далее" (с) Page Up |
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
02.10.2008 12:04 | |
|
|
|
Постов: 2114 Дата регистрации: 01.09.2005 |
для: Странник©
Добрый день.
По данным на сегодня в городе чуть более 70% домохозяйств (квартиры, частные небольшие дома привел к домохозяйствам) имеют телефон. |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
02.10.2008 13:15 | |
|
|
|
Постов: 2128 Дата регистрации: 07.04.2005 |
70% - это из другой оперы. Это как стихийное бедствие, просто надо снять шляпу и смирится с безысходностью .
Эдуард, ты же «всю жизнь» решаешь для себя одну и туже задачу ;) :
Как влияет неравномерность признака по территории, на результат вычисления среднего, в условиях случайной выборки
Никак не влияет. Справедливость расчета среднего по квотам – может быть проверено только соответствующим расчетом на случайной выборке, как собственно и любого другого эмпирического метода не подкрепленного математическим аппаратом. В противном случае проверка среднего квот - может быть подтверждена только на сплошной выборке.
У случайной выборки – есть развитый мат.аппарат из первых принципов, у любой другой выборки – его нет.
|
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
02.10.2008 14:19 | |
|
|
|
Постов: 2128 Дата регистрации: 07.04.2005 |
Цитата, автор IgorRudy:
для: Юрий Рязанов©
Мой пример при котором твой подход не работает совершенно другой.
Eсли в городе 10 000 домов, а звонков всего 1 000, то мы можем позвонить (А) всего лишь в 1000 домов, т.е. по одному звонку на дом, (Б) или в 100 домов, по 10 звонков в дом.
..... |
Игорь, и чего ты прицепился к ДОМАМ!!! :) Нас интересует ШПД в квартире(домохозяйстве). Это принципиально!!!
Дома – это другая задача, и чуть- чуть другая выборка соответственно.
Если тебя интересует ШПД по домам, т.е. единица измерения ДОМ, а не отдельная квартира – то надо делать случайную выборку телефонов по домам. 1 дом -1 номер.
При большой выборке (изыски) можно разрешить вырождение номеров на 1 дом в соответствии его этажности(числу квартир).
В этом случае (когда по домам) – вполне разумно и по математическим соображениям в т.ч. считать что:
- наугад (случайно) выбранный телефонный номер 1 дома, будет отражать признак ШПД с вероятностью равной заполнению квартир дома ШПД.
|
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
02.10.2008 15:23 | |
|
|
|
Постов: 2114 Дата регистрации: 01.09.2005 |
для: Юрий Рязанов©
Добрый день.
После наших неоднократных обсуждений подобного, у меня остался один вопрос: "Каковы те аргументу, на которых зиждется общая уверенность, что для таких случаев стратифицированная случайная выборка много лучше простой случайной"? Я то унаследовал эту точку зрения от Михаила Самуиловича Косолапова http://www.ecsocman.edu.ru/db/msg/173136.html для меня в этом вопросе весьма авторитетного. К сожалению поспрашивать его у меня сейчас нет возможности. |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
02.10.2008 17:55 | |
|
|
|
Постов: 2128 Дата регистрации: 07.04.2005 |
Цитата, автор butaev:
для: Юрий Рязанов©
Добрый день.
После наших неоднократных обсуждений подобного, у меня остался один вопрос: "Каковы те аргументу, на которых зиждется общая уверенность, что для таких случаев стратифицированная случайная выборка много лучше простой случайной"? Я то унаследовал эту точку зрения от Михаила Самуиловича Косолапова http://www.ecsocman.edu.ru/db/msg/173136.html для меня в этом вопросе весьма авторитетного. К сожалению поспрашивать его у меня сейчас нет возможности.
|
Для исследований с широкой географией (и некоторых других задач) по соотношению цена/качество - ДА стратифицированная лучше. Она является подмножеством случайной по определению. В любом случае, критерий валидности всех прочих эмпирических методов сбора данных - является случайная выборка. Она - эталон метрики.
Другое дело, что очень часто ее не возможно реализовать по причинам технического характера. И очень часто исследования проводятся с квотированием. Просто доверие к такому методу сбора данных выше. Из-за разного рода смещений при формировании случайной выборки, очень часто связанной с минимизацией ее объема - квотный способ предпочтительней, он не дает смещений по определению.
|
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
02.10.2008 18:42 | |
|
|
|
Постов: 2114 Дата регистрации: 01.09.2005 |
для: Юрий Рязанов©
Квотная выборка при телефонном опросе добавляет свои проблемы. Те, о которых пишут и говорят, и те, что остаются вне широкого обсуждения. Ты их, уверен, не один раз обдумывал. И как пишет Д. М. Рогозин (я на его статьи ссылался выше в посте) они в плоскости работы/общения интервьюера. А эта материя у нас мало исследована, и плохо поддается осмыслению, как только вопросы интервью чуть сложенее элементарных. Кроме того квоты по соц. дем. в большинстве маркетинговых задач не применимы. Приходим к тем же задачам, что мы обсуждали при медиапланировании по соц. дем.параметрам. |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
02.10.2008 19:10 | |
|
|
|
Постов: 2128 Дата регистрации: 07.04.2005 |
для: butaev©
Будем считать, что вопрос «проговорили». Советчиков оказалось много – и это радует . Уважают мэтра ;)
Как твою задачу решал бы я.
1. Сгенерил бы с запасом на отказы ~2000 случайных телефонов, положил бы их в БД CATI.
2. В первом вопросе выяснил: в вашей семье кто либо пользуется Интернетом из дома
3. Если это Он/Она пользователь - уточнил бы об его осведомленности о способе подключения к сети.
4. Если респ в курсе дела – отметил способ подключения к сети
5. Если нет, попросил бы позвать к телефону того кто «вкурсе», если такого нет, досвидание и следующий звонок….
Время интервью 1-2 мин. Это исследование стоит копейки.
P.S. Можно расширить выборку до заполнения квот: 30-70 анкет на каждую АТС, для последующего анализа проникновения признака по "районам", точнее географии АТС.
|
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
02.10.2008 19:57 | |
|
|
|
Каждому своё Постов: 2464 Дата регистрации: 10.02.2007 |
Цитата, автор IgorRudy:
Мой пример при котором твой подход не работает совершенно другой. |
Игорь, давайте упростим задачу. Пусть все потребители широкополосного доступа, имеющие стационарный телефон, находятся в одном доме. Причём все жители дома пользуются таким доступом. Гетто такое программистское. Давайте рассмотрим и другой предельный вариант: они все рассеяны по городу равномерно. Если мы телефонные номера выбираем случайно и меряем лишь долю обзвоненных квартир с доступом, то в чём разница для статистики? |
|
-------- О всемогуществе модераторов: "Вас уже банили, по всему форуму и навсегда. Будут банить и далее" (с) Page Up |
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
02.10.2008 21:51 | |
|
|
|
Маркетолог - международник Постов: 5658 Дата регистрации: 27.01.2007 |
Цитата, автор Странник:
для: IgorRudy© Плотность выборки была такова, что при 100% охвате квартир телефонами на 1 подъезд 17 этажного дома приходится 1 звонок. На 1 "хрущёвку" тоже 1 звонок. |
Вот в этом и проблема! Даже без эффекта рублевки результат может быть ошибочен в разы!
Игорь, давайте упростим задачу. Пусть все потребители широкополосного доступа, имеющие стационарный телефон, находятся в одном доме. |
Хороший пример. В этом случае, если му обзваниваем 10% домов в городе (10 000 звонков), то есть вероятность 90%, что мы на этот дом не попадём и т.е. в городе окажется 0 ШПД. Если же даже 1 звонок попал в этот дом, то проникновение ДШП в городе Х = 1/10 000.
В действительности, в доме 100 квартир с ШПД при 100 000 квартир в городе, т.е. проникновение Y = 100/100 000 = 1/1000, что в 10 раз выше, чем Х (проникновение полученно при обзвоне).
Т.е. обзвон даёт ошибку в 1000%! |
|
-------- marketer marketiri lupus est ... |
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
02.10.2008 23:58 | |
|
|
|
Маркетолог - международник Постов: 5658 Дата регистрации: 27.01.2007 |
Цитата, автор Юрий Рязанов:Игорь, и чего ты прицепился к ДОМАМ!!! :) Нас интересует ШПД в квартире(домохозяйстве). Это принципиально!!! |
Юра, я лишь привёл пример, когда эффект рублёвки при равномерном обзвоне даёт ошибку до 100%.
Если обзваниваешь случайно по квартирам то получается следущее:
1.Обзвонили случайных 10 000 квартир. В 100 из них есть ШПД - значит проникновение ШПД = 1%.
10 квартир из случайных 10 000 находятся в рублёвке и во всех из них есть ШПД + в 90 квартирах вне рублёвки есть ШПД.
2.В действительности: если 50% всего ШПД города находится на рублёвке и среднее проникновение вне рублёвки = 0,9%, то проникновение во всём городе около 1,8%. Т.е. обзвон даёт 1% проникновения ШПД , а в действительности оно = 1,8% - ошибка почти 80%. |
|
-------- marketer marketiri lupus est ... |
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
03.10.2008 00:08 | |
|
|
|
Постов: 2128 Дата регистрации: 07.04.2005 |
Цитата, автор Странник:
Цитата, автор IgorRudy:
Мой пример при котором твой подход не работает совершенно другой. |
Игорь, давайте упростим задачу. Пусть все потребители широкополосного доступа, имеющие стационарный телефон, находятся в одном доме. Причём все жители дома пользуются таким доступом. Гетто такое программистское. Давайте рассмотрим и другой предельный вариант: они все рассеяны по городу равномерно. Если мы телефонные номера выбираем случайно и меряем лишь долю обзвоненных квартир с доступом, то в чём разница для статистики?
|
для: Странник©
Что самое удивительное, никакими примерами "их" не пронять. И что меня огорчает больше всего, таких простых вещей не понимают люди суперобразованием :(
Мне Эдуард в свое время пытался доказать на примере "морского боя" Чес слово, ну как маленькие дети. Самое смешное то, что я тоже постоянно сомневаюсь в своей правоте.
для: IgorRudy©
Игорь, не надо никаких примеров. Давай говорить на языке тервера. И заруби себе пжл. на носу простое правило случайного отбора:
Вероятность признака, у наугад выбранного респонента (телефона) = доле этого признака в ГС
И ничего ты с этим правилом не сможешь сотворить, НИЧЕГО!!! И далее без фантазий пжл. Ты просто обязан понять то что я написал
|
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
03.10.2008 00:47 | |
|
|
|
Маркетолог - международник Постов: 5658 Дата регистрации: 27.01.2007 |
для: Юрий Рязанов©
Цитата, автор Юрий Рязанов:Вероятность признака, у наугад выбранного респонента (телефона) = доле этого признака в ГС |
Проблема в том, что распределение телефонов не совпадает с распределением ШПД. Выборка для обзвона выбирается из распределения телефонов, и используется для оценки ШПД, которые распределeны по другому.
Юра, твоя формула будет работать только для определения числа телефонов в городе, но не для числа ШПД.
Другой вопрос: чем тебе не понравились мои примеры? - они же доказывают ущербность случайного выбора телефонов для определения ШПД!
В чём моя ошибка в данных примерах? |
|
-------- marketer marketiri lupus est ... |
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
03.10.2008 00:55 | |
|
|
|
Постов: 2128 Дата регистрации: 07.04.2005 |
для: IgorRudy©
Игорь, читаю в твоих словах ростки сомнения... ;)
Формула увы не моя. Если бы ее не было, не было бы и дорогих нашему сердцу Гауссов, Пуассонов и т.д. и т.д..
И последнее, не стоит переводить стрелки на ущербность случайной телефонной выборки в сравнении с собственно идеальной случайной.
Свои ошибки ты найдешь сам. Я в этом уверен. ;)
|
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
03.10.2008 01:11 | |
|
|
|
Маркетолог - международник Постов: 5658 Дата регистрации: 27.01.2007 |
Цитата, автор Юрий Рязанов:Свои ошибки ты найдешь сам. Я в этом уверен. ;)
|
Так нет ошибок в тех примерах. я их специально выбирал так, что бы показать, что случайная выборка даёт ошибку в несколько раз ... |
|
-------- marketer marketiri lupus est ... |
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
03.10.2008 01:38 | |
|
|
|
Постов: 2128 Дата регистрации: 07.04.2005 |
Цитата, автор IgorRudy:
Цитата, автор Юрий Рязанов:Свои ошибки ты найдешь сам. Я в этом уверен. ;)
|
Так нет ошибок в тех примерах. я их специально выбирал так, что бы показать, что случайная выборка даёт ошибку в несколько раз ...
|
Ок. Объясняю.
Возьмем 100 шаров в урне. Покрасим 10 из них Черным. Пусть черный указывают нам признак - есть ШПД.
Теперь, ты берешь эти 10 черных шаров и кладешь "на самое дно самого глубокого ущелья (c)» урны. Этим самым ты создаешь территориальную неравномерность признака в массиве шаров (урне).
Очевидно, на дне урны - доля признака будет 100%, на поверхности 0%
Включаем перемешивание. И о чудо!
Вероятность того, что взятый тобой наугад первый попавшиеся шар будет равна доле признака в ГС : 10/100=10%
Перемешивание – есть процесс создания условия случайного отбора. С телефонной выборкой – полная аналогия.
Согласен?
|
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
03.10.2008 02:28 | |
|
|
|
Каждому своё Постов: 2464 Дата регистрации: 10.02.2007 |
Цитата, автор IgorRudy:
Проблема в том, что распределение телефонов не совпадает с распределением ШПД. Выборка для обзвона выбирается из распределения телефонов, и используется для оценки ШПД, которые распределeны по другому. |
А если не делать больше никаких предположений для оценки ШПД? Только отношение обзвоненных квартир с ответами, что там есть ШПД, к квартирам с ответами, что там нет ШПД?
P.S. Игорь, нам ведь для оценки не нужен такой параметр, как % ШПД в доме ;) |
|
-------- О всемогуществе модераторов: "Вас уже банили, по всему форуму и навсегда. Будут банить и далее" (с) Page Up |
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
03.10.2008 11:31 | |
|
|
|
Маркетолог - международник Постов: 5658 Дата регистрации: 27.01.2007 |
Цитата, автор Юрий Рязанов:Возьмем 100 шаров в урне. Покрасим 10 из них Черным. Пусть черный указывают нам признак - есть ШПД.
Теперь, ты берешь эти 10 черных шаров и кладешь "на самое дно самого глубокого ущелья (c)» урны. Этим самым ты создаешь территориальную неравномерность признака в массиве шаров (урне).
Очевидно, на дне урны - доля признака будет 100%, на поверхности 0%
Включаем перемешивание. И о чудо!
Вероятность того, что взятый тобой наугад первый попавшиеся шар будет равна доле признака в ГС : 10/100=10%
Перемешивание – есть процесс создания условия случайного отбора. С телефонной выборкой – полная аналогия.
Согласен?
|
К сожалению, распределение ШПД по городу не случайно и не гауссово, и там нельзя включить перемешивание.
В твоём примере (позволь мне его немного изменить, т.к. ты почему-то рассматриваешь все "хорошие" случаи и не рассматриваешь аномальные) 100 шаров - 20 чёрных, 80 белых: берёшь 20 чёрных шаров и прячешь их в другую урну. Случайным образом выбираешь 9 шаров из 1-ой урны (где все белые) и 1 шар из 2-ой урны (где все чёрные) (т.к. apriori ты не знаешь сколько чёрных во второй урне). В результате, в твоей выборке 1 шар чёрный и 9 белых - т.е. ты думаешь, что всего 10% шаров чёрные - на самом деле, их 20% и ты ошибся в 2 раза!
|
|
-------- marketer marketiri lupus est ... |
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
03.10.2008 19:30 | |
|
|
|
| Только зарегистрированные пользователи могут оставлять сообщения в этом форуме |
|
|
|
|
|
© "ООО Состав.ру" 1998-2024
тел/факс: +7 495 225 1331 адрес: 109004, Москва, Пестовский пер., д. 16, стр. 2
При использовании материалов портала ссылка на Sostav.ru обязательна! Администрация Sostav.ru просит Вас сообщать о всех замеченных технических неполадках на E-mail
|
|
|