Слово и фраза: Искать: Сортировать по:
Форумы на Sostav.ru / Маркетинговые исследования / Ошибки и смещения, получаемые при телефонном опросе домохозяйств.
Город, где проходит телефонный опрос, имеет очень разную застройку. Как это повлияет при простой случайной выборке номеров телефонов домохозяйств.
< 1 2 3 4 5 >

Profile
Юрий Рязанов©

Постов: 2128
Дата регистрации: 07.04.2005

Цитата, автор IgorRudy:
....Элементарно, Ватсон!


Холмс , мне немного не ловко, ну ладно, поиграем.

Охват города Интернетом 100% и всего 100 домов.

Пусть подряд (друг за другом) 10 домов имеют ШПД у остальных его нет: НОЛЬ. Аналог дельтообразного распределения.

Опросили 100 домохозяйств. Получили что :

У 90% доля ШПД=0% , а у 10% доля =100%

Среднее = 90%*0%+10%*100%=10%

Я здесь тыщу+1 раз писал, чтобы надежно (с точностью до статистической ошибки) идентифицировать признак, достаточно сформировать случайную выборку. Про ее величину я тут 100 + 1 формульное обоснование привел.

И помнится, ты тогда, не нашел мне ничего возразить. Поройся в архиве форума. Убедись ;) .

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 01.10.2008 23:45
цитата
Profile
IR©
Маркетолог - международник
Постов: 5658
Дата регистрации: 27.01.2007
для: Юрий Рязанов©
Мой пример при котором твой подход не работает совершенно другой.
Eсли в городе 10 000 домов, а звонков всего 1 000, то мы можем позвонить (А) всего лишь в 1000 домов, т.е. по одному звонку на дом, (Б) или в 100 домов, по 10 звонков в дом.
В случае (А): мы не можем определить средний % ШПД в доме.

В случае (Б) - мы можем посчитать % ШПД в доме, но тогда на всю "рублёвку" приходится лишь 10 звонков в 1 дом.
9 из 10 звонков дают "да" на наличие ШПД . Т.к. мы не знаем сколько домов "в рублёвке", то мы не можем умножить 9 на число домов "в рублёвке" что бы получить полное число ШПД в рублёвке.
Что мы делаем: складываем 9 положительных звонков в одном доме из "рублёвки" с 99 домами со средним 2 ШПД на дом. В итоге совокупное среднее получается: (9*1 + 2*99)/100 = 2,07 ШПД на 1 дом. И полное число ШПД в городе = 2,07 * 10 000 = 20 700.

В действительности же, 50% всех ШПД находится в "рублёвке" и при среднем числом ШПД в остальных домах = 2, совокупное среднее = 4, и полное число ШПД в городе = 4 * 10 000 = 40 000.

Т.е. твой метод случайной выборки даёт среднее число ШПД на дом = 2,07 и полное число ШПД в городе = 20 700 ; а действительное число ШПД на дом = 4 и полное число ШПД в городе = 40 000 ! Т.е. ошибка = 93,2%!
--------
marketer marketiri lupus est ...

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 02.10.2008 00:53
цитата
Profile
Странник©
Каждому своё
Постов: 2464
Дата регистрации: 10.02.2007
для: IgorRudy© Плотность выборки была такова, что при 100% охвате квартир телефонами на 1 подъезд 17 этажного дома приходится 1 звонок. На 1 "хрущёвку" тоже 1 звонок.
--------
О всемогуществе модераторов: "Вас уже банили, по всему форуму и навсегда. Будут банить и далее" (с) Page Up

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 02.10.2008 12:04
цитата
Profile
butaev©

Постов: 2114
Дата регистрации: 01.09.2005
для: Странник©
Добрый день.
По данным на сегодня в городе чуть более 70% домохозяйств (квартиры, частные небольшие дома привел к домохозяйствам) имеют телефон.

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 02.10.2008 13:15
цитата
Profile
Юрий Рязанов©

Постов: 2128
Дата регистрации: 07.04.2005
70% - это из другой оперы. Это как стихийное бедствие, просто надо снять шляпу и смирится с безысходностью .

Эдуард, ты же «всю жизнь» решаешь для себя одну и туже задачу ;) :

Как влияет неравномерность признака по территории, на результат вычисления среднего, в условиях случайной выборки

Никак не влияет. Справедливость расчета среднего по квотам – может быть проверено только соответствующим расчетом на случайной выборке, как собственно и любого другого эмпирического метода не подкрепленного математическим аппаратом. В противном случае проверка среднего квот - может быть подтверждена только на сплошной выборке.
У случайной выборки – есть развитый мат.аппарат из первых принципов, у любой другой выборки – его нет.

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 02.10.2008 14:19
цитата
Profile
Юрий Рязанов©

Постов: 2128
Дата регистрации: 07.04.2005

Цитата, автор IgorRudy:
для: Юрий Рязанов©
Мой пример при котором твой подход не работает совершенно другой.
Eсли в городе 10 000 домов, а звонков всего 1 000, то мы можем позвонить (А) всего лишь в 1000 домов, т.е. по одному звонку на дом, (Б) или в 100 домов, по 10 звонков в дом.
.....



Игорь, и чего ты прицепился к ДОМАМ!!! :) Нас интересует ШПД в квартире(домохозяйстве). Это принципиально!!!

Дома – это другая задача, и чуть- чуть другая выборка соответственно.

Если тебя интересует ШПД по домам, т.е. единица измерения ДОМ, а не отдельная квартира – то надо делать случайную выборку телефонов по домам. 1 дом -1 номер.
При большой выборке (изыски) можно разрешить вырождение номеров на 1 дом в соответствии его этажности(числу квартир).

В этом случае (когда по домам) – вполне разумно и по математическим соображениям в т.ч. считать что:
- наугад (случайно) выбранный телефонный номер 1 дома, будет отражать признак ШПД с вероятностью равной заполнению квартир дома ШПД.

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 02.10.2008 15:23
цитата
Profile
butaev©

Постов: 2114
Дата регистрации: 01.09.2005
для: Юрий Рязанов©
Добрый день.
После наших неоднократных обсуждений подобного, у меня остался один вопрос: "Каковы те аргументу, на которых зиждется общая уверенность, что для таких случаев стратифицированная случайная выборка много лучше простой случайной"? Я то унаследовал эту точку зрения от Михаила Самуиловича Косолапова http://www.ecsocman.edu.ru/db/msg/173136.html для меня в этом вопросе весьма авторитетного. К сожалению поспрашивать его у меня сейчас нет возможности.

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 02.10.2008 17:55
цитата
Profile
Юрий Рязанов©

Постов: 2128
Дата регистрации: 07.04.2005

Цитата, автор butaev:
для: Юрий Рязанов©
Добрый день.
После наших неоднократных обсуждений подобного, у меня остался один вопрос: "Каковы те аргументу, на которых зиждется общая уверенность, что для таких случаев стратифицированная случайная выборка много лучше простой случайной"? Я то унаследовал эту точку зрения от Михаила Самуиловича Косолапова http://www.ecsocman.edu.ru/db/msg/173136.html для меня в этом вопросе весьма авторитетного. К сожалению поспрашивать его у меня сейчас нет возможности.


Для исследований с широкой географией (и некоторых других задач) по соотношению цена/качество - ДА стратифицированная лучше. Она является подмножеством случайной по определению. В любом случае, критерий валидности всех прочих эмпирических методов сбора данных - является случайная выборка. Она - эталон метрики.
Другое дело, что очень часто ее не возможно реализовать по причинам технического характера. И очень часто исследования проводятся с квотированием. Просто доверие к такому методу сбора данных выше. Из-за разного рода смещений при формировании случайной выборки, очень часто связанной с минимизацией ее объема - квотный способ предпочтительней, он не дает смещений по определению.


Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 02.10.2008 18:42
цитата
Profile
butaev©

Постов: 2114
Дата регистрации: 01.09.2005
для: Юрий Рязанов©
Квотная выборка при телефонном опросе добавляет свои проблемы. Те, о которых пишут и говорят, и те, что остаются вне широкого обсуждения. Ты их, уверен, не один раз обдумывал. И как пишет Д. М. Рогозин (я на его статьи ссылался выше в посте) они в плоскости работы/общения интервьюера. А эта материя у нас мало исследована, и плохо поддается осмыслению, как только вопросы интервью чуть сложенее элементарных. Кроме того квоты по соц. дем. в большинстве маркетинговых задач не применимы. Приходим к тем же задачам, что мы обсуждали при медиапланировании по соц. дем.параметрам.

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 02.10.2008 19:10
цитата
Profile
Юрий Рязанов©

Постов: 2128
Дата регистрации: 07.04.2005
для: butaev©
Будем считать, что вопрос «проговорили». Советчиков оказалось много – и это радует . Уважают мэтра ;)

Как твою задачу решал бы я.

1. Сгенерил бы с запасом на отказы ~2000 случайных телефонов, положил бы их в БД CATI.
2. В первом вопросе выяснил: в вашей семье кто либо пользуется Интернетом из дома
3. Если это Он/Она пользователь - уточнил бы об его осведомленности о способе подключения к сети.
4. Если респ в курсе дела – отметил способ подключения к сети
5. Если нет, попросил бы позвать к телефону того кто «вкурсе», если такого нет, досвидание и следующий звонок….

Время интервью 1-2 мин. Это исследование стоит копейки.

P.S. Можно расширить выборку до заполнения квот: 30-70 анкет на каждую АТС, для последующего анализа проникновения признака по "районам", точнее географии АТС.


Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 02.10.2008 19:57
цитата
Profile
Странник©
Каждому своё
Постов: 2464
Дата регистрации: 10.02.2007

Цитата, автор IgorRudy:

Мой пример при котором твой подход не работает совершенно другой.

Игорь, давайте упростим задачу. Пусть все потребители широкополосного доступа, имеющие стационарный телефон, находятся в одном доме. Причём все жители дома пользуются таким доступом. Гетто такое программистское. Давайте рассмотрим и другой предельный вариант: они все рассеяны по городу равномерно. Если мы телефонные номера выбираем случайно и меряем лишь долю обзвоненных квартир с доступом, то в чём разница для статистики?
--------
О всемогуществе модераторов: "Вас уже банили, по всему форуму и навсегда. Будут банить и далее" (с) Page Up

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 02.10.2008 21:51
цитата
Profile
IR©
Маркетолог - международник
Постов: 5658
Дата регистрации: 27.01.2007

Цитата, автор Странник:
для: IgorRudy© Плотность выборки была такова, что при 100% охвате квартир телефонами на 1 подъезд 17 этажного дома приходится 1 звонок. На 1 "хрущёвку" тоже 1 звонок.

Вот в этом и проблема! Даже без эффекта рублевки результат может быть ошибочен в разы!

Игорь, давайте упростим задачу. Пусть все потребители широкополосного доступа, имеющие стационарный телефон, находятся в одном доме.


Хороший пример. В этом случае, если му обзваниваем 10% домов в городе (10 000 звонков), то есть вероятность 90%, что мы на этот дом не попадём и т.е. в городе окажется 0 ШПД. Если же даже 1 звонок попал в этот дом, то проникновение ДШП в городе Х = 1/10 000.
В действительности, в доме 100 квартир с ШПД при 100 000 квартир в городе, т.е. проникновение Y = 100/100 000 = 1/1000, что в 10 раз выше, чем Х (проникновение полученно при обзвоне).
Т.е. обзвон даёт ошибку в 1000%!
--------
marketer marketiri lupus est ...

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 02.10.2008 23:58
цитата
Profile
IR©
Маркетолог - международник
Постов: 5658
Дата регистрации: 27.01.2007

Цитата, автор Юрий Рязанов:Игорь, и чего ты прицепился к ДОМАМ!!! :) Нас интересует ШПД в квартире(домохозяйстве). Это принципиально!!!


Юра, я лишь привёл пример, когда эффект рублёвки при равномерном обзвоне даёт ошибку до 100%.

Если обзваниваешь случайно по квартирам то получается следущее:
1.Обзвонили случайных 10 000 квартир. В 100 из них есть ШПД - значит проникновение ШПД = 1%.
10 квартир из случайных 10 000 находятся в рублёвке и во всех из них есть ШПД + в 90 квартирах вне рублёвки есть ШПД.

2.В действительности: если 50% всего ШПД города находится на рублёвке и среднее проникновение вне рублёвки = 0,9%, то проникновение во всём городе около 1,8%. Т.е. обзвон даёт 1% проникновения ШПД , а в действительности оно = 1,8% - ошибка почти 80%.
--------
marketer marketiri lupus est ...

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 03.10.2008 00:08
цитата
Profile
Юрий Рязанов©

Постов: 2128
Дата регистрации: 07.04.2005

Цитата, автор Странник:

Цитата, автор IgorRudy:

Мой пример при котором твой подход не работает совершенно другой.

Игорь, давайте упростим задачу. Пусть все потребители широкополосного доступа, имеющие стационарный телефон, находятся в одном доме. Причём все жители дома пользуются таким доступом. Гетто такое программистское. Давайте рассмотрим и другой предельный вариант: они все рассеяны по городу равномерно. Если мы телефонные номера выбираем случайно и меряем лишь долю обзвоненных квартир с доступом, то в чём разница для статистики?


для: Странник©
Что самое удивительное, никакими примерами "их" не пронять. И что меня огорчает больше всего, таких простых вещей не понимают люди суперобразованием :(
Мне Эдуард в свое время пытался доказать на примере "морского боя" Чес слово, ну как маленькие дети. Самое смешное то, что я тоже постоянно сомневаюсь в своей правоте.

для: IgorRudy©
Игорь, не надо никаких примеров. Давай говорить на языке тервера. И заруби себе пжл. на носу простое правило случайного отбора:

Вероятность признака, у наугад выбранного респонента (телефона) = доле этого признака в ГС

И ничего ты с этим правилом не сможешь сотворить, НИЧЕГО!!! И далее без фантазий пжл. Ты просто обязан понять то что я написал

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 03.10.2008 00:47
цитата
Profile
IR©
Маркетолог - международник
Постов: 5658
Дата регистрации: 27.01.2007
для: Юрий Рязанов©

Цитата, автор Юрий Рязанов:Вероятность признака, у наугад выбранного респонента (телефона) = доле этого признака в ГС


Проблема в том, что распределение телефонов не совпадает с распределением ШПД. Выборка для обзвона выбирается из распределения телефонов, и используется для оценки ШПД, которые распределeны по другому.
Юра, твоя формула будет работать только для определения числа телефонов в городе, но не для числа ШПД.
Другой вопрос: чем тебе не понравились мои примеры? - они же доказывают ущербность случайного выбора телефонов для определения ШПД!
В чём моя ошибка в данных примерах?
--------
marketer marketiri lupus est ...

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 03.10.2008 00:55
цитата
Profile
Юрий Рязанов©

Постов: 2128
Дата регистрации: 07.04.2005
для: IgorRudy©
Игорь, читаю в твоих словах ростки сомнения... ;)

Формула увы не моя. Если бы ее не было, не было бы и дорогих нашему сердцу Гауссов, Пуассонов и т.д. и т.д..

И последнее, не стоит переводить стрелки на ущербность случайной телефонной выборки в сравнении с собственно идеальной случайной.

Свои ошибки ты найдешь сам. Я в этом уверен. ;)


Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 03.10.2008 01:11
цитата
Profile
IR©
Маркетолог - международник
Постов: 5658
Дата регистрации: 27.01.2007

Цитата, автор Юрий Рязанов:Свои ошибки ты найдешь сам. Я в этом уверен. ;)


Так нет ошибок в тех примерах. я их специально выбирал так, что бы показать, что случайная выборка даёт ошибку в несколько раз ...
--------
marketer marketiri lupus est ...

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 03.10.2008 01:38
цитата
Profile
Юрий Рязанов©

Постов: 2128
Дата регистрации: 07.04.2005

Цитата, автор IgorRudy:

Цитата, автор Юрий Рязанов:Свои ошибки ты найдешь сам. Я в этом уверен. ;)


Так нет ошибок в тех примерах. я их специально выбирал так, что бы показать, что случайная выборка даёт ошибку в несколько раз ...


Ок. Объясняю.

Возьмем 100 шаров в урне. Покрасим 10 из них Черным. Пусть черный указывают нам признак - есть ШПД.

Теперь, ты берешь эти 10 черных шаров и кладешь "на самое дно самого глубокого ущелья (c)» урны. Этим самым ты создаешь территориальную неравномерность признака в массиве шаров (урне).

Очевидно, на дне урны - доля признака будет 100%, на поверхности 0%

Включаем перемешивание. И о чудо!
Вероятность того, что взятый тобой наугад первый попавшиеся шар будет равна доле признака в ГС : 10/100=10%

Перемешивание – есть процесс создания условия случайного отбора. С телефонной выборкой – полная аналогия.

Согласен?

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 03.10.2008 02:28
цитата
Profile
Странник©
Каждому своё
Постов: 2464
Дата регистрации: 10.02.2007

Цитата, автор IgorRudy:

Проблема в том, что распределение телефонов не совпадает с распределением ШПД. Выборка для обзвона выбирается из распределения телефонов, и используется для оценки ШПД, которые распределeны по другому.

А если не делать больше никаких предположений для оценки ШПД? Только отношение обзвоненных квартир с ответами, что там есть ШПД, к квартирам с ответами, что там нет ШПД?

P.S. Игорь, нам ведь для оценки не нужен такой параметр, как % ШПД в доме ;)
--------
О всемогуществе модераторов: "Вас уже банили, по всему форуму и навсегда. Будут банить и далее" (с) Page Up

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 03.10.2008 11:31
цитата
Profile
IR©
Маркетолог - международник
Постов: 5658
Дата регистрации: 27.01.2007

Цитата, автор Юрий Рязанов:Возьмем 100 шаров в урне. Покрасим 10 из них Черным. Пусть черный указывают нам признак - есть ШПД.
Теперь, ты берешь эти 10 черных шаров и кладешь "на самое дно самого глубокого ущелья (c)» урны. Этим самым ты создаешь территориальную неравномерность признака в массиве шаров (урне).
Очевидно, на дне урны - доля признака будет 100%, на поверхности 0%
Включаем перемешивание. И о чудо!
Вероятность того, что взятый тобой наугад первый попавшиеся шар будет равна доле признака в ГС : 10/100=10%
Перемешивание – есть процесс создания условия случайного отбора. С телефонной выборкой – полная аналогия.
Согласен?


К сожалению, распределение ШПД по городу не случайно и не гауссово, и там нельзя включить перемешивание.
В твоём примере (позволь мне его немного изменить, т.к. ты почему-то рассматриваешь все "хорошие" случаи и не рассматриваешь аномальные) 100 шаров - 20 чёрных, 80 белых: берёшь 20 чёрных шаров и прячешь их в другую урну. Случайным образом выбираешь 9 шаров из 1-ой урны (где все белые) и 1 шар из 2-ой урны (где все чёрные) (т.к. apriori ты не знаешь сколько чёрных во второй урне). В результате, в твоей выборке 1 шар чёрный и 9 белых - т.е. ты думаешь, что всего 10% шаров чёрные - на самом деле, их 20% и ты ошибся в 2 раза!
--------
marketer marketiri lupus est ...

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 03.10.2008 19:30
цитата
< 1 2 3 4 5 >
В настоящий момент эту тему просматривают: участников - 0, гостей - 2.
Только зарегистрированные пользователи могут оставлять сообщения в этом форуме


Форумы на Sostav.ru / Маркетинговые исследования / Ошибки и смещения, получаемые при телефонном опросе домохозяйств.
© "ООО Состав.ру" 1998-2024

тел/факс: +7 495 225 1331 адрес: 109004, Москва, Пестовский пер., д. 16, стр. 2

При использовании материалов портала ссылка на Sostav.ru обязательна!
Администрация Sostav.ru просит Вас сообщать о всех замеченных технических неполадках на E-mail
Rambler's Top100   18+   Словарь маркетинговых терминов