Слово и фраза: Искать: Сортировать по:
Форумы на Sostav.ru / Маркетинговые исследования / Помогите с определением выборки!!!
1 2 >

Profile
Sumasojti©

Постов: 10
Дата регистрации: 18.03.2006
Помогите, пожалуйста! Никак не могу понять, по какой формуле определять численность выборки при атрибутивном признаке у единицы совокупности! Проблема такая - требуется разбить генеральную совокупность на группы (порядка 9). Предполагается, что численность этих групп будет различной и даже ориентировочно не известной. Для того, чтобы вычленить критерий, на основании которого будем дробить ГС надо провести исследование. И вот как определить численность ВС, чтобы в нее гарантированно попали потенциальные представители всех будущих групп, если пропорции их распределения заранее не известна! ??? ???
Зарании благодарю за любую помощь! :)

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 18.03.2006 18:59
цитата
Profile
Arsenij©
Просто маркетолог
Постов: 5216
Дата регистрации: 17.11.2003
Тема скопирована в раздел "Маркетинговые исследования" - там гораздо более профессиональный состав участников по данной проблеме.
--------
Мое хобби и не более того - Суздаль.
Магазин подарков Леарта - швейцарские ножи Wenger, ручки Parker и Waterman, и еще много всего.

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 18.03.2006 19:06
цитата
Profile
F3©

Модератор
Постов: 4827
Дата регистрации: 25.08.2004
для: Sumasojti©
А причем здесь размер выборки?
Для того, чтобы выборка была репрезетативной, нужно обеспечить равную вероятность попадания в выборку единиц генсовокупности.
Это и обеспечит гарантированное попадание представителей всех интересующих групп в пропорции, которая присутствует в генсовокупности.

Другой вопрос, что в большинстве случаев реализовать процедуру собственно случайного отбора не просто. Мы ведь имеем дело с людьми, а не с шарами.

Подробности вот здесь.

http://forum.gfk.ru/texts/seminar/sampling.zip

Эту ссылку уже давал Эдуард Измаилович Бутаев в соседней ветке.
--------
Следует отличать неразвитые мысли от тщательно развитых не-мыслей.

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 18.03.2006 21:41
цитата
Profile
butaev©

Постов: 2114
Дата регистрации: 01.09.2005
Добрый вечер коллеги.
Трудную Вы себе Sumasojti поставили задачу. Представте, что первое исследование Вы провели. Перед Вами таблица из двух строк: Название группы и Сколько в каждую попало людей.
Т. к. для дальнейшего анализа в каждой группе даже в самой малой по числености должно быть не менее 70 человек уже получается 630 ответивших. Но случай когда в каждую клетку попало ровно по 70 человек в жизни не бывает никогда. В одной будет 140 в другой 14. Соответственно придется в 5 раз увеличивать число ответивших. А ведь отвечают только 35% опрошенных (хороший случай) и т. д. Я к тому, что 9 групп много.
А так придумайте в соответствие с каким законом распределятся люди в этих клетках таблицы и проверте хорош ли для Вас такой-то доверительный интервал. Ссылка выше на сайт Gfk.ru или выведете сами из биномиального распеределения все о точности доверительном интервале (книга ниже).
Кроме толстыых переводных книг по марктинговым исследованиям можно поискать какое в Вашем случае получается обычно распределение в книге Н. Джонсон, Ф. Лион "Статистистика и планирование эксперимента в технике и науке", Москва, Мир, 1980 г.

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 19.03.2006 21:17
цитата
Profile
Sumasojti©

Постов: 10
Дата регистрации: 18.03.2006
Спасибо большое за ответы, но вот только озадачили вы меня с числом 70 для каждой группы! :( Дело в том, что сокращать количество групп пока трудно. оно в общем то определится в ходе опроса - как сами респонденты себя распределят. Если подробней, то идея такая: разделить клиентскую базу магазина (активных пользователей дисконтных карточек, их 39000 человечков) на "клубы" - приверженцы здорового питиния, гурманов, ценителей алкоголя, кошатники-собачники и т.д. Они определятся в зависимости от суммы денег которые они оставляют в супермаркете(вернее, от процента общих трат). чтобы определить этот порговый процент и будет проведен опрос. Респондент отсавит номер ДК, а потом будет анализироваться история его покупок, чтобы установить связь трат и интересов. Выборку хочется сделать как можно меньше, потому что сам анализ истории покупок очень трудоемок, да и сроки поджимают!!! :( А у меня диплом... Может, исходя из этой информации вы сможете мне подсказать как оптимизировать процесс? ;) Заранее спасибо!

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 20.03.2006 08:22
цитата
Profile
Olga63©
маркетолог
Постов: 1945
Дата регистрации: 30.03.2004
Антинаучное предложение - если после основного исследования провести дополнительное, по квотной выборке, уже зная, какие необходимо наложить квоты, чтобы добрать "пустые" клетки до 70 человек?
--------
Ольга Егина

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей Сайт пользователя 20.03.2006 08:41
цитата
Profile
Sumasojti©

Постов: 10
Дата регистрации: 18.03.2006
Х-м! Если гуппа, например, винолюбов не набрана до конца, то чтобы догнать ее до 70 человек надо найти и идентифицировать этого поклонника Мерло в толпе и спросить номер дисконтной карточки. Закономерный вопрос - Как? :) Как если не путем еще одного опроса, куда неминуемо попадут и представители других групп. В итоге получится просто увеличение числа выборки!
Хотя... если опрашивать непосредственно у винного стелажа...

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 20.03.2006 09:04
цитата
Profile
Johnie Talker©

Постов: 3
Дата регистрации: 20.03.2006
Вот есть ссылка, думаю из этой таблицы можно вывести что Вам надо.
Или я не понял вопрос. http://www.fivebirds.ru/index.php?option=com_content&task=view&id=48&Itemid=70
--------
Услуги маркетинга на условиях аутсорсинга, маркетинговые исследования, ведение интернет-проектов

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 20.03.2006 09:08
цитата
Profile
Olga63©
маркетолог
Постов: 1945
Дата регистрации: 30.03.2004
Доброго!
Sumasojti©, можно и увинного стеллажа спрашивать :)
Например, мне интересны какие-то характеристики покупателей товаров "х, y, z". Я про них ничего не знаю. Первым маленьким исследованием я выясняю, какие min характеристики есть у каждой группы или выявляю устойчивый признак(и), затем проводим опрос по квотной выборке уже.
Правда, обычно это никак не "9 клеточек", 2-3 на парктике было
--------
Ольга Егина

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей Сайт пользователя 20.03.2006 09:17
цитата
Profile
Sumasojti©

Постов: 10
Дата регистрации: 18.03.2006
Не пойму зачем проводить опрос для определения min харктеристик, если искомая характеристика - человек является приверженцем определенной группы продуктов (того же вина) и тратит на свой "пунктик" больше, чем среднестатистический покупатель. В исследовании просто требуется определить, где эта граница: "пунктик" - "непунктик" и потом исходя из пропорции трат всех держателей карт их разнести по "клубам". А там уже им и адресные рассылки и все такое организовывать. :)

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 20.03.2006 10:05
цитата
Profile
F3©

Модератор
Постов: 4827
Дата регистрации: 25.08.2004
для: Sumasojti©
Если держателей карт все равно всех сегментировать. Тогда не понятно для чего нужно предварительное выборочное исследование? На основании какой информации Вы далее будете идентифицировать владельца карты?
То есть анализировать структуру покупок придется по всем картам, или мы друг друга не поняли.

Если же Вас интересует соцдем характеристики держателей карт, то, действительно, достаточно опросить часть, зафиксировав и номер карты, которая потом позволит отнести ее держателя к тому или иному сегменту и после описать его (сегмента профиль). Но менее 70 человек в сегменте действительно опрашивать не стоит. Или это должны быть очень крупные характеристики типа пол или возраст из трех групп, или доход из трех групп. Парные на 20 респондентах строить опрометчиво.
Да Вас и не должны интересовать малочисленные сегменты. Все 9 сегментов должны быть не менее 10% от числа держателей, если меньше, то зело активные, чтобы компенсировать расходы на их особое обслуживание.
Есть еще 2 проблемы.
1. Будут ли пересекаться группы между собой?
2. Карты, как правило, не привязаны к конкретному покупателю и могут передаваться от одного к другому, в лучшем случае используясь членами одного домохозяйства.

Так что, лично мне, не совсем понятна задача.
Если нужно разделить держателей, то делить, а значит и исследовать нужно всех.
Если задача стоит параллельно понять, кто входит в тот или иной сегмент. То такой тип выборки – стратифицированная. И исследование это нужно проводить уже явно, проанализировав информацию о поведении держателей.
А вот если такой информации нет, но она нужна, тут другое дело. Но в том то и преимущество карт, что они позволяют отследить реальное поведение, а не мнение покупателей. Память – штука не надежная. Так что делать выводы о структуре потребления держателей карт на основании их опроса - не самая удачная идея.
--------
Следует отличать неразвитые мысли от тщательно развитых не-мыслей.

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 20.03.2006 12:53
цитата
Profile
Sumasojti©

Постов: 10
Дата регистрации: 18.03.2006
Ну да, конечно, делить будем всех. Но не проводя выборочного исследования, мы столкнемся с такой проблемой как критерий отнесения к группе (размер расходов на определеную группу товаров), так? А как его определить? То есть, скажем, как мы определим, сколько необходимо потратить человеку в месяц на, опять таки, вино, чтобы отнести его к "винному клубу"? Ведь как Вы говорили, накладывается еще и семейное потребление. И группы будут пересекаться.
Моя же идея состоит в том, что мы сначала спросим человека: какую группу товаров Вы регулярно покупаете и хотели бы получить больше информации о ней и о новинках, которые в ней появляются? когда человек отметит группу, мы посмотрим историю его покупок и определим траты на даную группу товаров, что позволит вывести критерий - какую мининальную долю в общей сумме покупок должны занимать расходы на указанные продукты, чтобы человека можно было отнести к "клубу".
Имея только историю покупок 39000 держателей карт я не понимаю как ее анализировать, чтобы разбить на группы. А исследование на 39000 даже звучит пугающе!!!

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 20.03.2006 15:51
цитата
Profile
foma_r©

Постов: 265
Дата регистрации: 09.03.2006
для: Sumasojti©
...простите, но немогу понять..... проблема в чем? в прнципе сегментации держателей карточек???
у вас есть внутренний массив--т.е. кассовые чеки ... в которых каждая покупка с использованием карты -фиксируется...
соответственно у вас огромные возможности -реально за срез временной отследить покупки карточек и ранжировать их по доле пристрастия к любому продуктовому ряда ассортимента.... сугубо математико-аналитическая задачка.
Обычно аналитики плачут от недостаточности статистического массива......
Вы от его избытка??
Тогда вопрос лишь в том,с помощью какого програмного инструментария его анализировать...
на наличие выраженной доли покупки какого-то ряда продуктов..., периодичность обращения за покупкой и т.д.
--------
лучшая гарантия лояльности - доверие оплаченное за наличный расчет

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 20.03.2006 15:56
цитата
Profile
Olga63©
маркетолог
Постов: 1945
Дата регистрации: 30.03.2004
Доброго!
вот теперь поняла задачу :)
Почему бы просто не поделить существующих держателей на группы в соответствии с историей покупок, для начала? История покупок все равно вещь более надежная, чем память. Семейным потреблением, если речь идет о товарах наподобие вина, на мой взгляд можно принебречь, т.к. если есть карта и она дает значимое преимущество, то, скорее всего, вино будет покупать тот из семьи, у кого есть карта (на практике, не знаю, как это теорией подтверждается :( ).
До сотальных держателей довести информацию, что они могут стать членами "винного", "сырного" и т.п. клуба, если запонят анкету.
Проанализировать всю базу держателей можно с помощью программы (Эксель, СПСС, Аксесс - что-то должно быть доступно). На первый прикид, должно быть достаточно покупки х товара на определенную сумму (объем) за промежуток времени. Какой -можно выяснить из экспертного опроса или пилотажа, или сначала аналитически определить границы групп, а затем уточнить наличие / отсутствие интереса к данному виду продукта путем опроса в магазине например - должна получиться значимая корреляция.
Это съэкономит бюджет, хотя об этом никто и не говорил :)
А если исследование, то согласна с предыдущим оратором :) - лучше всего исследовать всех активных держателей карт (можно вычислить срок среднего возвращения карты - как часто пользуются и 1,5-2 срока предлагать всем, кто воспользовался картой и еще не заполнял анкету, заполнить на выходе небольшой опросник - программка может быть встроена в 1С и показывать - надо человеку предложить анкету или нет).
--------
Ольга Егина

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей Сайт пользователя 20.03.2006 16:06
цитата
Profile
Olga63©
маркетолог
Постов: 1945
Дата регистрации: 30.03.2004
А вообще-то, мы же о факторном анализе говорим. Есть у меня одна любимая ссылка на него: http://www.nickart.spb.ru/analysis/factor.php (просто и понятно :) ) А главное, что до того, как проводить исследование, можно на основе базы "поиграть" с цифрами и посмотреть, что они покажут.
--------
Ольга Егина

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей Сайт пользователя 20.03.2006 16:40
цитата
Profile
F3©

Модератор
Постов: 4827
Дата регистрации: 25.08.2004
для: Olga63©
Скорее о кластерном. :)
Но это частности.
для: Sumasojti©
Проблемы так и не понял.
Есть необходимость узнать о субъективной значимости товарной группы и получить согласие на рассылку?
В случае, если вопрос решается принципиальном не уровне стоит/не стоит такие клубы создавать (насколько информация будет востребована держателями карт). Выборочное исследование уместно.
Если же это инструмент включения в список рассылки, то спрашивать придется всех потенциальных участников клуба.
И выборочный опрос излишен.

Для чего Вам нужна корреляция "заинтересованность в информации - объем покупок"? Это Вы должны решать: покупатели с какой структурой и объемом потребления Вас интересуют; и кого стоит включать в клуб, а кого нет.
А уж задача держателей карт согласится или отказаться от Вашего предложения.

Ведь не исключено, что членами клуба захотят стать не интересные Вам держатели.


--------
Следует отличать неразвитые мысли от тщательно развитых не-мыслей.

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 20.03.2006 17:04
цитата
Profile
Sumasojti©

Постов: 10
Дата регистрации: 18.03.2006
Спасибо большое за ответы! Я буду еще думать. Но вот можно еще вопрос: откуда берется цифра в 70 человек для каждой подгруппы? О на постоянно встречается, но обоснования я ни разу не видела. И как она соотносится с численностью ГС? То есть, например, выборка 9*70=630 и ГС=4000, и при ГС=40000, так? Спасибо!

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 22.03.2006 08:00
цитата
Profile
Olga63©
маркетолог
Постов: 1945
Дата регистрации: 30.03.2004
Из теории эксперимента - от 30 измерений начинается статистика (с этого начинается наука).
70 наверно из практики пошло, интуитивно. Научного обоснования не помню.
А выборку считать надо по формуле или по калькулятору выборки.
--------
Ольга Егина

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей Сайт пользователя 22.03.2006 08:42
цитата
Profile
F3©

Модератор
Постов: 4827
Дата регистрации: 25.08.2004
для: Olga63©
Практика практикой.
Но все куда проще.
Дело в наполняемости подгрупп при анализе.
70 единиц уже могут ее принципиально обеспечить.
И не учите плохому.
Калькулятор выборки - любопытный артефакт.
Но кто видел, что у него внутри?
Один я тестировал. Считает верно.
Но где гарантия, что Sumasojti не попадется творение троечника? :)
Так что по известной ссылке на форум gfk за презентацией с формулой.

Про учет размера выборки там тоже есть.
Просто результат деления выборочной и на генеральную в Вашем примере при ген совокупности больше 6 тыс. это уже сотые.
А при извлечении корня, цифра вообще стремиться к нулю.
Вот и получается, что на размер выборки величина ген совокупности (в случае ее достаточного размера, собственно в таких случаях и принято пользоваться выборочным методом) практически не влияет. Из формулы ее можно легко исключить. Да и к лучшему это, так как точный размер ген. совокупности известен далеко не всегда.
Так что, разброс признака - наше все.
Хотя, разумеется, есть целая область статистики посвященная малым выборкам. Да и формулу легко вернуть к полному виду.

Мю = 1,96 * [квадратный корень из:] (Сигма в квадрате / n) * (1 - n/N), где

Сигма в квадрате - среднеквадратическое отклонение (в Вашем случае заменяется на q*(100-q), где q-значение признака)
N - объем генеральной совокупности
n - объем выборочной совокупности
--------
Следует отличать неразвитые мысли от тщательно развитых не-мыслей.

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 22.03.2006 09:13
цитата
Profile
Sumasojti©

Постов: 10
Дата регистрации: 18.03.2006
для: F3© Как-то я, вроде, раньше лучше понимала... :)
Для меня статистика не самый любимый предмет в курсе был... Поэтому еще такой вопрос: размер выборки зависит от среднего квадрата отклонений (дисперсии). И в случае если доля единиц совокупности, обладающих признаком, допустим, 10%, то дисперсия, соответственно=0,09. Но если доля 20%, то дисперсия=0,16 и при прочих равных условиях (t и мю) выборка во втором случае должна быть больше - почему? Ведь если взять выборку в 100 человек, то в первом случае мо опросим 10 чел. (мало), а во втором - 20(больше, что уже хорошо. А при таком же мю как и в случае с 10% требуется еще больше) Как-то я этот момент не пойму!

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 22.03.2006 09:39
цитата
1 2 >
В настоящий момент эту тему просматривают: участников - 0, гостей - 5.
Только зарегистрированные пользователи могут оставлять сообщения в этом форуме


Форумы на Sostav.ru / Маркетинговые исследования / Помогите с определением выборки!!!
© "ООО Состав.ру" 1998-2024

тел/факс: +7 495 225 1331 адрес: 109004, Москва, Пестовский пер., д. 16, стр. 2

При использовании материалов портала ссылка на Sostav.ru обязательна!
Администрация Sostav.ru просит Вас сообщать о всех замеченных технических неполадках на E-mail
Rambler's Top100   18+   Словарь маркетинговых терминов