🗞 Новият брой на Капитал е онлайн >>

Как да четем социологически проучвания

Ако видите "сензация" в социологически данни, може да ги четете като виц, но не им вярвайте

Shutterstock    ©  Shutterstock
Бюлетин: Вечерни новини Вечерни новини

Всяка делнична вечер получавате трите най-четени статии от деня, заедно с още три, препоръчани от редакторите на "Капитал"

Доц. Алексей Пампоров работи в Института за изследване на обществата и знанието към БАН. Занимава се с ръководство и анализ на социологически изследвания, социални анализи и теренни проучвания.

Един от симптомите на предизборната кампания е, че от екрана и от страниците на вестниците ни залива вълна от различни "социологически" проучвания. Често в такъв случай безпристрастният читател остава объркан от разнопосочните послания и с основание си задава въпроса: "Абе, тия боб ли джуркат?!" Всъщност в предизборната суматоха действително се случва да се смесят данни, произведени съвестно и професионално, с откровени манипулации.

Какво да гледаме

За да отсеем първите от вторите, можем простичко да гледаме няколко неща:

- Първо: Коя е "социологическата агенция". Ако става дума за изследване на агенция, която е позната не само с изявите си по време на избори и има добра пазарна репутация - шансът да фалшифицира данни, за да манипулира общественото мнение, е по-малък. Не за друго, но ако след това се получи голямо разминаване с резултатите от ЦИК - репутацията се срива и бизнесът с другите клиенти ще пострада, а той е 365 дни в годината. Разбира се, не казвам, че е невъзможно някоя известна агенция частично да манипулира резултатите посредством извадката или начина на задаване на въпроса, но репутационният риск наистина не си заслужава.

От друга страна има "данни" и "анализи" от току-що възникнали "институти" с един служител, а понякога и с неясен екип, които очевидно нямат анкетьорска мрежа и следователно нямат капацитет да направят представително изследване. Обикновено именно техните данни са сензационни - или за "обръщалка" между първия и втория, или за "значително увеличаване на преднината" между първия и втория, или за изненадваща "трета партия". Ако видите "сензация" в социологически данни, може да ги четете като виц, но не им вярвайте.

- Второ: Кой е поръчал изследването - много важен признак. Само логистиката и заплащането на анкетьорите по едно съвестно поведено национално представително изследване на общественото мнение обикновено струва около 10-12 хил. лева. Без труда на статистиците, анализаторите, презентациите... Затова, когато чуя, че някоя социологическа агенция е направила изследване "със собствени средства"... ами, не, няма как да повярвам, че просто ей така някой е извадил едни пари от джоба си и е казал "не ми трябват". И няма как да повярвам в такива данни, защото ПР ефектът не е чак толкова висок на фона на общия шум. В дадения случай по-скоро става дума за "клиент", който е решил да остане анонимен и е платено през друго изследване или обществена поръчка. В някои случаи партиите използват възможността и финансират медиа, а медиата наема агенция.

Разбира се, някои медии и сами решават да финансират агенция, за да имат уникален и ексклузивен достъп до дадена прогноза. Когато има такава връзка "медиа - агенция", може и да имам едно наум (особено ако медиата е открито проправителствена или партийна), но по-скоро бих се доверил - отново заради репутационния риск.

- Трето: Как е направено изследването и каква е извадката - това, разбира се, е най-важната информация. Представителните изследвания са такива, при които всеки човек от населението има равен шанс да попадне в извадката. Затова анкети по телефона, по интернет или квотни извадки със спирани по улицата хора не са представителни и дават значително отклонение от крайния резултат, което не може да бъде изчислено предварително. Изборните секции са организирани по местоживеене и най-добрият подход при електоралните изследвания е със случаен обход на адреси в района на систематично подбрани изборни секции. Казано иначе, чуете ли "телефонна анкета", "интернет анкета", "квотна извадка" - значи някой е искал да направи по-евтино изследване, но в никакъв случай няма право да ви говори за стохастична грешка спрямо пълнолетното население на страната.

Този тип проучвания стъпват на теория на вероятностите.

Грешката на изследването зависи от това колко души е извадката. При над 6 милиона избиратели, колкото са според избирателните списъци, най-добрият вариант е извадката да е поне 1500 - 1600 души. За да се намалят разходите обаче, повечето агенции работят с извадки от 1000 души. В този случай максималната грешка е над 3%, а грешката при 25% дялове е 2.7%. От гледна точка на математическите закономерности, които стоят за този тип проучвания, това означава, че ако дадената партия в крайна сметка вземе между 22% и 28%, социологическата агенция си е свършила добре работата, регистрирайки 25% очаквана подкрепа.

Грешката при извадки от 800 или 500 души обаче толкова нараства, че е най-добре изобщо да не разчитате на такива данни. Те ще регистрират относително добре топ 3 от партиите, но нямат достатъчно прецизност, за да обсъждат резултатите около изборния праг (където грешка от ±2% е вече твърде голяма).

Анкети по телефона, по интернет или квотни извадки със спирани по улицата хора не са представителни.

Усещането, че социолозите "не познават", идва от пренебрегването на факта, че този тип проучвания стъпват на теория на вероятностите и че винаги има един възможен интервал от 2.5-3% грешка. Разбира се, част от "професионалните коментатори" по предизборните студиа също допринасят за това. Често може да чуете "Партия Хикс дръпна с 1% на партия Игрек" или "Дистанцията се увеличава с 1%", ами... не! От гледна точка на извадковите изследвания и вероятностите е възможно в рамките на дадените интервали да се регистрират малко-по високи или малко по-ниски стойности в различните месеци. Затова ето този тип послания за мен са червена лампа, че някой е платил на дадения коментатор да каже, че чашата е 50% пълна или че е 50% празна (а чашата си е една и съща).

За да има право някоя агенция да твърди, че има действително толкова тънка промяна на нагласата, трябва да се работи с т.нар. панелна извадка, тоест в две поредни изследвания да се изследват напълно едни и същи лица с едни и същи въпроси. Другото е ала-бала.

Данните от последния месец

Ако приемем, че агенциите, които през последния месец обявиха изследвания с извадки от по 1000 души, са свършили коректно своята работа, и претеглим резултатите (като махнем най-високия и най-ниския за всяка партия - с цел да неутрализираме евентуални обвързаности), към момента се получават следните вероятности.

По отношение на ГЕРБ махаме данните на "Тренд" (като най-високи) и на АФИС (като най-ниски). В този случай ГЕРБ получава средно 27.1%, т.е. всеки резултат между 24.4% и 29.9% ще означава, че социолозите са познали.

По отношение на БСП махаме данните на "Медиана" (като най-високи) и на "Галъп" (като най-ниски). Средният резултат за БСП е 23.1%, а всеки резултат между 20.5% и 25.7% ще означава, че прогнозите са били верни.

Ако ГЕРБ спечели с 9% разлика или ако БСП ги победи с 1% - и двата случая са в рамките на статистическата вероятност.

По отношение на "Има такъв народ" махаме "Медиана" (най-висок) и "Тренд" (най-нисък). Средните резултат за ИТН е 13.5%, а прогнозата - за резултат между 13.3% и 15.6%

По отношение на ДПС махаме "Алфа рисърч" (най-висок) и "Екзакта" (най-нисък). Средният резултат за ДПС е 11.6%, но всеки резултат между 9.7% и 13.6% е вярна прогноза.

По отношение на "Демократична България" махаме "Галъп" (най-висок) и "Медиана" (най-нисък). Средният резултат за ДБ е 5.3%, а очакваният интервал - между 4.4% и 7.3%.

Това са петте политически формации, които към момента изглежда, че ще попаднат в следващия парламент. Най-вероятен победител е ГЕРБ, следван от БСП. Трябва да е ясно обаче, че ако ГЕРБ спечели с 9% разлика, или ако БСП в крайна сметка ги победи с 1% - и двата случая са в рамките на статистическата вероятност и социолозите ще са познали, колкото и странно да звучи това на пръв поглед.

По отношение на "Изправи се! Мутри вън!" махаме "Медиана" (най-висок) и "Тренд" (най-нисък). Средният резултат е 4.5% в интервал от 3.2% и 5.7%. Тоест вероятно това ще е шестата партия в парламента, макар че има малка вероятност да остане под бариерата.

По отношение на ВМРО махаме "Тренд" (най-висок) и АФИС (най-нисък). Средният резултат е 3.9% в интервала от 2.7% до 5.1%. При такива данни буквално до последния момент няма да се знае какво ще е положението на ВМРО, особено като се има предвид, че гласовете от чужбина не могат да бъдат обхванати в такива извадки, а при гласуването от чужбина ВМРО обичайно са губеща партия.

Извадките с 1000 души са прекалено малки, за да може да се регистрират достатъчно добре и съответно да се обсъждат нивата на подкрепа за "Воля" - НФСБ, "Републиканци за България", "Възраждане", "Атака" и АБВ. Може да се каже, че това са "клъстерни партии" с регионална значимост и по тази причина резултатите на различните агенции варират в зависимост от това къде са се паднали съответните гнезда при първата стъпка на формиране на извадката. Към този момент не може да се очаква, че някоя от тези формации бе взела повече от 3.5% на национално ниво, т.е., ако не направят изключително ярка кампания и не променят обществените нагласи, тези партии вероятно ще останат под прага за влизане в Народното събрание.