@Собственик 31 - явно предният път като съм се опитал да го обясня простичко, не си чел или фактите са такива, че съзнанието ти не ги приема, затова ето още веднъж:
НСИ няма как да знае реалната средна цена на продажбите на имоти, защото това никой не го знае - защото истинската цена я знае само продавачът, нарушавайки закона и укривайки данъци, но това е друг въпрос.
НСИ получава данните от няколко агенции, които им дават списъци. НСИ използва само част от данните, защото гледа да получи балансирана оценка (т.е. да няма само панелки или само продажби от център), което допълнително намалява броя сделки, които използва за сметката. Отделно тези списъци може да са реални, а може и да са хвърляне на боб от агенциите. Или нарочно с 1-2 реда по 2000 евро/м2 ей така за поддържане на бодрия дух на омърлушените брокери.
Така през за
Q2/2010, когато бяха дали стойност за София
съвпадаща до стотинка със стойността на
Q1/2010 и на мен ми стана много съмнителна цялата им система, лицето което отговаря за оценката на данните и крайното одобрение преди публикуване на данните, ми каза какъв е броят на сделките, които те събират и разделят на това число за да се получи средното аритметично -
120! През Q2/2010 пък според АВ е имало
6036 сделки. Т.е. НСИ са използвали
2% от сделките.
Когато имаш 6036 сделки, събереш сумите на продажбите и разделиш на 6036, ще получиш реалната средна цена на продажбите. Когато избереш от тях случайно 120, ще получиш средна цена, близка до реалната, защото по случайност в тези 120 обяви може да попадне или някоя циганска панелка за 200 евро/м2 или някоя луксозна къща за 4000 евро/м2 и цената няма да е точно тази, която е реалната, сметната при всички 6036 сделки.
Друг е въпросът, че тези 120 сделки не са случайно избрани, а конкретно подадени от агенции, които заради склонноста да публиуват тъпанарски статии от вида "пазарът се раздвижи", малко е съмнително дали са случайни, но това няма как да знаем.
Идваме до въпроса - щом не използваме всички сделки, все пак трябва да знаем, смятайки само за 120, колко близо сме до истинската цена, сметната при всички 6036? Математиката дава лесно тази стойност и тя се нарича статистическа грешка. Погрешно много (и ти) вероятно свързвате словосъчетанието "статистическа грешка" само с думата грешка, и предполагате че се получава когато Мара статистичката смятайки сметките, е направила техническа грешка. Не, това число е много важно и дава основна характеристика на обявената средна цена - какво доверие можеш да има в нея и до колко тя е близка до реалната средна стойност. Погледнато от обратната гледна точка - казвайки приблизителната средна стойност, да знаеш, че реалната се намира в определен интервал нагоре или надолу от нея.
И така, само по себе си "средна цена" няма, ако е сметната не за всички сделки, а само за част от тях. Винаги трябва да върви в комплек с "колко е всъщност статистическата грешка" и по-точно, за да не се използва подвеждащата дума "грешка" - в какъв интервал се намира истинската средна цена. Втори важен параметър е вероятността, с която реалната средна цена се намира в този интервал.
Ако се каже така "средната цена за София е 1465 лева при статистическа грешка 15%, при 99% вероятност", това означава, че ако събереш всички 3324 сделки и разделиш на 3324, ще получиш число, което с 99% вероятност ще се намира в интервала от 1245 до 1685 лева. Виждаш ли колко тъпо звучи, когато статистическата грешка е 15% - самата обявена промяна на цената е много по-малка от статистическата грешка, а интервалъ е огромен и напълно безсмислен! Изводът - данните на НСИ са напълно безсмислени и неизползваеми. Със същия успех, с който днес изнесоха числото 1465, можеше да кажат и 1299 или 1600 и пак щяха да са вътре в статистическата грешка т.е. стойността би била позволена.
А статистическата грешка е толкова по-голяма, колкото по-малък е броят сделки, използван за сметките от НСИ. При 1000 сега (общ брой сделки 3324), статистическата грешка е 3.4%. При 120 преди (когато общия брой сделки беше 6036) статистическата грешка беше 11.7%. При 100 сделки сега би била 12.7%.
Ако са имали 120 сделки, при 6036 общо, по-вероятно е при 3324, сега да са използвали за сметките към 70. При 70 сделки статистическата грешка е 15.26%!
Изобщо само по себе си "средна цена" когато се отнася само за част от всичко може да е много заблуждаващо, ако не взимаш предвид пълната информация, а тя винаги гласи: СРЕДНАТА ЦЕНА Е МЕЖДУ
X и
Y С ВЕРОЯТНОСТ
Z.
Ако искаме да твърдим нещото с по-голяма вероятност, интервалът се разширява. Ако искаме да го твърдим с по-малка вероятност, интервалът се скъсява.
И така, понеже не знаем колко сделки са ползвали този път:
- вариант 1а: ако са били 100, НСИ трябва да каже: с вероятност
99% средната цена в София е между 1278 и 1651.
- вариант 1б: с вероятност
95% средната цена в София е между 1322 и 1608. Вижда се как намалихме интервала, но за сметка на това и вероятността да сме познали намаля на 95%.
- вариант 2а: ако са били 70, НСИ трябва да каже: с вероятност
99% средната цена в София е между 1241 и 1689. Вижда се как ако намалим броя на използваните сделки, интервалът се увеличава.
- вариант 2б: с вероятност
95% средната цена в София е между 1295 и 1635.
Когато НСИ ще вади резултати, предварително се залага каква статистическа грешка би била приемлива и само ако се постигне, те трябва да се публикуват. Например нека допустимата статистическа грешка е 3% (+/-3%). При данни от АВ, че в тримесечието има 3324 сделки, може да се сметне информация за колко най-малко сделки трябва да имат, за да е приемливо да публикуват число. При твърдението с "99% вероятност", нужният брой сделки за извадка е 1188! Ако е под този брой, НСИ няма право да публикува просто така числа.
Може да се подходи наопаки - да изберем желан интервал и да видим при него, каква би била вероятността да сме вътре. Това също е много полезно. Например НСИ са казали само "средна цена 1465". Ние приемаме за приемлив интервал +/-15 лева, за да имаме доверие на НСИ, т.е. реалната цена да бъде между 1450 и 1480 лева. Пита се в задачата,
каква е вероятността НСИ да е познала и ако сметнем реалната цена за всички сделки, тя да е в интервала от 1450 до 1480 лева?
Търсим каква ще е вероятността за 1% интервал на достоверност (така е официалният термин на това, което тук викаме статистическа грешка, стандартна грешка)?
Отговорът е 16.6% или точно колкото да уцелиш 6 на зарче от първия път! Това е вероятността реалната средна цена да е в интервала 1450-1480.
Надявам се да си разбрал идеята на написаното.
Може да се направи изводът, че НСИ върти просто ТОТО2 там - гледат цените от някоя графика на сайтовете за имоти и махат от предоставените им данни стойности докато не се получи нещо близко. Защото все пак се движат в граници близки до тези от сайтовете или се мъчат поне да правят сравнително гладка функция, но със сигурност с цената на нагласяне.
При тази грандиозна статистическа грешка нормално трябва да се получават нагоре надолу стойности през тримесечие, разминаващи се с по 15-20%. Щом не сме свидетели на това, значи НСИ си публикува нагласени числа. Да се радват разни като Собственик 31.
За неразбралите - вижте графиката тук:
http://www.fimoti.com/index.php/topic,975.0.html - за София. Тази на imot.bg е много по-гладка от тази на imoti.net която е като гребен - нагоре/надолу. Това става точно заради горното, защото в imot.bg има 5 пъти повече обяви. И това при положение, че в imoti.net извадката е ot 6000 обяви.
При 100 от 3000-5000 както е в НСИ графиката трябваше да изглежда като кардиограма на сърдечен удар. Щом не изглежда така - НСИ = тотална стъкмистика.