HU|EN
Minerva Intézet logó

Intelligens kutatás. Emberi hang.

Minerva Intézet Nonprofit Kft.
MÓDSZERTAN

Verziószám: v2.0 (érvényes 2026. február 1-től)
Az előző verziójú módszertani ismertető ide kattintva érhető el

A kutatás

A Minerva Intézet kutatásainak célja a magyar felnőtt lakosság közérzetének, problématudatának, biztonságérzetének, valamint politikai attitűdjeinek és a mesterséges intelligenciával való interakció élményének feltérképezése, valamint a piac- és közvéleménykutatás területén a mesterséges intelligenciának, mint technológiának a megvalósíthatósági vizsgálata és demonstrációja.

Mintavétel és adatfelvétel

Az adatfelvétel telefonon zajlik, mesterséges intelligencia alapú hangasszisztens segítségével. A megkeresések alapját véletlenszám-generálással előállított telefonszámok képzik, tehát nem használunk meglévő adatbázist vagy előre rögzített célcsoportokat. A válaszadás önkéntes, és kizárólag 18 év feletti személyek vehetnek részt a kutatásban.

Az adatfelvétel párhuzamosan 100 híváscsatornán zajlik, a sikeres hívások célszáma 1000.

Súlyozás

A végleges eredmények a felnőtt magyar népesség kor, nem és lakóhely szerinti megoszlásához igazodva kerülnek súlyozásra. A súlyozást raking (iterative proportional fitting) eljárással végezzük, amely lehetővé teszi, hogy az eloszlások több szempont mentén egyszerre közelítsenek a hivatalos statisztikai adatokhoz (pl. KSH). A súlyozás részletes leírása a következő fejezetben található.

Adatfeldolgozás

Az adatok az interjú után .sav formátumban kerülnek letárolásra, a feldolgozás SPSS Statistics statisztikai szoftverrel történik. A nyílt szöveges válaszokat gépi szövegelemzéssel klaszterezzük és kódoljuk.

Etikai megfontolások

A válaszadók minden esetben rövid adatvédelmi tájékoztatást kapnak a beszélgetés elején. Az adatkezelés teljes mértékben megfelel a hatályos jogszabályoknak, különös tekintettel a GDPR előírásaira. A részvétel önkéntes, a válaszok rögzítése pedig névtelen. A válaszok alapján a válaszadó személye visszakereshetetlen.

A beszélgetéseket minőségbiztosítási célból 30 napig tároljuk, ezt követően automatikusan törlésre kerülnek. Az interjúkat ember nem hallgatja vissza, a feldolgozás kizárólag gépi úton történik.

A súlyozás módszertana

A Minerva Intézet kutatásaiban alkalmazott teljes minta a KSH 2022. évi népszámlálási adataira épülő összevont változók súlyozással kerül meghatározásra: a súlyozás során a nem, kor, településtípus és iskolai végzettség szerinti ismert sokasági eloszlásokhoz igazítjuk a mintát, biztosítva ezzel a vizsgálati eredmények reprezentativitását a magyar lakosságra vonatkozóan.

Adatforrás

Központi Statisztikai Hivatal (KSH) Népszámlálási Adatbázis

A 15 éves és idősebb népesség befejezetett iskolai végzettsége vármegyénként, településtípusonként

Forrás elérhetősége

Népszámlálási adatbázis – Központi Statisztikai Hivatal

A hivatkozott adatforrás a 2022-es népszámláláskor felvett adatok alapján közli a magyar lakosság létszámát legmagasabb befejezett iskolai végzettség (10 kategória), nemek (2 kategória), településtípus (4 kategória) és 5 évenkénti korcsoport (15 kategória) szerinti bontásban.

A Minerva Intézet a fenti, KSH által használt dimenziók alapján a következő kategóriarendszert használja:

Legmagasabb befejezett iskolai végzettség (3 kategória)

KSH kategória Minerva Intézet kategória
Általános iskola 8. évfolyamnál alacsonyabb Alapfokú
Általános iskola 8. évfolyam Alapfokú
Középfokú iskola érettségi nélkül, szakmai oklevéllel Középfokú
Érettségi, általános oklevéllel Középfokú
Érettségi, szakmai oklevéllel Középfokú
Érettségire épülő középfokú szakképesítés Középfokú
Felsőoktatási (felsőfokú) szakképesítés Felsőfokú
Főiskola, felsőfokú alapképzés (BA/BSc) oklevéllel Felsőfokú
Egyetem, felsőfokú mesterképzés (MA/MSc) oklevéllel Felsőfokú
Doktori (PhD- vagy DLA-) fokozat Felsőfokú
 

Nem (2 kategória)

KSH kategória Minerva Intézet kategória
Férfi Férfi

Településtípus (4 kategória)

KSH kategória Minerva Intézet kategória
Budapest Budapest
Megyei jogú város(ok) Megyei jogú város
Egyéb város(ok) Egyéb város
Község(ek) Község
 

Korcsoport (3 kategória)

KSH kategória Minerva Intézet kategória
15 – 19 éves 18 – 39 (fiatalok)
20 – 24 éves 18 – 39 (fiatalok)
25 – 29 éves 18 – 39 (fiatalok)
30 – 34 éves 18 – 39 (fiatalok)
35 – 39 éves 18 – 39 (fiatalok)
40 – 44 éves 40 – 60 (középkorúak)
45 – 49 éves 40 – 60 (középkorúak)
50 – 54 éves 40 – 60 (középkorúak)
55 – 59 éves 40 – 60 (középkorúak)
60 – 64 éves 60 + (idősek)
65 – 69 éves 60 + (idősek)
70 – 74 éves 60 + (idősek)
75 – 79 éves 60 + (idősek)
80 – 84 éves 60 + (idősek)
85 éves és idősebb 60 + (idősek)

Végzettség kategória összevonás

A Minerva Intézet súlyozási arányszámainak kialakításához az első lépés a redukált végzettség kategória szerinti lakosságszám meghatározása. Ez a lépés adatösszevonással történik, mely szerint nem, településtípus és 5 évenkénti életkori kategóriák szerint összeadásra kerül

  • az „Általános iskola 8. évfolyamnál alacsonyabb” végzettségűek és az „Általános iskola 8. évfolyam” végzettségűen lakosságszáma, a továbbiakban együttesen „Alapfokú”
  • a „Középfokú iskola érettségi nélkül, szakmai oklevéllel” végzettségűek, az „Érettségi, általános oklevéllel” végzettségűek, az „Érettségi, szakmai oklevéllel” végzettségűek és az „Érettségire épülő középfokú szakképesítés” végzettségűek, a továbbiakban együttesen „Középfokú”
  • a „Felsőoktatási (felsőfokú) szakképesítés” végzettségűek, a „Főiskola, felsőfokú alapképzés (BA/BSc) oklevéllel” végzettségűek, az „Egyetem, felsőfokú mesterképzés (MA/MSc) oklevéllel” végzettségűek és a „Doktori (PhD- vagy DLA-) fokozat” végzettségűek, a továbbiakban együttesen „Felsőfokú”

Végzettség kategória korrekció

A KSH adatfelvételi ideje (2022) óta eltelt 3 év, aminek megfelelően a végzettség adatokat érdemes korrigálni, hiszen a 2022-es adatfelvétel során még alapfokú végzettségűek egy része középfokú végzettséget, míg a 2022-es adatfelvétel során még középfokú végzettségűek egy része azóta felsőfokú végzettséget szerezett.

A korrekció során

  • a 15 – 19 éves korcsoport alapfokú végzettségű lakosság arányát a 20 – 24 éves korcsoport alapfokú végzettségű lakosság számával korrigáltuk

    Számítási példa a 15 – 19 éves korcsoportba tartozó, budapesti, férfi, alapfokú végzettséggel rendelkező lakosság korrekciójára
    (15 – 19 éves budapesti férfi összesen lakosságszám * 20 – 24 éves alapfokú végzettségű budapesti férfi lakosságszám) / 20 – 24 éves budapesti férfi összesen lakosságszám
     
  • a 20 – 24 éves korcsoport alapfokú végzettségű lakosság arányát a 25 – 30 éves korcsoport alapfokú végzettségű lakosság számával korrigáltuk

    Számítási példa a 20 – 24 éves korcsoportba tartozó, budapesti, férfi, alapfokú végzettséggel rendelkező lakosság korrekciójára
    (20 – 24 éves budapesti férfi összesen lakosságszám * 25 – 29 éves alapfokú végzettségű budapesti férfi lakosságszám) / 25 – 29 éves budapesti férfi összesen lakosságszám
     
  • a 25 – 30 éves korcsoport alapfokú végzettségű lakosság arányát a 30 – 34 éves korcsoport középfokú végzettségű lakosság számával korrigáltuk

    Számítási példa a 25 – 29 éves korcsoportba tartozó, budapesti, férfi, alapfokú végzettséggel rendelkező lakosság korrekciójára
    (25 – 29 éves budapesti férfi összesen lakosságszám * 30 – 34 éves alapfokú végzettségű budapesti férfi lakosságszám) / 30 – 34 éves budapesti férfi összesen lakosságszám
     

A 15 – 19 éves, a 20-24 éves, és a 25 – 30 éves korcsoportban hasonlóan jártunk el a középfokú és a felsőfokú végzettséggel rendelkezők esetében is, amellett, hogy a korrigált lakosságszámokat a példaszámítás szerint számoltuk mindkét nemnél, valamint a településtípusok szerint.

Halandósági korrekció

Annak érdekében, hogy a minta pontosabban illeszkedjen a mai magyar lakosság összetételéhez érdemes a KSH általi 2022-es népszámlálási adatokat az egyes korcsoportok halandósági mutatóival korrigálni. ( www.ksh.gov.hu/stadat_files/nep/hu/nep0011.html )

A KSH éves bontásban közli nemenként és korcsoportonként az 1000 főre vetített éves halandósági statisztikákat, amiből leképezhető a 2022-es népszámlálási időszak óta eltelt kumulált halandósági mutatók.

Ennek megfelelően a férfiak esetében az 1000 főre vetített kumulált halandósági mutatók a következők:

Korcsoport Elhunytak száma/1000 fő
15-19 éves 2,73
20-24 éves 2,73
24-29 2,73
30–34 4,68
35–39 7,41
40–44 11,50
45–49 19,39
50–54 36,64
55–59 65,25
60–64 110,45
65–69 163,19
70–74 212,95
75–79 288,01
80–84 420,17
85+ 646,80

Ennek megfelelően a nők esetében az 1000 főre vetített kumulált halandósági mutatók a következők:

Korcsoport Elhunytak száma/1000 fő
15-19 1,21
20-24 1,21
24-29 1,21
30–34 2,36
35–39 4,06
40–44 5,88
45–49 9,57
50–54 17,11
55–59 30,52
60–64 51,34
65–69 80,24
70–74 115,40
75–79 183,02
80–84 307,11
85+ 562,75

A fenti halandósági mutatókkal felszorozva a nemenkénti, településtípusok szerinti, végzettségek szerinti és korcsoportok szerinti lakosságszámot megkapjuk a halandósággal korrigált lakosságszámokat.

Korcsoport összevonás

Végül utolsó lépésként a korcsoportonkénti adatösszevonás következik, amellyel megkapjuk az általunk használt 3 életkori kategóriát. Az egyes életkori kategóriák egyszerű összeadását itt is érdemes a 2022-es népszámlálás óta eltelt idővel korrigálni, hiszen az a megkérdezett, aki a 2022-es adatfelvételnél 39 éves volt, és ennek megfelelően még a fiatal (18 – 39 éves) korcsoportba tartozott, az mára már a középkorú (40 – 60 éves) korcsoportba tartozik.

Az adatösszevonást követően rendelkezésre áll az a 4 dimenzió mentén számított, a 2022-es népszámlálás óta eltelt időt is figyelembe vevő, és ezáltal a végzettségi adatok változásával, valamint a halandósággal korrigált adattábla, amely a jelenlegi magyar népesség lakosságszámát mutatja. Az így meghatározott 4 dimenzió szerinti korrigált adattábla képezi a kutatásaink során használt minta összevont kategória súlyozásának alapját.

Lakosságszám

    Férfi  Nő  Férfi  Nő  Férfi  Nő  összesen 
    alapfokú  alapfokú  középfokú  középfokú  felsőfokú  felsőfokú   
Főváros  18-39  19566  14389  110372  87552  100819  127278  459976 
Főváros  40-60  21008  17964  131451  115259  107705  138554  531941 
Főváros  60+  16637  46387  74087  118681  52975  74416  383184 
Megyei jogú város(ok)  18-39  26903  20110  152760  121333  71229  98361  490696 
Megyei jogú város(ok)  40-60  27408  24073  184090  161247  85962  121601  604381 
Megyei jogú város(ok)  60+  25090  78758  112133  158669  48954  66581  490185 
város  18-39  63736  52841  251146  197721  71216  112774  749434 
város  40-60  66545  62628  318669  269566  92541  140337  950285 
város  60+  59100  166988  191860  218151  48023  67862  751983 
Község  18-39  85030  73331  244723  191105  46517  81288  721995 
Község  40-60  90789  85908  296517  240788  56752  89138  859892 
Község  60+  72377  187689  176595  161904  28291  38082  664937 
összesen    574187  831066  2244403  2041976  810985  1156272  7658889 
 

Társadalmi arányok

    Férfi  Nő  Férfi  Nő  Férfi  Nő  összesen 
    alapfokú  alapfokú  középfokú  középfokú  felsőfokú  felsőfokú   
Főváros  18-39  0.26%  0.19%  1.44%  1.14%  1.32%  1.66%  6.01% 
Főváros  40-60  0.27%  0.23%  1.72%  1.50%  1.41%  1.81%  6.95% 
Főváros  60+  0.22%  0.61%  0.97%  1.55%  0.69%  0.97%  5.00% 
Megyei jogú város(ok)  18-39  0.35%  0.26%  1.99%  1.58%  0.93%  1.28%  6.41% 
Megyei jogú város(ok)  40-60  0.36%  0.31%  2.40%  2.11%  1.12%  1.59%  7.89% 
Megyei jogú város(ok)  60+  0.33%  1.03%  1.46%  2.07%  0.64%  0.87%  6.40% 
város  18-39  0.83%  0.69%  3.28%  2.58%  0.93%  1.47%  9.79% 
város  40-60  0.87%  0.82%  4.16%  3.52%  1.21%  1.83%  12.41% 
város  60+  0.77%  2.18%  2.51%  2.85%  0.63%  0.89%  9.82% 
Község  18-39  1.11%  0.96%  3.20%  2.50%  0.61%  1.06%  9.43% 
Község  40-60  1.19%  1.12%  3.87%  3.14%  0.74%  1.16%  11.23% 
Község  60+  0.95%  2.45%  2.31%  2.11%  0.37%  0.50%  8.68% 
összesen    7.50%  10.85%  29.30%  26.66%  10.59%  15.10%  100.00% 

Súlyozás hatása

A súlyozás után a mintából számolt mutatók (pl. pártpreferenciák, vélemények) jobban reprezentálják a teljes népesség véleményét. A súlyozás azonban statisztikai bizonytalanságot is bevezethet, így a súlyozott adatokkal végzett elemzések esetén különösen fontos a konfidenciaintervallumok és a hibahatárok értelmezése.

Nyílt kérdések klaszterezése

A kutatás során nyílt kérdések is elhangzanak, amelyekben a válaszadókat arra kérjük, hogy saját szavaikkal fogalmazzák meg a véleményüket. A válaszokat szó szerinti leirat rögzíti és a kutatás lezárása után kerülnek gépi elemzésre.

A nyílt szöveges válaszok feldolgozásához szövegbányászati eljárásokat és nagy nyelvi modellt (LLM – large language model) alkalmazunk.

Ennek módszertana a következő: egy adott kérdés teljes válasz-korpuszát klaszterezési eljárásnak vetjük alá, ennek segítségével megállapítjuk a válaszok jelentésalapú klasztereit, azaz gyűjtő kategóriáit. Ezután az összes választ egyenként besoroljuk valamelyik kategóriába, s az adatbázisban a szabad szöveges választ ennek a kategóriának a kódjával cseréljük fel.