Zpráva z průzkumu Česko v pohybu

Zpráva představuje základní cíl průzkumu Česko v pohybu, definuje výzkumné jednotky a zkoumané proměnné. Popisuje průběh příprav sběru a návrh metodologie, včetně nastavení ukazatelů kvality. Dále zpráva navazuje shrnutím samotného sběru a vyhodnocením kvality dat, dle nastavených ukazatelů. V závěru je popsán způsob zpracování dat.


Obsah zprávy

Úvod

Cíle průzkumu

Hlavním cílem celostátního průzkumu dopravního chování bylo vytvoření báze dat o dopravním chování obyvatel České republiky v referenčních letech 2017-2019, která by měla obsahovat klíčové údaje potřebné k sestavení celostátního modelu poptávky po osobní dopravě a charakteristiky dopravního chování (hybnost, délka cest, dělba přepravní práce) na úrovni státu a v hlavních ukazatelích na úrovni krajů. Data z celostátního průzkum dopravního chování, provedeného na výběrovém souboru 10 tisíc domácností, by měla tvořit důležitou oporu pro budoucí plánování dopravního rozvoje ČR.

Česko v pohybu je vůbec prvním celostátním průzkumem dopravního chování u nás. V ČR bylo dosud realizováno několik desítek průzkumů dopravního chování, v poslední době zejména v rámci přípravy Plánů udržitelné městské mobility (např. Pardubice v letech 2013 a 2017, Uherské Hradiště v roce 2013, Jihomoravský kraj 2013, Olomouc 2016, Litoměřice 2017 a řada dalších). Na regionální úrovni zatím proběhl pouze jeden průzkum, a to průzkum dopravního chování Jihomoravského kraje (2013). Tyto průzkumy dávají dobrý obraz o městské, případně příměstské mobilitě, nelze je však dobře použít pro vyhodnocení mobility na celostátní úrovni.

Metodologie

Základní metodologie celostátního průzkumu dopravního chování vychází z certifikované Metodiky aktivitně-cestovního průzkumu. Tento dokument navazuje na současné evropské snahy o sjednocení evropských metodik průzkumů dopravního chování a z důvodu srovnatelnosti zejména pak vychází z metodiky KOMOD, kterou se řídil rakouský celostátní průzkum dopravního chování Österreich Unterwegs a dále z německé metodiky celostátního průzkumu dopravního chování Mobilität in Deutschland.

Zaměření zprávy

Celostátní průzkum dopravního chování se skládal jednak ze samotného průzkumu dopravného chování (PDCH, nasbírána data od 9419 domácností), jednak z průzkumu cest na dlouhé vzdálenosti (PCDV, nasbírána data od 993 domácností). Tato zpráva se zaměřuje pouze na popis průzkumu dopravního chování. Metodologie a výsledky průzkumu na dlouhé vzdálenosti budou zpracovány a publikovány v budoucnu.

Realizující subjekty

Management, metodologická příprava, dohled nad sběrem dat a zpracování dat bylo po celou dobu řešení úkolem Centrum dopravního výzkumu, v. v. i..

Pro organizací sběru byla vysoutěžena externí agentura.

Průzkum Česko v pohybu byl realizován za podpory Ministerstva dopravy České republiky.

Zjišťované údaje

V průzkumu byly zjišťovány údaje o čtyřech výzkumných jednotkách: o domácnostech (které byly zároveň základní výběrovou jednotkou), o všech osobách starších 5 let (6+) žijících v těchto domácnostech, o všech automobilech v domácnostech a konečně o všech cestách, které zkoumané osoby v domácnostech podnikly v jeden dopředu vybraný den.

První zkoumanou jednotkou byla domácnost, která je zároveň i základní výběrovou jednotkou průzkumu. Údaje o domácnostech byly zaznamenávány do tzv. dotazníku pro domácnosti. O domácnosti byly zjišťovány následující údaje:

  • Adresní bod domácnosti
    • Obec
    • Ulice
    • Číslo popisné
  • Rozhodný den (referenční den, k němuž je reportováno dopravní chování)
    • Datum
    • Počet osob ve věku 6-17 v domácnosti v rozhodném dni
    • Počet osob ve věku 18+ v domácnosti v rozhodném dni
    • Počet osob ve věku 6+ v domácnosti v rozhodném dni
  • Datum vyplnění
    • Počet osob v domácnosti
    • Počet osob trvale žijících v domácnosti
    • Děti do 5 let věku
    • Děti a dospívající od 6 do 17 let
    • Dospělí starší 18 let
  • Dopravní prostředky v domácnosti
    • Počet osobních automobilů soukromých
    • Počet osobních automobilů služebních
    • Počet užitkových a nákladních automobilů
    • Počet motocyklů, mopedů nebo skútrů
    • Počet jízdních kol v domácnosti
  • Hrubý měsíční příjem domácnosti

Osoby zkoumané v průzkumu byly všechny osoby starší pěti let (6+), které se v rozhodném vyskytovaly v domácnosti. Údaje o osobách byly zaznamenávány do dotazníku pro domácnostiU osob byly zjišťovány následující údaje.

  • Sociodemografie
    • Rok narození
    • Pohlaví
      • Muž
      • Žena
    • Nejvyšší dosažené vzdělání
      • Neukončené základní
      • Základní
      • Středoškolské: výuční list
      • Středoškolské: maturita
      • Vyšší odborné
      • Vysokoškolské
    • Ekonomická aktivita
      • Zaměstnanec, zaměstnavatel, samostatně činný či pomáhající
      • Pracující SŠ student nebo učeň
      • Pracující VŠ student
      • Pracující důchodce
      • Žena na mateřské dovolené
      • Nezaměstnaný hledající první zaměstnání
      • Ostatní nezaměstnaní
      • Nepracující důchodce
      • Žák ZŠ
      • Student SŠ
      • Student VŠ
      • Osoba s vlastním zdrojem obživy, na rodičovské dovolené
      • Osoba v domácnosti, dítě předškolního věku, ostatní závislé osoby
  • Bydliště
    • PSČ trvalého bydliště
  • Práce
    • Povaha pracovní doby
      • Možnost práce z domu
      • Možnost si zvolit začátek či konec pracovní doby
      • Pružnost pracovní doby
      • Práce na směny či turnusy
      • Pevná pracovní doba
    • Počet pracovních hodin za minulý měsíc
  • Řidičská oprávnění
    • Řidičský průkaz: B
    • Řidičský průkaz: C
    • Řidičský průkaz: A
    • Bez ŘP
  • Předplatné jízdné a slevy na VHD
    • Předplatná časová jízdenka na MHD / IDS (např. měsíční, roční atp.)
    • Kreditová jízdenku na MHD / IDS
    • Slevová jízdenka na vlak (např. In Karta)
    • Sleva na příměstskou nebo dálkovou jízdenku (např. žákovská sleva u ČD na konkrétní spojení)
    • Zlevněné lístky (např. průkaz ZTP nebo ISIC/ITIC)
    • Bez předplatného jízdného a slev na VHD
  • Dostupnost vozidel:
    • Počet dostupných soukromých aut
    • Počet dostupných služebních aut
    • Dostupnost carsharingu
    • Počet dostupných užitkových vozidel
    • Počet dostupných jiných mot. vozidel
    • Počet dostupných jízdních kol
  • Rozhodný den
    • Realizace cest v rozhodném dni
      • Důvod necestování
    • Adresa začátku první cesty v rozhodném dni
      • Obec
      • Ulice
      • Číslo popisné

Automobily v průzkumu byly vázány na domácnosti (jako společná dispozice), zároveň však byla sledována i propojení na osobní dispozici, viz. nejčastější řidič daného vozidla. Údaje o domácnostech byly zaznamenávány do dotazníku pro domácnosti. Pro každý automobil z domácnosti byly zjišťovány následující údaje.

  • Vlastnictví vozidla
    • Soukromé vozidlo
    • Služební vozidlo
  • Počet najetých kilometrů za poslední rok (dále "nájezd")
  • Rok výroby
  • Typ paliva
    • Benzín
    • Nafta
    • LPG
    • CNG
    • Elektřina
    • Jiné
  • Typ vozidla
    • Osobní
    • Užitkové
  • Počet míst k sezení
  • Dálniční známka
    • Nezakoupena
    • Měsíční/10 dní
    • Roční
  • Nejčastější řidič vozidla z osob domácnosti

Cesty byly zkoumány u osob starších 5 let, které se v tzv. "rozhodný den" vyskytovaly v domácnosti. Rozhodný den byl v každé domácnosti předem stanoven. Jednalo se o pracovní den, úterý až čtvrtek, mimo dny, které předcházejí dnu volna nebo po něm následují. Rozhodný den je vždy následuje až po prvním kontaktu domácnosti, dotazování na cesty je tedy prospektivní. Cesty byly zaznamenány do tzv. cestovního deníku.

U každé z osob bylo pomocí cestovního deníku nejprve zjišťováno, zdali v rozhodný den vůbec cestovala. Pokud osoba v daný den necestovala, byla tato skutečnost zaznamenána a dále je položen dotaz na důvod necestování. Pokud osoba v rozhodný cestovala, byla dále dotazována na všechny cesty v rozhodný den.

Cesta byla v deníku definována následujícím způsobem: "Vyplňte prosím všechny CESTY, které jste během SLEDOVANÉHO DNE uskutečnili. Uveďte i PĚŠÍ CESTY a CESTY DOMŮ. Cestou míníme pohyb za nějakým účelem definovaným níže." Cesty nejsou nijak omezeny časově ani vzdálenostně. Jedná se o záměrné jednání, tedy takové jednání, která je motivováno uvědomovaným účelem (cílem či aktivitou, např. prací, školou, bydlištěm, nákupem apod.). Účel rozděluje jednotlivé cesty, definuje jejich trvání.

Každý mohl vyplnit údaje maximálně o sedmi cestách (kapacita deníku). Pokud počet cest překonal sedm, osoba vyznačila počet zbývajících (neuvedených) cest.

U každé z cest v byly zjišťovány následující údaje.

  • Místo počátku cesty
    • obec
    • ulice
    • číslo domu
    • popis
  • Čas počátku cesty
    • hodina
    • minuta
  • Čas strávený v jednotlivých dopravních prostředcích (v minutách):
    • pěšky
    • kolo
    • městský bus
    • regionální bus
    • dálkový bus
    • trolejbus
    • tramvaj
    • vlak
    • auto, jako řidič
    • auto, jako spolujezdec
    • metro
    • letadlo
    • jiný
  • Účel cesty
    • do práce
    • v rámci práce (služební)
    • vzdělávání
    • volnočasová aktivita
    • nákupy, služby
    • stravování
    • soukromé zařizování
    • návrat do bydliště
    • jiný účel
  • Odhad délky cesty v km
  • Místo konce cesty
    • obec
    • ulice
    • číslo domu
    • popis
    • návrat do bydliště
  • Čas konce cesty
    • hodina
    • minuta
    • příchod následujícího dne (den po rozhodném dni)
  • Indikace poslední cesty v rozhodném dni

Příprava sběru dat

Výběrový soubor a jeho rozložení v čase

Populací průzkumu byly všechny domácnosti České republiky. S ohledem na využití dat pro potřeby dopravního plánování byl zvolen pravděpodobnostní (náhodný) způsob konstrukce výběrového souboru, jinak řečeno, cílem bylo dosáhnout toho, aby každá jednotka populace (domácnost) měla stejnou pravděpodobnost, že bude zařazena do výběrového souboru. Pravděpodobnostně konstruovaný výběrový soubor umožňuje pracovat s koncepty jako je směrodatná chyba, což například u kvótně konstruovaného souboru možné není.

Opora

Opora pro konstrukci výběrového souboru byla sestavena z datové sady Českého statistického úřadu "Budovy s číslem domovním a vchody (statistické budovy)" (aktualizace 20. ledna 2017). Tato sada obsahuje seznam všech adresních bodů ČR (propojitelný s adresním rejstříkem RUIAN) s vyznačeným počtem osob bydlících na adrese a počtem bytů na adrese.

Konstrukce výběrového souboru a rozložení sběru

Rok 2017

Sběr byl rozložen do dvou "dopravně běžných období", podzim 2017 (září-listopad) a jaro 2018 (březen-květen). Výběrový soubor nebyl nijak časově rozčleněn, pouze bylo stanoveno, že v každém z období bude nasbírána polovina cílového čistého souboru (5 000 domácností).

Pro vytvoření výběrového souboru bylo využito metody "probability-proportional-to-size sampling" (PPS). Pro cílový výběrový soubor n = 10 000 byl vytvořen výběrový soubor o velikosti 40 000 domácností (odhadovaná návratnost cca 25 %, tedy předpoklad, že každá čtvrtá domácnost bude ochotna účastnit se či úspěšně dokončí dotazování).

Výběr proběhl ve dvou krocích:

  • V prvním kroku byly z opory náhodně vybrány tzv. "primary sampling units" (PSU).
    • Počet PSU byl konstruován s ohledem na odhadovaný počet uznatelných domácností na jednoho tazatele za měsíc (14 domácností).
    • S předpokladem, že průměrný tazatel by během měsíce mohl zvládnout dvě PSU, bylo počítáno se 7 netto domácnostmi na PSU.
    • Při očekávané návratnosti 25 % pak 7 / 0,25 = 28 domácností brutto. Při netto vzorku 10 000 domácností vychází počet PSU na 1428 (10 000 / 7).
    • Z opory bylo tedy náhodně vybrán soubor 1 428 položek. Výstupem byla frekvenční tabulka obcí z tohoto samplu, kde frekvence reprezentuje počet PSU ve vybraných obcích.
  • V druhém kroku byly pro jednotlivé obce (dle počtu PSU) náhodně vybrány domácnosti k oslovení, celkově 40 000 brutto (pro 10 000 netto).

V roce 2017 byl projektový rok ukončen nedosažením stanoveného počtu 5 000 domácností. S vynaložením maximálního úsilí byly získány údaje od 1 392 domácností (vše PDCH), tj. 28 % původního plánu.

Roky 2018-2019

Na základě vyhodnocení problémů z roku 2017 byl rozhodnuto o změně období sběru - byl zvolen kontinuální roční sběr. Sběr probíhal po 12 měsíců, od května 2018 do dubna 2019, z důvodů administrativních omezení dotace však byl vynechán prosinec 2018 a leden 2019. Způsob určení rozhodného den byl zachován, opět se tedy jedná o "dopravně běžný den" (úterý, středa, čtvrtek, mimo dny po svátku a před ním).

Výběrový soubor bylo nutné navázat na předchozí sběr, bylo však rozhodnuto, že pro nové období budou vybrány nové domácnosti. Všechny v roce 2017 "rozesbírané" primární výběrové jednotky (PSU) byly ponechány k dosbírání. Soubor "nedotčených" PSU byl vyřazen s tím, že budou nahrazeny nově náhodně vygenerovanými.

  • Za oporu opět sloužila datová sada ČSÚ "Budovy s číslem domovním a vchody (statistické budovy)". Z opory byly vyřazeny již využité domácnosti.
  • U nově generovaných PSU bylo postupováno obdobně jako v případě FOCUSu, tedy pomocí metody PPS.
  • V roce 2017 byla PSU přiřazována pouze k celým obcím, pro nový sample v 2018 se (pokud to bylo možné), pracovali i s městskými části (týká se to jen statutárních měst, kromě Prahy). Práce s městskými částmi redukuje rozlohu PSU a snižuje tazateli časové i finanční náklady na cestování.
  • Pro každou PSU bylo náhodně vybrali 28 domácností k oslovení (z toho 7 primárních).
  • Poněkud odlišně se postupovalo v Praze, kde ani redukce na městské části nedostačovala. V Praze byl náhodně vygenerován počet prostorových bodů, odpovídající počtu nedotčených pražských PSU. Tyto body byly využity jako středy kružnic o poloměru 1000 m. Tyto kružnice pak sloužili jako lokální opory pro získání hledaných 28 domácností.

Výběrový soubor (7 610 domácností pro PDCH) byl rozčleněn do jednotlivých měsíců sběru a stanoven na celý rok dopředu, s náhodným přiřazením PSU do jednotlivých měsíců

Aktualizovaný výběrový soubor byl v průběhu sběru jednou pozměněn a vícekrát byly doplňovány další adresy, to po vyčerpání stávajících 28, přidělených každé PSU. Poslední aktualizace výběrového souboru dosáhla čísla 17.

Významnou změnou prošel výběrový soubor k srpnu 2018. Z důvodu příliš nízké tempo sběru bylo přijato několik opatření, z nichž úprava vzorku byla patrně tou nejdůležitější a nejefektivnější. Soubory PSU, které k srpnu 2018 zůstaly nedotčeny, byl redukovány na poloviční počet s tím, že na dvojnásobek narostl počet primárních domácností v nich (z 7 na 14).

Finální počet PSU je 853, původně 1 428. Díky této změně se podařilo snížit časové náklady tazatelů na dotazování domácností (každá domácnost musí být tazatelem navštívena několikrát).

Nástroj sběru dat a dotazování domácnosti

Data v obou průzkumech byla sbírána pomocí PAPI dotazníků. Dotazníky se v průběhu sběru nijak nemodifikovaly (kromě výměny loga původního dodavatele organizace za logo dodavatele nového).

Dotazník skládá z:

  • Dotazníku pro domácnost (DPD), který zahrnuje jak otázky na celou domácnost, tak dotazy na jednotlivé osoby v domácnosti (jeden list).
  • Cestovní deník (CD), zvlášť pro každou osobu v domácnosti (1 list).

Podklady pro dotazování byly následující:

  • doprovodný dopis;
  • motivační leták;
  • prohlášení o ochraně osobních údajů, oficiální potvrzení dodržování zákona o ochraně osobních údajů;
  • PAPI dotazníky;
  • drobný dárek pro jednotlivé respondenty (tužka nebo reflexní páska s logem průzkumu).

Průběh dotazování domácnosti

Dotazování domácností se odehrávalo v průběhu celého týdne včetně víkendu.

První kontakt domácnosti

  • Tazatel (organizovaný externím dodavatelem) vyhledal zadanou domácnost.
    • V případě, že stanovená domácnost v místě neexistovala (chyba opory), tazatel tuto skutečnost zaznamenal do protokolu, přičemž taková domácnost bude zařazena do "kvalitativně neutrálního výpadku".
    • Pokud domácnost existovala, ale členové domácnosti nemohli být zastiženi, tazatel vložil do schránky domácnosti informační dopis o šetření a všechny skutečnosti týkající se kontaktu domácnosti zaznamenal do protokolu.
  • Pokud byly členové domácnosti zastiženi a souhlasili s účastí na průzkumu, pak tazatel:
    • Členům domácnosti předal informační dopis o šetření a vysvětlil okolnosti průzkumu.
    • Vyznačil do dotazníku Zhotovitelem předem stanovený plánovaný rozhodný den šetření.
    • Dohodl způsob vyplnění CC (PAPI/CAWI/CATI) a předal potřebný počet papírových deníků, odpovídající počtu členů domácnosti starších šesti let, plus jeden náhradní.
    • Dohodl termín vyplnění CD. U metody PAPI termín osobní návštěvy.
    • Převzal telefonický kontakt na jednoho člena domácnosti kvůli kontrole kvality sběru dat či upomínání
    • Pokud to bylo možné, pak se členy domácnosti (s alespoň jedním členem domácnosti) vyplnil PAPI/CAPI DPD, za jednotlivé členy.
    • Pokud to možné nebylo, tazatel si dohodl náhradní termín vyplnění.
    • Všechny skutečnosti týkající se kontaktu zaznamenal do protokolu.
  • Pokud členové domácnosti byli zastiženi, ale jasně odmítli účastnit se průzkumu, pak tazatel:
    • Od členů domácnosti zjistil důvod odmítnutí účasti na průzkumu.
    • Všechny skutečnosti týkající se kontaktu domácnosti zaznamenal do protokolu.
  • U domácností, které nebyly při první návštěvě domácnosti zastiženy, tazatel učinil další dva pokusy o kontakt. Při každém neúspěšném pokusu o zastižení domácnosti vložil tazatel do poštovní schránky domácnosti informační dopis o šetření. V případě neúspěchu bude domácnost chápána jako "výpadek z nezastižení".
  • Všechny skutečnosti týkající se kontaktu domácnosti tazatel zaznamenal do protokolu.

Kontakt k vyzvednutí dotazníků

  • U domácností, které souhlasí s účastí v průzkumu a zvolí si metodu PAPI, tazatel kontaktoval domácnost v dohodnutý termín vyzvednutí.
  • V případě neúspěšného kontaktu v dohodnutý termín byla domácnost kontaktována ještě nejméně dvakrát. Každý nový pokus o kontakt byl zdokumentován v protokolu.

Zajištění kvality průzkumu

Zajištění kvality získávaných dat bylo od počátku jednou z hlavních priorit. Při přípravě průzkumu se zejména vycházelo ze zkušeností z rakouského šetření Österreich Unterwegs a rakouské metodiky KOMOD a dále zkušeností CDV z předchozích průzkumů dopravního chování (Jihomoravský kraj, Olomouc).

Technická specifikace

Základním nástrojem zajištění kvality byla Technická specifikace (TS), která organizátorovi šetření (FOCUS, poté SC&C) přesně specifikovala předmět i metodu statistického šetření a zpracování dat. Rovněž stanovila kvalitativní ukazatele, jejichž naplňování bylo v průběhu sběru a zpracování dat sledováno.

Kontrola kvality v přípravné fázi

Školení tazatelů

FOCUS (2017)

Všichni tazatelé byli pro tento výzkum proškoleni, telefonicky nebo osobně. Poštou jim zaslány všechny potřebné materiály (písemné instrukce, dotazníky, cestovní deníky, kontrolní listy, seznamy adres, průvodní dopisy, vizitky tazatele, tužky) a instruktážní video a průvodce tazatele pro projekt Česko v pohybu v elektronické podobě e-mailem. Až po proškolení a obdržení materiálů mohli realizovat terénní sběr. Součástí tazatelského úkolu bylo zároveň přepsání údajů z dotazníků a cestovních deníků do elektronického formuláře a následné odeslání materiálů poštou (dotazníky, cestovní deníky a kontrolní listy) do společnosti FOCUS.

SC&C (2018-2019)

Do výzkumu bylo plánováno zapojit přibližně 100 až 150 tazatelů, se zkušenostmi zkušenosti z náročných projektů. Všichni tazatelé prošli jednodenním školením, kde se seznámili se všemi výzkumnými instrumenty, způsob vedení rozhovoru. Školení vedli zkušení členové týmu (projektový manažer a field manažer). Tazatelé si na školení prověřili a procvičili měkké dovednosti, zejména zaujmout a vyslechnout respondenta a odpovídajícím způsobem reagovat na jeho možné obavy ohledně účasti na výzkumu. Na školení měli získat také potřebnou jistotu při vyplňování dotazníku tak, aby se při samotném dotazování mohli plně zaměřit na respondenta. Na školení se tazatelé také seznámili se svými supervizory zodpovědnými pro danou oblast. S nimi pak během sběru dat plnit cíle sběru a řešit případné problémy, které mohou při sběru dat vyvstat. Na školení také zazněly a byly nastaveny nařízení dodržení ochrany osobních údajů.

Harmonogram sběru dat

FOCUS (2017)

Harmonogram sběru měl stanoven několik termínů průběžné kontroly, při nich byl realizátorem sběru reportovány dohodnuté ukazatele:

  • "Domácnosti se zájmem" - domácnosti, které vyplnily "dotazník pro domácnost" (ještě však nebyla informace o stavu vyplnění či zpracování deníků)
  • "Domácnosti použitelné" - domácnosti hotové, které naplňují požadavky použitelnosti definované v Technické specifikaci. Tyto domácnosti tvoří "použitelný čistý výběrový soubor".
  • Počet tazatelů pracujících na projektu.
SC&C (2018-2019)

Při plnění harmonogramu pro domácnosti s PDCH se sledoval dosažený počet "použitelných domácností", tj. domácnosti kompletně zpracované a naplňující kvalitativní požadavky definované v TS. Hrubá data pro domácnosti s PDCH byla za každý měsíc byla odevzdávána maximálně do 15 pracovních dní. Kontrola kvality v průběhu sběru

Dokumentace průběhu šetření

Každé navázání kontaktu i každý pokus o navázání úvodního kontaktu s domácností tazatel zaznamenával do protokolu.

Průběžné kontroly sběru

Po realizátorovi byly vyžadovány tyto pracovní postupy průběžné kontroly sběru dat:

  • Monitoring a pravidelná zpětná vazba na práci v terénu prostřednictvím dokumentovaných týmových porad.
  • Dokumentace dodržování všech pracovních postupů v požadované kvalitě (např. předem určený počet pokusů o navázání kontaktu s domácností).
  • Průběžné kontroly dodržování ustanovení o ochraně osobních údajů a technickém zabezpečení, dokumentace prohlášení o ochraně osobních údajů zúčastněných osob a zapojeného personálu.
  • Dokumentace průběhu statistického šetření a nepředpokládaných událostí, včetně stanovených opatření.
  • Dokumentace zpracování dat a kontroly správnosti při vkládání dat.

Kontrola kvality při zpracování dat

Kontrola úplnosti dat

Při kontrole úplnosti dat musely být dodrženy a zaznamenány tyto pracovní postupy:

  • Kontrola, zda se sběr dat uskutečnil opravdu na dané adrese domácnosti / respondenta, dále se kontroluje opakování návštěv při nezastižení respondentů, report o výtěžnosti musí obsahovat základní údaje o náhodném výběru, tj. počet adres pro každý výběrový bod, počet kontaktovaných adres, rozdělení výsledků kontaktů, vyhodnocení výtěžnosti,
  • Kontrola úplnosti vrácených podkladů statistického šetření a (je-li to možné) doplnění pomocí dodatečného dotazování nebo automatického doplnění odvoditelných informací (např. chybějící dotazník pro domácnosti),
  • Kontrola údajů týkajících se domácnosti a osob a (je-li to možné) doplnění pomocí dodatečného dotazování nebo automatického doplnění odvoditelných informací (např. chybějící údaje o osobě u jednoho člena domácnosti),
  • U varianty PDCH: Kontrola úplnosti údajů o mobilitě a (je-li to možné) doplnění pomocí dodatečného dotazování nebo automatického doplnění odvoditelných informací (např. chybějící údaje o cestě zpět u vycházky).

Kontrola správnosti dat

Při kontrole správnosti dat byly vyžadovány tyto pracovní postupy:

  • kontrola počtu členů domácnosti dle souboru osob a cest;
  • kontrola nejvyššího dosaženého vzdělání a ekonomické aktivity v porovnání s věkem osoby;

Údaje o cestách:

  • kontrola vyznačení "cestování v průběhu rozhodného dne" porovnáním se záznamem v deníku;
  • kontrola následnosti počátku a konce cesty (cesta nekončí dříve, než stejná cesta začíná);
  • kontrola následnosti cest během dne (např. druhá cesta nesmí začínat před ukončením první cesty);
  • kontrola zpátečních cest;
  • kontrola použitelnosti adres u cest;
  • kontrola uvedené délky cesty v porovnání s trváním cesty s ohledem na použitý dopravní prostředek;
  • kontrola údaje o použitém dopravním prostředku "automobil jako řidič" u osob, které nevlastní řidičský průkaz.

Za použitelná (zařaditelná do použitelného čistého vzorku) byly považovány záznamy o domácnostech, osobách a cestách, které obsahovaly následující informace.

Použitelná domácnost

U domácností se třemi a více členy bylo potřeba získat použitelné rozhovory o osobě od minimálně 50 % členů domácnosti, u menších domácností je to 100 %. Vyžadované informace:

  • bydliště (adresa) domácnosti;
  • počet členů domácnosti starších 6 let;
  • počet provozuschopných dopravních prostředků v domácnosti;
  • rok výroby a druh paliva u všech osobních automobilů v domácnosti;
  • vybraný rozhodný den;
Použitelná osoba

Za použitelnou byla považována osoba domácnosti, u které byly zaznamenány následující údaje:

  • věk osoby;
  • pohlaví osoby;
  • vzdělání osoby;
  • ekonomická aktivita osoby;
  • údaje o (ne)cestování v rozhodný den;
Použitelná cesta

Za použitelnou cestu v cestovním deníku byla považována cesta s následujícími záznamy:

  • Čas zahájení a konce cesty.
  • Použitý dopravní prostředek.
  • Účel cesty.
  • Zdrojová adresa a cílová adresa: U cest v rámci jednoho města musí být adresy specifičtější než město (městská část, ulice, ulice + číslo orientační), ale také na stejné úrovni obecnosti. Jedna adresa také nesmí zahrnovat adresu druhou.
  • U cest mezi městy je možné zaznamenat adresu na úrovni města.

Kontrola návratnosti

Pro kontrolu velikosti výsledného čistého výběrové souboru byly zavedeny následující definice.

Tabulka 1. Přehled definic výpadků a výběrových souborů
NázevDefiniceOznačení / výpočet
Kvalitativně neutrální výpadekDomácnosti v definovaném hrubém vzorku, které v době průzkumu prokazatelně neexistovaly nebo které se prokazatelně delší dobu nevyskytovaly na adrese bydliště v místě provádění průzkumu.Vkn
Výpadek z nezastiženíDomácnosti, které se ani po třetím pokusu o navázání kontaktu (osobně) a osobní návštěvě v domácnosti v různých časech a dnech nepodařilo zastihnout.Vnezas
Výpadek z nezájmuDomácnosti s jasně deklarovaným nezájmem o účast na průzkumu.Vnezaj
Výpadek z nepoužitelnostiDomácnosti, které neposkytnou dostatek informací pro započítání do čistého použitelného vzorku (viz použitelnost domácnosti).Vnep
Hrubý výběrový souborSouhrn všech domácností, u kterých byl učiněn pokus o kontakt.Sh
Upravený hrubý výběrový souborSouhrn všech domácností, u kterých byl učiněn pokus o kontakt, očištěný od kvalitativně neutrálního výpadku.Shu = Sh - Vkn
Čistý výběrový souborUpravený hrubý výběrový soubor po odečtení všech nezastižených domácností a domácností s nezájmem o průzkum.Sč = Shu - Dnezaj - Dnezas
Použitelný čistý výběrový souborČistý výběrový soubor po odečtení nepoužitelných domácností.Sčp = Sč - Dnep
Použitelná návratnostPoměr mezi použitelným čistým a upraveným hrubým vzorkem.Np = Sčp / Shu

Technická zpráva po ukončení sběru

Nejpozději do dvou týdnů od ukončení terénního šetření v každé z fází sběru dat musela agentura odevzdat technickou zprávu, která obsahovala:

  • popis vstupních údajů pro zahájení šetření;
  • průběh šetření včetně časového harmonogramu;
  • použité metody zajištění kvality;
  • zjištěné nedostatky, podniknutá opatření a údaje o ukazatelích kvality výsledků na bázi zjištěných dat (s doplněním a opravami a bez nich);
  • stručné představení základních ukazatelů sledovaných v průzkumu;
  • zhodnocení průběhu sběru dat a doporučení/poučení pro podobné projekty do budoucna.

Sběr dat

Již na začátku sběru v roce 2017 se začalo ukazovat, že dosáhnout naplánovaného počtu domácností bude za stávajícího nastavení obtížné. Hned průběhu prvního reportu firma FOCUS avizovala neschopnost dodržet stanovený harmonogram. Za příčinu nedodržení harmonogramu agentura označila nepříznivou situaci na trhu práce, a tedy potíž v rekrutování dostatečného počtu tazatelů. Přestože agentura zavedla několik opatření týkajících se rekrutace tazatelů, naplánovaných 5 000 domácností se nasbírat nepodařilo. Na konci roku 2017 agentura FOCUS předala CDV uznatelná data za 1 392 domácností.

Analýza průběhu sběru v roce 2017 ukázala dva hlavní rizikové faktory: nedostatek času a způsob konstrukce výběrového souboru.

Nová metodika reagovala na tyto dva faktory následujícími úpravami:

  • Nedostatek času byl řešen přechodem od sběru v "dopravně běžných" obdobích ke kontinuálnímu ročnímu sběru.
  • Sběr byl stanoven na 12 měsíců, od května 2018 do dubna 2019 (z důvodů administrativních omezení dotace bude vynechán prosinec a leden).
  • Zbývající počet domácností (7610) byl rovnoměrně (náhodně) rozdělen dle území a času.
  • Na rok 2018 (květen až listopad, sedm měsíců) bylo stanoveno nasbírat cca 5000 domácností pro PDCH a 500 domácností (září až listopad) pro PCDV.
  • Na rok 2019 (leden až duben, čtyři měsíce) bylo stanoveno nasbírat cca 2 600 domácností pro PDCH a 500 domácností (březen až duben) pro PCDV.
  • Výběrový soubor pro PDCH byl stanoven na celý rok dopředu, což umožnilo lépe naplánovat tazatele a usnadnit jejich vyplácení.
  • Časoprostorové rozmístění sběru bylo provedeno pomocí náhodného (pravděpodobnostního) přidělení nedosbíraných PSU do jednotlivých měsíců.

S takto upravenou metodikou obnovila firma SC&C sběr dat na jaře 2018. V úvodních měsících sběru s opět objevily náznaky možného nedosažení cílového počtu domácostí v stanoveném termínu. Úvodní obtíže podařilo překonat, zejména díky úzké komunikaci s obcemi, v nichž průzkum probíhal, zejména pak jejich starosty, dále vytvořením stabilního týmu tazatelů, opatření k usnadnění jejich práce a zvýšení jejich motivace změnou modelu odměňování. V neposlední řadě také došlo ke snížení počtu dotazovaných lokalit a současně k navýšení počtu domácností na jeden tazatelský úkol (ze 7 na 14 domácností).

V roce 2018 bylo celkem dotázáno 6140 domácností, z toho 5644 v PDCH (z plánovaných 5403, tj. naplnění na 104,5 %) a 496 v PCDV (z 500, tj. naplnění na 99,2 %). Do sběru bylo nakonec zapojeno 138 tazatelů (udělali alespoň jeden dotazník).

V roce 2019 pak bylo úspěšně dotázáno 2 859 domácností, z toho 2 362 v PDCH (z plánovaných 2 247, tj. naplnění na 105 %) a 497 v PCDV (z 500, tj. naplnění na 99,4 %). Do sběru bylo nakonec zapojeno 41 tazatelů.

Vyhodnocení kvality dat

Použitelnost dat

Následující tabulka ukazuje rozdělení v průzkumu sledovaných jednotek podle své použitelnosti. Použitelnost má vliv na celkovou návratnost. Použitelná domácnost, automobil, osoba a cesta jsou definovány v kapitole Kontrola kvality při zpracování dat.

PoužitelnostDomácnostiAutomobilyOsobyCesty
n%n%n%n%
Použitelné901895,7909598,02107695,35139699,9
Nepoužitelné4014,31902,010464,7380,1
CELKEM9419100,09285100,02212210051434100,0

U domácností byl hlavním důvodem nedostatek použitelných osob v domácnosti (u domácností se třemi a více členy bylo použitelné rozhovory o osobě od minimálně 50 % členů domácnosti, u menších domácností 100 %). U osob byl jediným zdrojem nepoužitelnosti neuvedený věk, u aut rok výroby. U nepoužitelných cest pak pouze chyběly využité dopravní prostředky.

Návratnost

Při kontaktu domácností vyplňovali tazatelé kontrolní list, do kterého zaznamenávali výsledek každé z návštěv. Tabulka 3 představuje rozdělení finálních výsledků návštěv domácností. Většina z řádků tabulky jsou důvody neúspěšného dotazování. Realizovat rozhovor se podařilo u 52,9 % oslovených domácností.

KategorieVýsledekn%
Kvalitativně neutrální výpadekDům/byt není obydlen1340,8
Výpadek z nezastiženíNebezpečné místo310,2
Neumožněn přístup do budovy8594,8
Nikdo není doma940,5
Dom. nedostupná po celou dobu průzkumu10966,1
Jazyková bariéra230,1
Respondent není schopen400,2
Žádný vhodný respondent v domácnosti50,0
Respondent je momentálně pryč/není dostupný60,0
Přerušený rozhovor, nebude dokončen530,3
Přerušený rozhovor, bude dokončen30,0
NAs*453225,4
Výpadek z nezájmuOdmítnutí na úrovni domácnosti: měkké130,1
Odmítnutí na úrovni domácnosti - tvrdé15148,5
Úspěšně dotázaná domácnostZrealizovaný rozhovor941952,9
CELKEM17822100,0

Pozn: *NAs jsou kvůli způsobu výpočtu čistého použitelného výběrového souboru přiřazeny k výpadku z nezastižení.

Tabulka 4 ukazuje nejdůležitější ukazatel úspěšnosti dotazování, tedy tzv. "použitelnou návratnost". Ta v průzkumu dosáhla 51,5 %. Definice jednotlivých ukazatelů uvedených v tabulce naleznete zde.

UkazatelOznačení / výpočetHodnota
Kvalitativně neutrální výpadekVkn134
Výpadek z nezastiženíVnezas6648
Výpadek z nezájmuVnezaj1527
Výpadek z nepoužitelnostiVnep401
Hrubý výběrový souborSh17822
Upravený hrubý výběrový souborShu = Sh - Vkn17688
Čistý výběrový souborSč = Shu - Dnezaj - Dnezas9513
Použitelný čistý výběrový souborSčp = Sč - Dnep9112
Použitelná návratnostNp = Sčp / Shu51,5 %

Zpracování dat

Struktura vstupních dat

Na základě kódovníku dodaného CDV realizátorovi sběru, byly dodány následující datové matice.

  • čistý výběrový soubor domácností (H),
  • čistý výběrový soubor osob (P),
  • čistý výběrový soubor automobilů (C),
  • hrubý výběrový soubor s protokoly o navazování kontaktu (L).
  • čistý výběrový soubor s cestami (T).

Postup kontroly dat

Základní principy kontroly

Při kontrole dat CDV vycházela z tohoto základního postupu:

  • vyhledat chyby v datech a vyznačit je,
  • u každé nalezené chyby je zjistit, na které úrovni pořizování dat vznikla,
  • s ohledem na úroveň chybu - pokud je to možné - opravit,
  • opravu zaznamenat.

Při dohledávání chyb se pracovalo s následujícími úrovněmi zpracování (dále též úrovně chyb):

  1. Respondent (např. nevyplněné položky, překlepy, nepochopení zadání apod).
  2. Tazatel (např. špatně vyplněné dotazníky, překlepy).
  3. Kodér (např. překlepy při digitalizaci dotazníků, hodnoty uvedené do nesprávné proměnné.
  4. Zpracování na straně agentury (např. chybně sestavené matice).
  5. Zpracování dat na straně CDV (např. chyba zpracovacího algoritmu či nevhodný opravný zásah v některém z předchozích opravných skriptů).

Chyby úrovně čtvrté a páté úrovně jsou chyby s dohledatelnou příčinou a vždy docházelo k jejich opravě. Chyby třetí a nižší úrovně mají příčinu jen obtížně dohledatelnou, na první úrovni prakticky neodhalitelnou. Pokud docházelo ke korekci na třech nejnižších úrovních, vždy se jednalo o dobře zdůvodněné, zdokumentované a systematické zásahy.

Při geokódování mohly do procesu vstupovat ještě další četné úrovně vzniku chyb, zejména pak databáze geografických entit.

Kroky zpracování

Kontrola byla rozdělena do řady jednotlivých kroků, které budou popsány níže. Kroky na sebe navazovaly v pevně daném pořadí. Každý z kroků se skládal ze tří obecných úkonů, které se opakovaly, dokud nebyly korigovány všechny opravitelné chyby.

Základní kontrola matic

V první fázi byly ověřovány všechny dodané matice srovnáváním s parametry kódovníku (kompletnost, rozsahy), dále byla kontrolována databázová integrita dodaných dat a následně použitelnost matic domácnosti, osob a aut. Jako poslední krok této fáze je provedena kontrola logických vazeb.

Tabulka 5. Jednotlivé kroky základní kontroly matic
PořadíKontrolaPopis
1Kompletnost proměnnýchKaždá matice je načtena a srovnávána s kódovníkem, co do výčtu proměnných, které má obsahovat.
2Rozsah proměnnýchPodle typu proměnné uvedené v kódovníku jsou postupně všechny proměnné kontrolovány co do přípustného rozsahu, který je opět uveden v kódovníku.
3Integrita datKontrolována je přítomnost a unikátnost primárních klíčů a návaznost klíčů cizích. Např. je kontrolováno, zda každá cesta má svou osobu, zda každá osoba má svou příslušnou domácnost apod.
4Použitelnost datVyhodnocení dat z hlediska použitelnosti, viz definice použitelnosti
5Logické vazbyKontrola logické konzistence dat. Např. kontrola věkových kategorií vůči vlastnictví řidičského oprávnění, stupňům dosaženého vzdělání apod.

Kontrola cest

Jednotlivé cesty v PDCH byly pevně spjaty s ostatními cestami v rozhodném dni. Kontrola tedy musela brát v potaz nejen správnost údajů v rámci jedné cesty, ale její časoprostorovou konzistenci v rámci celodenního řetězce.

Rekódování atributů cest

U dvou atributů cest v PDCH - účelu a použitých dopravních prostředků - dostává respondent možnost zvolit možnost "jiné" a uvést alternativu nenabídnutou CD, jedná se tedy tzv. otevřenou otázku. Odpovědi na otevřené otázky je třeba rekódovat dle alternativ uvedených v CD.

Tabulka 6. Jednotlivé kroky kontroly rekódování atributů cest
PořadíKontrolaPopis
1Rekódování účelůZakódování odpovědí na otevřenou otázku po účelu cesty do alternativ nabídnutých cestovním deníkem.
2Rekódování použitých dopravních prostředkůZakódování odpovědí na otevřenou otázku po použitých dopravních prostředcích do alternativ nabídnutých cestovním deníkem
Kontrola cest z hlediska časových atributů

Každá z cest má řadu časových atributů:

  • datum rozhodného dne;
  • časové razítko začátku cesty;
  • časové razítko konce cesty;
  • indikátor dne konce cesty (týž den co započala / následující den);
  • čas strávený v dopravních jednotlivých (využitých) dopravních prostředcích;
  • pořadí cesty v rámci rozhodného dne.

U těchto atributů bylo třeba zkontrolovat nejen jejich kompletnost, ale také vzájemnou posloupnost a také koherenci cest i jejich řetěz/ců.

Chybějící údaje lze často úspěšně pravit, neboť atributy jsou do jisté míry redundantní - například trvání cesty lze dovodit jak z rozdílu počátečního a koncového času, tak ze součtu časů strávených v dopravních prostředcích.

Chyby v očekávané posloupnosti lze také poměrně jednoduše opravit. Jedná se například o situaci, kdy koncový čas cesty předchází výchozímu, nebo když pořadí cesty neodpovídá časovým údajům. Chyby v posloupnosti lze opravit obrácením pořadí, je však vždy nutno zkontrolovat, zda tímto krokem nevznikly další problémy, zejména z hlediska koherence řetězců cest.

Nejkomplikovanější byly opravy koherence, tedy případů, kdy jsou v atributy cest v rozporu. K nekoherencím může dojít buď na úrovni cest, zejména se sleduje:

  • nesoulad mezi celkovým časem stráveným v dopravních prostředcích a rozdílem počátečního času;
  • překryv začátku cesty s koncem cesty předchozí;
  • nesoulad mezi pořadím cesty a počátečním a koncovým časem;
  • výpadek v pořadí cest;
  • opakující se pořadová číslovka v pořadí cest.
Tabulka 7. Jednotlivé kroky kontroly cest z hlediska časových atributů
PořadíKontrolaPopis
1Chybějící časyNalezení chybějících časů pokus o jejich opravu či imputaci pomocí časů strávených v dopravních prostředcích
2Časový sled počátků a konců cestKontrola a oprava následnosti časů v rámci jednotlivých cest
3Pořadí cestKontrola pořadí cest u jednotlivých osob (nekompletní řady, zdvojená pořadí, nesoulad s uvedenými časy)
4Použitelnost cestVyhodnocení dat z hlediska použitelnosti, viz definice použitelnosti.
5Kontrola řetězců cestKontrola řetězců cest z hlediska logiky uvedených účelů, hledání chybějících cest (typicky chybějící návraty domů na konci celodenního řetězce)
Kontrola časoprostorových atributů

Po kontrole časových atributů byly doplňovány atributy prostorové - cíle cest byly respondenty zaznamenány pomocí adresy či jen popisu místa. Tyto polostrukturované až otevřené vstupy bylo nutno převést do prostorových, aby bylo možné vypočíst délku cest po síti. Na základě vypočtených vzdáleností a respondenty uvedených časových a prostorových údajů (odhad délek cest) pak bylo možné cesty validizovat.

Tabulka 8. Jednotlivé kroky kontroly cest u PDCH z hlediska prostorových atributů
PořadíKontrolaPopis
1GeokódováníZtotožňování lokací uvedených v denících s elementy databáze geografických entit (adresní místa, ulice, obce, části obcí, oblasti, státy apod)
2Výpočet vzdálenostíVýpočet vzdáleností mezi zdroji a cíli cest
3Validizace vzdálenostíValidizace geokódování a výpočtu vzdáleností

Doplňování atributů cest

Rekódování účelů

Respondenti si celkem u 6 % cest nedokázali vybrat z nabízených možností, vyznačili typ účelu jako "jiný" a popsali jej. Analýzou těchto záznamů bylo možné značnou část cest s jiným účelem rekategorizovat podle výskytu charakteristických znakových řetězců. Změny v zastoupení jednotlivých účelů cest po rekódování ukazuje následující tabulka.

Tabulka 9. Změny v členění účelů po rekódování
ÚčelPůvodní členěníUpravené členění
Název účeluKódn%n%
Návrat do bydlištěH2096640,82096640,8
Do práceW918917,9918917,9
Nákupy, službyS519310,1520610,1
Volnočasová aktivitaL50579,8609811,9
VzděláváníE3062630626
Soukromé zařizováníM27735,437977,4
V rámci práce (služební)B1562315623
StravováníF5531,15691,1
Jiný účelO307969851,9
Celkem5143410051434100

Klasifikace hlavního dopravního módu

V průzkumu respondenti měli možnost zaznamenat kombinace dopravních módů (například cestu na vlak osobním automobilem a cestu vlakem). Pro účely dalších analýz bylo třeba redukovat a rekategorizovat seznam možných kombinací na ty nejvíce frekventované.

Následující tabulka ukazuje zastoupení 12 kombinací, které se u cest vyskytly.

Tabulka 10. Kombinace přepravních modů u cest
KombinacePočet cest [n]Podíl cest [%]
Auto2003538,95
Auto + MHD500,10
Auto + VHD560,11
Bus mimoměstský16663,24
Kolo23044,48
MHD754014,66
Ostatní3600,70
Pěšky1823535,45
VHD+MHD4960,96
Vlak6311,23
Vlak + Bus mimoměstský240,05
Neuvedeno370,07

S ohledem na frekvenci zastoupení kombinací modů byl pro další analýzu vybrány tyto hlavní mody:

Tabulka 11. Finální rozdělení Kombinace přepravních modů u cest
Hlavní módPočet cest [n]Podíl cest [%]
Pěšky1820335,39
Kolo23044,48
MHD751714,61
Bus19633,82
Vlak9031,76
Auto, jako řidič1500629,18
Auto, jako pasažér50869,89
Ostatní4150,81
Neuvedeno370,07

Rozčlenění bylo provedeno na základě následujícího postupu.

Obrázek 1. Schéma rozdělení kombinací módů do hlavního módu
rozcleneni_modu

Geokódování

V procesu geokódování jsme ztotožňovali vstupní polostrukturované textové údaje o cíli cesty s položkami databáze geografických objektů, kterou jsme pro tento účel vytvořili. Tato databáze vycházela zejména za údajů databáze RUIAN, zdrojů ČSÚ a dalších veřejně dostupných zdrojů. Ztotožňování s databázovými záznamy bylo prováděno zejména z důvodu schopnosti zpětné kontroly procesu a možné validace výsledků, což by při pouhém dohledávání souřadnic nebylo možné.

Ztotožňování postupně probíhalo na několika úrovních, od ztotožnění obce k identifikaci ulice až k nejnižší úrovni, domu. Databáze byla postupně rozšiřována o další objekty, které neodpovídají logice adresního bodu, ať už jde u širší administrativní celky, toponyma apod. Na úrovni domů byly entitám přiřazeny souřadnice adresních bodů, na vyšší úrovních se jednalo o souřadnice centroidů.

Proces geokódování byl proveden u cest 18 036 osob, které během rozhodného dne uskutečnily alespoň jednu cestu. Celkem byla ztotožněna cílová lokace u 96,2 % cest z celkových 51 434.

Po geokódování cílových lokací byly pro každou z cest doplněny geokódované lokace výchozí. V deníku respondenti neuváděli obě místa, pouze cíl. Informace o lokaci výchozí bodu cesty byly převzaty z cíle cesty předchozí. Z celkového počtu 51 434 mělo kompletní pár zdroj-cíl 92,3 % cest.

Závěrem bylo u kompletních cest ověřeno, zda je kombinace zdroje a cíle cesty přípustná z hlediska logiky řetězců cest či pozice v hierarchii geografických entit. Kontrola této přípustnosti je důležitá pro zvýšení validity výpočtu délek cest. Cestu nebylo možno považovat za přípustnou, pokud vztah jeho počátečního a cílového bodu splňoval následující kritéria:

  • Zdroj a cíl jsou shodné. Jde vlastně o cesty bez cíle, například cesty, které začínají v místě bydliště a tamtéž končí. Při výpočtu vzdálenosti bychom získali nulovou vzdálenost.
  • Zdroj a cíl nejsou ztotožněny na stejné hierarchické úrovni, ale jejich nejnižší společná úroveň je shodná. Například může jít o cestu, kde je výchozím bodem ulici v městě X, přičemž cílovým bod je v tomtéž městě v město X.

Požadavek na přípustnost dokázalo naplnit 79,6 % cest (z celkových 51 434).

Výpočet vzdáleností

Do výpočtu vzdáleností vstupovalo 40 952 přípustných cest. Kromě získání samotné délky cesty bylo cílem tohoto procesu i získání důležitého vstupu pro zpětnou validizaci geokódování.

Vzhledem k možnostem dopravní sítě se úspěšně podařilo vypočítat 40 861 (99,8 %) z přípustných cest. Neúspěšně vypočtené cesty nebyly vypočteny z důvodů přílišné blízkosti počátečních a cílových lokací nebo nedostupnosti dat dopravní sítě.

Validizace vzdáleností cest

Cesty byly validizovány jednak na základě údajů uvedených respondenty, jednak z vypočtených vzdáleností.

Respondentem deklarovaná délka a čas cesty vychází z cestovního deníku, kde respondent uvádí čas začátku a konce cesty a rovněž vzdálenost, kterou urazil. V obou případech se jedná o odhad, přičemž především odhad délky cesty respondenta nemusí být přesný. Respondenti navíc často svůj odhad délky cesty neuváděli a rovněž v deklarovaných časech mohou být uvedeny chyby.

Pro výpočet časů a délek cest po příslušné dopravní síti vychází z respondentem deklarovaného místa začátku a konce cesty. Výpočet časy a délky cest je potřeba k doplnění údajů tam, kde je respondent sám neuvedl, ale zároveň je důležitý pro výpočet alternativních způsobů dopravy pro model volby dopravního módu.

Validizace vypočtených časů a délek cest si kladla dva cíle. Za prvé stanovit, jakou důvěru můžeme mít k doplněnému údaji o čase a délce cesty, pokud tento údaj respondent neuvedl. Za druhé stanovit podsoubor cest, které jsou použitelné pro odhad modelu volby dopravního módu.

Validizace vycházela z porovnání vypočtených a deklarovaných hodnot. Tyto údaje se pochopitelně liší a je proto potřeba nejprve stanovit kritérium, podle kterého by bylo možné vypočtené časy a délky považovat za dobré. K tomuto účelu byl vybrán soubor cest, kde je respondentem uveden čas i délka cesty a kde záznam o zdroji a cíli cesty umožnil kvalitní geokódování na úroveň adresy. Pro tyto cesty byly vypočítány absolutní hodnoty absolutních a relativních rozdílů mezi deklarovanými a vypočtenými časy a délkami cest.

Pro tyto míry se hledaly kriteriální prahové hodnoty, tak, aby 90 % podsouboru "věrohodných" cest splňovalo alespoň jedno z těchto kritérií.

Validní vzdálenosti a cestovní časy se podařilo najít k 69,87 % ze všech cest (51 434). Pro zobrazování distribuce cest a výpočty modelu volby dopravního módu doporučujeme používat pouze tyto cesty.

V následující tabulce je zobrazeno procentuální zastoupení hlavních dopravních módů v celém souboru a v souboru validních cest.

Tabulka 12. Uplatnění validačních kritérií na celý soubor, rozdělení dle hlavního modu
Hlavní dopravní módVšechny cesty [%]Důvěryhodné cesty [%]
Pěšky35,431,1
Kolo4,54,2
MHD14,616,1
Autobus3,83,8
Vlak1,81,6
Auto-řidič29,231,6
Auto-pasažér9,911
Ostatní0,80,5

Odkazy

  • Armoogum, J. (2014). Survey Harmonisation with New Technologies Improvement. Les collections de L'INRETS. Dostupné online.
  • Biler S., Kouřil P., Rusý P., Staněk M., Šenk P. 2014. Metodika aktivitně-cestovního průzkumu. Metodika certifikovaná Ministerstvem dopravy ČR. Dostupné online.
  • Eurostat, 2018. Guidelines on Pasenger Mobility Statistics. Eurostat. Dostupné online.
  • Fellendorf M., Herry M., Karmasin H., Klementschitz R., Kohla B., Meschik M., Rehrl K., Reiter T., Sammer G., Schneider C., Sedlacek N., Tomschy R., Wolf E. 2011. KOMOD - Konzeptstudie Mobilitätsdaten Österreichs: Handbuch für Mobilitätserhebungen. Bundesministeriums für Verkehr, Innovation und Technologie, Programmlinie ways2go des Forschungs und Technologieprogramms iv2splus. Dostupné online.
  • Gabrhel, V., Kouřil, P., Melzer, Z. (2016). "Česká republika v pohybu: Návrh celostátního průzkumu dopravního chování". Dopravní inženýrství, roč. 16, č. 2, s. 20-23. ISSN 1801-8890.
  • Šenk, P., Kouřil, P. (2014) "Průzkumy dopravního chování v ČR a zahraničí. Potřebujeme národní průzkum?" Dopravní inženýrství, č. 1, s. 24-26. ISSN 1801-8890.
Průzkum Česko v pohybu je součástí projektu Specifické parametry a nastavení limitních a realizace Celostátniho průzkumu dopravního chování - Česká repuplika v pohybu je a je realizován s podporou Ministerstva dopravy České republiy

Copyright © 2022
Centrum dopravního výzkumu, v. v. i.