Termín BigData označuje zpracování velkého množství uložených dat, přičemž výsledkem je určitá statistika. A často velmi zajímavá a užitečná. Velké plány s tímto novým oborem má celá řada společností, mezi nimi například i mobilní operátoři, kteří mají k dispozici opravdu velké množství dat o pohybu a chování svých uživatelů, které se ukládají. Znát polohu telefonního čísla v reálném čase je totiž základním předpokladem pro fungování sítě mobilního operátora. Signalizační data operátora umožňují anonymně analyzovat aktuální rozložení obyvatelstva v regionu nebo celé ČR i mobilitu obyvatel v prostoru a čase. Proč tedy taková data nevyužít pro státní správu nebo komerčně?

Hlavně anonymně
Zde je nutno zmínit, že veškerá data jsou přísně anonymizována sofistikovanými algoritmy, které se pravidelně mění, aby nemohlo dojít ke zneužití. Pracovníci, kteří tato data zpracovávají, nemají přístup k datům o pohybu jednotlivých uživatelů nebo malých skupin a taková data se ani nedostanou do konečných statistik. Pokud například ve statistice vyjde v některém ze sledovaných parametrů příliš malá skupina lidí nebo například jen jeden člověk, ve statistice se anonymizují a zobrazí se například jen ve skupině ostatní. Ze statistiky tak například není možné zjistit, že v daný jeden den cestoval mezi určitými dvěma městy jeden konkrétní člověk. Veškeré datové zdroje se navíc po zpracování mažou.

Že jsou Big Data bezpečná (nebo by alespoň měla být), už víme. Kde je ale možné je využít? Možností je celá řada. Mohou pomoci optimalizovat městkou i meziměstskou hromadnou dopravu i dopravu obecně, efektivní řízení cestovního ruchu, rozvoj měst a samozřejmě i v komerční sféře. Který majitel hypermarketu by nechtěl vědět, odkud přesně k němu lidé nejčastěji dojíždějí a efektivně zacílit propagaci na dané území. Nebo naopak na úplně jiné, kde má naopak slabiny.

Celé odvětví Big Dat je ale zatím v plenkách a projekty mobilních operátorů, kteří by takto svá data za úplatu poskytli, byste mohli v Evropě spočítat na prstech svých rukou. V USA jsou již o něco dále, ale stále se jedná spíše o první vlaštovky. V Česku se za pomocí Big Dat například sestavily zajímavé grafy pohybu obyvatel po Praze v denních a nočních hodinách, monitorování dopravních proudů na silnicích v ČR a pomocí dat od operátorů se například i plynule reguluje provoz pomocí elektronických tabulí na dálnici D1.
Spočítaná Šumava
Big Data se výborně hodí také pro měření návštěvnosti v oblastech, kde efektivní počítání turistů a návštěvníků obecně není možné. Jako například na Šumavě. Místo toho, aby byli po celém parku rozmístěny desítky lidí počítajících auta i procházející turisty, využijí se data o pohybu ze sítě operátora.
Proto se T-Mobile s konzultantskou společností KPMG rozhodl společně s Národním parkem Šumava provést pilotní Big Data projekt právě na Šumavě. Cílem bylo zjistit, odkud nejčastěji na Šumavu návštěvníci jezdí, a to nejen v rámci České republiky, ale i ze zahraničí. Protože i to operátor jednoduše pozná, protože zahraniční telefon přihlášený do sítě T-Mobile automaticky hlásí také svého domácího operátora a zemi.

T-Mobile má samozřejmě přístup k datům o poloze pouze svých uživatelů, na zákazníky ostatních operátorů nevidí. I na to ale růžový operátor myslel a statisticky data přepočítává na celou populaci. Určitě vás napadlo, že do dané statistiky přeci musí výrazně promluvit i obyvatelé obcí přímo na Šumavě, kteří za prací dojíždějí mimo region a poté zpět. Jak vlastně operátor pozná, že daný telefon, který jede na Šumavu, nepatří obyvateli Kvildy ale Pražanovi? Je to jednoduché. Z dat je vidět, kde se člověk zdržuje v noci, a pokud je telefon několik nocí po sobě v různých časových obdobích před měřením na stejném místě v obci na Šumavě, je jasné, že jde o místního obyvatele a do statistik se nezapočítá.
Cílem projektu bylo spočítat denní a celkový počet návštěvníků v oblasti Lipna a oblasti Kvildy, Modravy a Horské Kvildy na přelomu let 2013 a 2014, zjistit odkud na Šumavu přijeli, jak dlouho zde zůstali a kam podnikali výlety.

A co T-Mobile s KPMG zjistili? Nejvíce turistů přijelo na Šumavu bez překvapení z Prahy, na druhém a třetím místě pak skončil Český Krumlov a Klatovy. Překvapivé je, že rozdíl mezi Prahou a Českým Krumlovem není tak velký. Nejvíce návštěvníků ze zahraničí pak dorazilo z Nizozemska, v těsném závěsů se pak drží Německo. Z výrazným odstupem se pak umístily další země. Celkově dorazilo na Šumavu ve sledovaném období 260 tisíc návštěvníků, z toho 24 % bylo ze zahraničí. Je také vidět, že daleko více táhne oblast Lipna, která je pro turistický ruch lépe vybavena. Evidovala o 37 % turistů více než oblasti Kvildy a Modravy dohromady.

V současné době T-Mobile a KPMG jednají s Národním parkem Šumava o rozšíření projektu a provedení celoročního sledování pro zisk dat, která by byla pro park určitě velmi zajímavá. Zpracování Big Dat je ale poměrně náročná záležitost a operátor i KPMG si za výsledky samozřejmě nechávají zaplatit, částku však zúčastněné strany prozradit nechtěly. Pokud se podaří vyjednat podmínky přijatelné pro obě strany, můžeme se brzy dočkat podrobnější průzkumu. Zároveň T-Mobile další možnosti uplatnění Big Dat.