'Big data' is de nieuwe wetenschap van begrip en voorspelling van menselijk gedrag door het bestuderen van grote hoeveelheden ongestructureerde gegevens. Big data wordt ook wel 'voorspellende analyse' genoemd.
Analyse van Twitter-berichten, Facebook-feeds, eBay-zoekopdrachten, GPS-trackers en geldautomaten zijn enkele voorbeelden van big data. Het bestuderen van beveiligingsvideo's, verkeersgegevens, weerpatronen, aankomsten van vluchten, logboeken van mobiele telefoontoren en hartslagtrackers zijn andere vormen. Big data is een rommelige nieuwe wetenschap die wekelijks verandert, en slechts een paar deskundigen begrijpen het allemaal.
Wat zijn enkele voorbeelden van Big Data in het reguliere leven?
Hoewel de meeste big data-projecten erg obscuur zijn, zijn er succesvolle voorbeelden van big data die van invloed zijn op het dagelijks leven van individuen, bedrijven en overheden:
Voorspellen van virusuitbraken: door socio-politieke gegevens, weer- en klimaatgegevens en ziekenhuis / klinische gegevens te bestuderen, voorspellen deze wetenschappers nu dengue-koortsuitbraken met 4 weken van tevoren.
Homicide Watch: deze big data projectprofielen vermoorden slachtoffers, verdachten en criminelen in Washington, DC. Zowel om de overledene te eren als om mensen bewust te maken, is dit big data-project fascinerend.
Transit Reisplanning, NYC: WNYC-radioprogrammeur Steve Melendez combineerde het online metroschema met reisroute-software. Met zijn creatie kunnen New Yorkers hun locatie op de kaart aanklikken en wordt een voorspelling van reistijd voor treinen en metro weergegeven.
Xerox verminderde het personeelsverlies: callcenterwerk is emotioneel uitputtend. Xerox heeft veel gegevens bestudeerd met behulp van professionele analisten, en nu kunnen ze voorspellen welke callcenterpersoneelsleden waarschijnlijk het langst bij het bedrijf zullen blijven.
Ondersteuning van terrorismebestrijding: door sociale media, financiële gegevens, vluchtreserveringen en veiligheidsgegevens te bestuderen, kan wetshandhaving terroristische verdachten voorspellen en lokaliseren voordat ze hun slechte daden verrichten.
Aanpassen van merkmarketing op basis van reviews van sociale media: mensen delen botweg en snel hun online gedachten over een pub, restaurant of fitnessclub. Het is mogelijk om deze miljoenen sociale media-berichten te bestuderen en feedback te geven aan het bedrijf over wat mensen van hun diensten vinden.
Wie gebruikt Big Data? Wat doen ze ermee?
Veel monolithische bedrijven gebruiken big data om hun aanbod en prijzen aan te passen om de klanttevredenheid te maximaliseren.
- Macy's warenhuisgebruikt bijvoorbeeld big data om hun prijzen on the fly aan te passen voor meer dan 70 miljoen producten. Ze sturen zelfs op maat gemaakte e-mails naar hun klanten op basis van wat Macy's gelooft dat ze geïnteresseerd zijn.
- Reactie van politie op de bombardementen op de Boston Marathon: door big data te gebruiken voor het bestuderen van video- en surveillancebeelden, kon de politie hun zoektocht naar de verdachten snel beperken.
- Morton's Steakhouse maakt gebruik van Twitter om marketingstunts uit te voeren, waaronder de beroemde bezorging van een biefstuk- en garnaaldiner door een luchthaven in New Jersey.
- Visa gebruikt big data om fraudeurs te identificeren en te vangen.Enkele transacties hier en daar kunnen een oneerlijke creditcardgebruiker gemakkelijk verbergen, maar door miljoenen transacties zorgvuldig te bekijken, kunnen fraudepatronen worden opgespoord.
- Facebook gebruikt big data om reclame aan te passen. Door je FB-voorkeuren en surfgewoonten zorgvuldig te bestuderen, heeft de socialemediagigant griezelig inzicht in je smaak. Die zijbalkadvertenties die u op uw Facebook-feed ziet, worden gekozen door zeer bewuste en complexe algoritmen die uw Facebook-gewoonten hebben gevolgd.
Waarom is big data zo groot?
4 dingen maken big data aanzienlijk:
1. De gegevens zijn enorm. Het past niet op een enkele harde schijf, laat staan op een USB-stick. Het gegevensvolume is veel groter dan wat de menselijke geest kan waarnemen (denk aan een miljard miljard megabytes, en vermenigvuldig dat dan met meer miljarden).
2. De gegevens zijn rommelig en ongestructureerd. 50% tot 80% van het big data werk is het omzetten en opschonen van de informatie, zodat deze doorzoekbaar en sorteerbaar is. Slechts een paar duizend experts op onze planeet weten volledig hoe ze deze gegevensopruiming moeten doen. Deze experts hebben ook zeer gespecialiseerde tools nodig, zoals HPE en Hadoop, om hun vak te doen. Misschien in 10 jaar tijd zullen big data-experts een dozijn worden, maar voor nu zijn ze een zeer zeldzame soort analist en hun werk is nog steeds erg obscuur en vervelend.
3. Data is een commodity ** geworden die kan worden verkocht en gekocht. Er zijn gegevensmarktplaatsen waar bedrijven en individuen terabytes aan sociale media en andere gegevens kunnen kopen. De meeste gegevens zijn gebaseerd op de cloud, omdat deze te groot is om op een enkele harde schijf te passen. Het kopen van gegevens brengt vaak een abonnementskosten met zich mee, waarbij u op een cloud server farm aansluit.
** De leiders van big data tools en ideeën zijn Amazon, Google, Facebook en Yahoo. Omdat deze bedrijven zoveel miljoenen mensen bedienen met hun online services, is het logisch dat zij het verzamelpunt en de visionairs achter big data-analyse zijn.4. De mogelijkheden van big data zijn eindeloos. Misschien zullen artsen op een dag hartaanvallen en beroertes voorspellen voor individuen weken voordat ze gebeuren. Vliegtuig- en auto-ongevallen kunnen worden verminderd door voorspellende analyses van hun mechanische gegevens en verkeers- en weerpatronen. Online dating kan worden verbeterd door het hebben van big data-voorspellers van wie compatibele persoonlijkheden voor u zijn. Muzikanten kunnen inzicht krijgen in welke muziekcompositie het meest aantrekkelijk is voor de veranderende smaak van doelgroepen.Voedingsdeskundigen kunnen misschien voorspellen welke combinatie van door de winkel gekochte voedingsmiddelen de medische toestand van een persoon verergert of helpt. Het oppervlak is alleen bekrast en ontdekkingen in big data gebeuren elke week.
Big data is rommelig
Big data is voorspellende analyse: het omzetten van enorme ongestructureerde gegevens naar iets dat doorzoekbaar en sorteerbaar is. Dit is een rommelige en chaotische ruimte die een speciale vorm van kennis en geduld vereist.
Neem bijvoorbeeld de monolithische UPS-bezorgservice. De programmeurs bij UPS bestuderen gegevens van de GPS en smartphones van hun chauffeurs om de meest efficiënte manieren te analyseren om zich aan verkeerscongestie aan te passen. Deze GPS- en smartphonegegevens zijn gigantisch en niet automatisch klaar voor analyse. Deze gegevens worden ingekapseld vanuit verschillende GPS- en kaartdatabases via verschillende smartphoneapparaten. UPS-analisten hebben maandenlang al die gegevens omgezet in een indeling die gemakkelijk kan worden doorzocht en gesorteerd. De moeite is het echter waard geweest. Tegenwoordig heeft UPS meer dan 8 miljoen gallons brandstof bespaard sinds deze big data-analyse werd gebruikt.
Omdat big data rommelig is en zo veel moeite kost om op te ruimen en voor te bereiden op gebruik, hebben data scientists de bijnaam 'data portiers' gekregen voor al het vervelende werk dat ze doen.
De wetenschap van big data en voorspellende analyses verbetert echter elke week. Verwacht dat big data tegen het jaar 2025 voor iedereen gemakkelijk toegankelijk zal zijn.
Zijn Big Data geen bedreiging voor privacy?
Ja, als onze wetten en individuele privacyverdedigingen niet zorgvuldig worden beheerd, dan dringt big data in persoonlijke privacy. In de huidige toestand houden Google en YouTube en Facebook al je dagelijkse online gewoonten bij. Uw smartphone en computerleven laten elke dag digitale voetstappen achter en geavanceerde bedrijven bestuderen die voetafdrukken.
De wetten rond big data evolueren. Privacy is een staat van zijn waar je nu zelf verantwoordelijkheid voor moet nemen, omdat je het niet langer als een standaardrecht kunt verwachten.
Wat u kunt doen om uw privacy te beschermen:
De grootste stap die je kunt zetten, is je dagelijkse gewoonten te verbergen met behulp van een VPN-netwerkverbinding. Een VPN-service versleutelt uw signaal zodat uw identiteit en locatie ten minste gedeeltelijk worden gemaskeerd door trackers. Dit maakt je niet 100% anoniem, maar een VPN zal aanzienlijk verminderen hoeveel de wereld jouw online gewoonten kan observeren.
Waar kan ik meer leren over big data?
Big data is een fascinerend iets voor mensen met een analytische geest en een liefde voor technologie. Als dat u is, bezoek dan zeker deze pagina met interessante big data-projecten.