Miks peaksite segunema, kui saate juba Tableau's liituda?



Andmete segamine tabelis - meetod, mida kasutatakse juhul, kui seonduvad andmed on mitmes andmeallikas, mida soovite koos analüüsida ühes vaates.

Maailmas, mis genereerib ja tarbib 2,5 kvintiljonit baiti päevas, peavad organisatsioonid optimaalse efektiivsuse saavutamiseks otsima uusi meetodeid andmete teisendamiseks ja kombineerimiseks. Üks selline andmete ühendamise meetod on Andmete segamine tabelis .

Kuna see teenib iga konkreetse organisatsiooni andmetsüklis nii olulist eesmärki, on see enamikus väga oluline moodul . Selles blogis käsitleme järgmisi mõisteid:





Miks vajate Tableau's andmete segamist?

Oletame, et olete a Arendaja tabel kellel on Salesforce'i salvestatud tehinguandmed ja Accessisse salvestatud kvoodiandmed. Kombineeritavad andmed on salvestatud erinevatesse andmebaasidesse ja igas tabelis hõivatud andmete detailsus on kahes andmeallikas erinev, seega on andmete kombineerimine parim viis nende andmete ühendamiseks.

Andmete segamine on kasulik järgmistel tingimustel:



  1. Soovite ühendada andmed erinevatest andmebaasidest, mida andmebaasideülesed liitumised ei toeta.

    Andmebaasideülesed liitumised ei toeta ühendusi kuubikutega (näiteks Oracle Essbase) ega mõne ainult ekstraktiühendusega (näiteks Google Analytics). Sel juhul seadistage analüüsitavate andmete jaoks individuaalsed andmeallikad ja seejärel ühendage andmete segamine andmeallikate ühendamiseks ühel lehel.

  2. Andmed on erineval detailsusel.

    Mõnikord hõivab üks andmekogum andmeid mitmesuguste andmete abil üksikasjad st suurem või väiksem täpsus kui teine ​​andmekogum.

    Oletame näiteks, et analüüsite tehinguandmeid ja kvoodiandmeid. Tehinguandmed võivad hõlmata kõiki tehinguid. Kvoodiandmed võivad siiski koondada tehinguid kvartali tasemel. Kuna tehinguväärtused on igas andmekogumis hõivatud erineva detailsusastmega, peaksite andmete ühendamiseks kasutama andmete segamist.



Mis on andmete segamine tahvelarvutis?

Andmete segamine on Windowsis väga võimas funktsioon Juhatus . Seda kasutatakse juhul, kui seonduvad andmed on mitmes andmeallikas, mida soovite koos analüüsida ühes vaates. See on meetod andmete ühendamiseks, mis täiendab ühe andmeallika andmete tabelit teise andmeallika andmete tulpadega.

Tavaliselt kasutate andmete kombineerimiseks liitumisi, kuid on aeg, sõltuvalt sellistest teguritest nagu andmete tüüp ja nende detailsus, kui andmete segamine on parem.

Kuidas see erineb andmete ühendamisest?

Andmete segamine simuleerib traditsioonilist vasakpoolset liitumist. Peamine erinevus nende kahe vahel on millal liitmine toimub liitmise suhtes.

Vasak liitumine

Kui kasutate andmete ühendamiseks vasakpoolset liitumist, saadetakse päring andmebaasi, kus liitmine toimub. Vasakpoolse liitmise abil tagastatakse kõik vasakpoolse tabeli read ja kõik parempoolse tabeli read, millel vasakus tabelis on vastav rida. Seejärel saadetakse liitumise tulemused Tableau'le tagasi ja liidetakse.

Oletame näiteks, et teil on järgmised tabelid. Kui ühised veerud on kasutaja ID , vasakpoolne liitumine võtab kõik vasakpoolse tabeli andmed ja ka parempoolse tabeli andmed, kuna igal real on vasakus tabelis vastav rida.

Andmete ühendamine - andmete segamine tabelis - EdurekaAndmete segamine

Kui kasutate andmete ühendamiseks andmete ühendamist, saadetakse andmebaasi iga lehel kasutatud andmeallika päring. Päringute tulemused, sealhulgas koondandmed, saadab Tableau tagasi ja ühendab. Vaade kasutab kõiki esmase andmeallika ridu, vasakpoolset tabelit ja teisese andmeallika, parempoolse tabeli, agregeeritud ridu, lähtudes linkimisväljade mõõtmetest.

sorteeri massiiv c ++

Saate muuta linkimisvälja või lisada rohkem linkimisvälju, et lisada segusse teisese andmeallika erinevad või täiendavad andmeread, muutes koondatud väärtusi.

Oletame näiteks, et teil on järgmised tabelid. Kui linkimisväljad on kasutaja ID Mõlemas tabelis võtab teie andmete segamine kõik vasakpoolse tabeli andmed ja täiendab vasakut tabelit parempoolse tabeli andmetega. Sel juhul ei pruugi kõik väärtused olla tulemuseks oleva tabeli osa järgmiste toimingute tõttu:

  • Vasakpoolse tabeli real pole parempoolses tabelis vastavat rea vastet, nagu näitab nullväärtus.
  • Parempoolse tabeli ridades on mitu vastavat väärtust, nagu tähistab tärn (*).

Oletame, et teil on samad tabelid nagu eespool, kuid teisese andmeallika sisaldab uut välja nimega Eesmärgid . Jällegi, kui linkimisväli on kasutaja ID , võtab teie andmete segamine kõik andmed vasakust tabelist ja täiendab neid parempoolse tabeli andmetega. Sel juhul näete eelmises näites sama nullväärtust ja tärne lisaks järgmisele:

  • Sest Eesmärgid väli on mõõt, näete rea väärtusiEesmärgidväli, mis on liidetud enne, kui paremas tabelis olevad andmed on ühendatud vasaku tabeli andmetega.
  • Nagu eelmises näites, pole vasakpoolse tabeli real ka rea ​​jaoks vastavat rida Eesmärgid väli, nagu näitab teine ​​nullväärtus.

Millal asendada liitumine Segamine

1. Andmed vajavad puhastamist.

Kui teie tabelid ei ühti pärast liitumist omavahel õigesti, seadistage igale tabelile andmeallikad, tehke kõik vajalikud kohandused (see tähendab, nimetage veerge ümber, muutke veergude andmetüüpe, looge rühmi, kasutage arvutusi jne) ja seejärel kasutage andmete ühendamiseks andmete segamist.

2. Liitumised põhjustavad andmete dubleerimist.

Andmete duplikaadid pärast liitumist on erineva detailsusastmega andmete sümptom. Kui märkate andmete dubleerimist, kasutage liitmise loomise asemel ühise mõõtme ühendamiseks andmete segamist.

3. Teil on palju andmeid.

Tavaliselt on liitumisi soovitatav kasutada sama andmebaasi andmete ühendamiseks. Liitumisi haldab andmebaas, mis võimaldab liitumistel kasutada mõnda andmebaasi loomulikku võimekust. Kui töötate aga suurte andmekogumitega, võivad liitumised andmebaasi koormata ja oluliselt jõudlust mõjutada. Sellisel juhul võib abi olla andmete segamisest. Kuna Tableau tegeleb andmete kombineerimisega pärast andmete liitmist, on kombineeritavaid andmeid vähem. Kui ühendamiseks on vähem andmeid, paraneb jõudlus üldiselt.

Andmete segamine tabelis

Andmete segamist saate kasutada, kui teil on andmeid eraldi andmeallikates, mida soovite koos analüüsida ühel lehel. Tableau'l on kaks sisseehitatud andmeallikat Proovi-superpood ja Proovikohvikett.mdb mida kasutatakse andmete segamise illustreerimiseks.

1. samm: ühendage oma andmed ja seadistage andmeallikad

  • Looge ühendus andmekogumiga ja seadistage andmeallikas andmeallika lehele. Üks inbuilt andmeallikas Proovikohvikett.mdb ,mis on MS Accessi andmebaasifail, kasutatakse andmete segamise illustreerimiseks.
  • Minema Andmed > Uus andmeallikas, looge ühendus teise andmekogumiga.Selles näites kasutatakse Näide - superpood andmeallikas. Tkana seadistas andmeallika.
  • Vaate koostamise alustamiseks klõpsake vahekaarti lehel.

2. samm: määrake esmane andmeallikas

  • Lohistage vähemalt üks väli oma peamisest andmeallikast vaatesse, et määrata see peamiseks andmeallikaks. Aastal Andmed Klõpsake paanil andmeallikat, mille soovite määrata peamiseks andmeallikaks. Selles näites Proovikohvikett on valitud.
  • Järgmisel ekraanipildil kuvatakse failis olevad erinevad tabelid ja ühendused.

3. samm: määrake teisese andmeallika

  • Andmeallikate vaates kasutatavad väljad, mis ei ole peamine andmeallikas ega aktiivsed lingid, määravad järgnevad andmeallikad automaatselt sekundaarseks andmeallikaks. Sel juhul Proovi superkauplus.

4. samm: ühendage andmed

  • Nüüd saate mõlema allika andmed integreerida ühise mõõtme põhjal ( Osariik , sel juhul). Pange tähele, et dimensiooni - olek - kõrval kuvatakse väike lingipilt. See näitab kahe andmeallika ühist mõõdet.
  • Oletame, et loote tulpdiagrammi Kasumi suhe veergude riiulis ja Osariik Riiulil näitab diagramm, kuidas kasumimäär kõigis osariikides varieerub nii super- kui ka kohvikukauplustes.

Andmete segamise piirangud tabelis

  1. Mittelisandlike agregaatide ümber on mõned andmete segamise piirangud, näiteks KESKMINE ja RAWSQLAGG .
  2. Andmete segamine kahjustab päringu kiirust suure täpsusega.
  3. Kui proovite sorteerida arvutatud välja järgi, mis kasutab segaandmeid, ei kuvata arvutatud välja dialoogiboksi Sort rippmenüüs Välja.
  4. Kuubiku andmeallikaid saab kasutada esmase andmeallikana andmete segamiseks Tableau's. Neid ei saa kasutada teiseste andmeallikatena.

Loodan, et teil kõigil on nüüd õiglane idee Andmete segamine tabelis sellest blogist. Näljas rohkem teadmisi? Ärge muretsege, see video annab teile kontseptsioonist parema ülevaate.