En datasjø er en type datalagring som tillater akkumulering av store datamengder i sitt opprinnelige råformat.
Detaljer om programvaren
HVORFOR TIMEXTENDER?
Hver dag jobber vi for å gjøre det komplekse enkelt, for å automatisere alt som kan automatiseres og for å gjøre det som betyr mest.
Ressurser
For Partnere
Kunder
Se hvordan andre bygger dataene sine med TimeXtender, og lær hvordan du følger i deres fotspor.
Kontakt oss
Vi vil gjerne ha en dypere samtale med deg om spørsmålene dine.
Om oss
Vårt hovedformål er å styrke verden med data, hjerte og sinn.
Vår kultur
Vi tror at «vi er det vi gir» og at «folk gjør forretninger med folk».
Bli med oss
Vi er en global, distribuert arbeidsstyrke, organisert i selvstyrte team.
Hva er en datasjø?
Datasjøer lagrer rå, ustrukturerte data, slik at folk raskt og enkelt kan få tilgang til alle organisasjonens data, uavhengig av kilde eller format.
Fleksibiliteten til datasjøer gjør dem spesielt godt egnet for å utforske Big Data-sett.
Datasjøer kan brukes til å støtte en rekke datadrevne applikasjoner, for eksempel datautvinning, maskinlæring og prediktiv analyse.
Datasjøer kan gi betydelige fordeler for organisasjoner som ønsker å få mest mulig ut av dataene sine.
En datasjø kan bygges fysisk, i skyen eller hybrid. Det er en skalerbar løsning som enkelt kan justeres for å imøtekomme skiftende databehov.
FEM HOVEDFORDELER MED EN DATASJØ
Datasjøer tilbyr mange fordeler, inkludert:
Økt effektivitet og produktivitet
Datasjøer gjør det enklere for organisasjoner å få tilgang til data og ta dem i bruk. Tidligere ble data ofte samlet i forskjellige avdelinger eller datavarehus, noe som gjorde det vanskelig å få et helhetlig syn på virksomheten. Med en datasjø er all data sentralisert, og kan enkelt nås av alle i organisasjonen.
/Textured%20Illustrations/presentation-min.png?width=259&height=250&name=presentation-min.png)
Kostnadsbesparelser
Datasjøer kan hjelpe organisasjoner med å spare penger ved å unngå behovet for å kjøpe dyre datavarehusløsninger. I tillegg er datasjøer vanligvis distribuert på råvaremaskinvare, noe som reduserer kostnadene ytterligere.
/Textured%20Illustrations/piggy-bank-min.png?width=262&height=250&name=piggy-bank-min.png)
Forbedret beslutningstaking
Med alle data på ett sted kan organisasjoner ta bedre informerte beslutninger. Datasjøer gjør det mulig å raskt analysere store datasett og identifisere trender som ellers ville vært vanskelig å få øye på.
/Textured%20Illustrations/analytics.png?width=250&height=250&name=analytics.png)
Økt fleksibilitet
Datasjøer forbedrer organisatorisk fleksibilitet ved å la bedrifter raskt tilpasse seg endrede markedsforhold. De gjør det også lettere å eksperimentere med nye datadrevne initiativer uten å måtte gå gjennom en langvarig godkjenningsprosess.
/Textured%20Illustrations/screen-min.png?width=263&height=250&name=screen-min.png)
Større innsikt
Datasjøer gjør det mulig å få innsikt som ellers ville vært skjult i samlede datasett. Ved å samle data fra ulike kilder kan bedrifter generere ny innsikt som kan brukes til å forbedre produkter og tjenester eller skape nye inntektsstrømmer.
/Textured%20Illustrations/Analytics-min.png?width=194&height=250&name=Analytics-min.png)
ET TEKNISK MARERITT
Mens datasjøer tilbyr mange fordeler, har de også en rekke ulemper.
En slik ulempe er behovet for dyktige dataingeniører for å håndkode datapipelines for å trekke ut innsikt fra dataene. Dagens moderne datasjø er et løst konsept, så hver sjø er bygget forskjellig. Og for å bygge en, må datateamet ditt mestre et bredt spekter av teknologier. Har teamet ditt ferdigheter i R, Python, Hive, NoSQL eller Parkett? Hva med Hadoop, Sqoop, Pig, Kafka, Scala eller Avro? Dette er bare en liten liste med teknologiferdighetene du enten må ansette eller skaffe deg for å i det hele tatt kunne begynne å planlegge en datasjø.
Men, la oss si at du lærer opp teamet ditt, ansetter noen med doktorgrad, noen konsulenter og bygger denne strukturen. Så kommer neste fase, vedlikehold. Hvis dataene endres eller må oppdateres, kan det hende at dataingeniøren må gå tilbake og gjøre endringer i pipelinen. Men det kan være vanskelig og tidkrevende, spesielt hvis det er skrevet egendefinert kode og den opprinnelige utvikleren ikke lenger er tilgjengelig.
«En hjemmelaget IT-tilnærming kan gi en innledende kostnadsreduksjon på 20 prosent, men resultere i en 200 prosent økning i vedlikeholdskostnadene. »
Gartner
DATAKILDER FORNYER, VOKSER OG ENDRES
Så du må vurdere ikke bare dine nåværende data, men også hastigheten som dataene dine vokser og/eller endrer seg med. Her er noen eksempler på hva som mest sannsynlig vil skje med data i datakildene dine:
Nye tabeller/felt blir lagt til
Tabeller/felt får nytt navn
Tabeller/felt slettes
Endringer i datatype/struktur
Datakilder endres/oppdateres
Nye datakilder legges til
Det er åpenbart at dette belaster dine knappe og dyre ressurser når de hele tiden må hardkode og rekonstruere skjøre pipelines, justere API-samtaler og oppdatere kontakter. Det gjør det nesten umulig for dataingeniører å holde tritt hvis du velger å gjøre det manuelt.
ØNSKER DU TEKNOLOGI ELLER EN LØSNING?
Før du begynner å bygge din datasjø, må du spørre deg selv om du vil ha teknologi eller en løsning. Å bygge datasjøen handler ikke om «den ene eller den andre tilnærmingen» eller «hvilken teknologi som er bedre». Det handler om å identifisere hvilket forretningsproblem du prøver å løse med datasjøen, og deretter levere løsningen for det så raskt som mulig, og på en mest mulig fremtidssikker måte. En del av det å prioritere fremgang fremfor perfeksjon er å bruke en metodikk som oppmuntrer til denne typen atferd. Den første vurderingen bør være om du stadig vil finne opp hjulet på nytt eller om du vil at automatisering skal fungere for deg.
AUTOMATISERING ER NØKKELEN
Som vi har etablert, bygges datasjøer tradisjonelt gjennom en prosess med håndkoding, noe som kan være tidkrevende og kostbart. Imidlertid kan datasjøer nå bygges ved hjelp av automatiserte dataintegreringsverktøy. Et automatisert dataintegreringsverktøy lar deg raskt og enkelt koble til en hvilken som helst datakilde, uten behov for håndkoding. Dette betyr at dataingeniører kan fokusere på viktigere oppgaver, som datamodellering og dataanalyse.
I tillegg kan dataintegrasjonsverktøy som TimeXtender automatisk oppdage endringer i datakilder og gjøre de nødvendige endringene i datasamlebånd, uten behov for menneskelig inngripen. Dette betyr at datainnsjøer kan bygges ti ganger raskere og er mer fremtidssikre, da de enkelt kan tilpasse seg endringer i datakilder.
Start en gratis prøveperiode/Landing%20Pages/Optimize.gif?width=500&height=500&name=Optimize.gif)
SLIK ISTANDSETTER TIMEXTENDER DATATEAM TIL Å BYGGE FREMTIDSSIKTE DATASJØER 10X RASKERE
TimeXtender løser problemene nevnt ovenfor ved hjelp av automatisering. TimeXtender Operational Data Exchange (ODX) kan automatisk synkroniseres med datakildene dine. TimeXtender vil automatisk synkronisere strukturen til kilden med metadataene som er lagret i ODX-depotet.
Når TimeXtender oppdager en endring i datastrukturen din, vil den automatisk:
lage en ny versjon basert på den nye og/eller endrede strukturen til den spesifikke tabellen i datasjøen
starte en full belastning for den spesifikke tabellen for å fylle ut dataene hvis det er aktuelt
starte en full belastning for den spesifikke tabellen i datalageret for å spre endringsintegralen i dataområdet ditt
bytte automatisk tilbake til inkrementell belastning, hvis tilgjengelig
TimeXtender bruker automatisk den nyeste versjonen av dataene dine
Og det er mer …
TimeXtender ODX Server lager flere versjoner av kildedataene dine. Dette kan utløses av en oppdaget endring i datastrukturen eller ved muligheten til å lagre hver planlagte overføring som en ny versjon. Dette gir en stor fordel for bedriften, fordi den nå automatisk vil ha sikkerhetskopien og historikken opprettet, som kan brukes til gjenoppretting og/eller gjøre eldre versjoner av dataene (strukturen) tilgjengelige.
/Textured%20Illustrations/single%20tool.png?width=269&height=250&name=single%20tool.png)
Med automatiseringen i TimeXtender er det mulig å konfigurere og planlegge en lagringsadministrasjonsoppgave for å slette og administrere gamle versjoner av data for å frigjøre datalagring. Denne arkiveringsprosessen er drevet av billig lagring og egner seg til datasjø-konseptet.
/Textured%20Illustrations/cog-min.png?width=250&height=250&name=cog-min.png)
TimeXtenders ODX kan også automatisk flytte gamle versjoner i datasjøen fra varm til kjølig lagring for å spare kostnader – helt uten manuelt arbeid!
/Textured%20Illustrations/TRANSFER.png?width=248&height=250&name=TRANSFER.png)
TimeXtender gjør det kjempeenkelt å opprette og vedlikeholde forbindelser til hundrevis av typer forskjellige datakilder. Ved hjelp av «Data Source Wizard» kan brukerne velge mellom mer enn 260 datakildekoblinger, angi påloggingsinformasjon og umiddelbart starte synkroniseringen. Sammenlignet med 90 forskjellige koblinger i Azure Data Factory, gjør TimeXtender-metoden det langt enklere å koble til og vedlikeholde tilkoblingene dine.
/Textured%20Illustrations/cloud-min.png?width=259&height=250&name=cloud-min.png)
TimeXtender lar deg lage en alltid oppdatert, full dokumentasjon av din komplette datasjø med noen få klikk.
/Textured%20Illustrations/document.png?width=188&height=250&name=document.png)
TimExtender gir deg også visuell datalinje og konsekvensanalyse slik at du kan spore hvor dataene brukes i hele dataområdet.
/Textured%20Illustrations/lineage.png?width=207&height=250&name=lineage.png)
En håndbygget datasjø vil ikke ha noe av denne funksjonaliteten.
Datasjøer kan enkelt og raskt bygges ved hjelp av automatiserte dataintegreringsverktøy som Timextender.
TimeXtender har også en rekke andre fordeler, for eksempel muligheten til å koble automatisk til en hvilken som helst datakilde, lage full dokumentasjon av datasjøen og spore datalinjen. Dette betyr at dataingeniører kan frigjøre seg fra disse kjedelige, manuelle oppgavene og fokusere på viktigere oppgaver, for eksempel datamodellering og dataanalyse.