Să analizăm diferența dintre exploatarea datelor și depozitarea datelor cu ajutorul unei diagrame de comparație prezentată mai jos.
Diagramă de comparație
Bazele de comparație | Data mining | Depozitarea datelor |
---|---|---|
De bază | Mineritul de date este un proces de recuperare sau extragere a datelor semnificative din baza de date / depozitul de date. | Depozitul de date este un depozit în care informațiile din mai multe surse sunt stocate sub o singură schemă. |
Definiția Data Mining
Data Mining este un proces de descoperire a cunoștințelor, pe care nu ați așteptat niciodată să existe în baza dvs. de date . Folosind instrumentul tradițional de interogare, puteți prelua numai informațiile cunoscute din date. Dar, Data mining vă oferă calea de a extrage informații ascunse din date . Extragerea datelor extrage informații importante din baza de date care pot fi utilizate pentru luarea deciziilor .
Descoperirea cunoștințelor în baze de date, denumită KDD, prezintă relații și tipare . Relația poate fi între două sau mai multe obiecte diferite, între atributele aceluiași obiect. Modelul este un alt rezultat al exploatării datelor care arată succesiunea regulată și inteligibilă a informațiilor care ajută la luarea deciziilor.
Pașii implicați în KDD, și anume Discovery de cunoștințe în baze de date, pot fi rezumate în primul rând prin selectarea setului de date pe care trebuie să se efectueze extragerea datelor. Următoarea este pre-procesarea care implică eliminarea datelor incoerente. Apoi vine transformarea datelor în cazul în care datele sunt transformate în formularul adecvat pentru data mining. În continuare se află datele de extragere a datelor, aici se aplică algoritmii de extragere a datelor. Și în final, interpretarea și evaluarea care implică extragerea relației sau modelului între date.
Exploatarea datelor se potrivește bine în mediul depozitului de date care a stocat datele într-un mod agregat și sumar. Pe măsură ce devine ușor să murim datele din depozitul de date
Definirea stocării datelor
Warehouse-ul de date este o locație centrală în care informațiile colectate din mai multe surse sunt stocate într-o singură schemă unificată . Datele sunt inițial adunate, diferite surse de întreprindere apoi curățate și transformate și stocate într-un depozit de date. Odată ce datele sunt introduse într-un depozit de date, acestea rămân acolo mult timp și pot fi accesate ore suplimentare.
Data Warehouse este un amestec perfect de tehnologii cum ar fi modelarea datelor, achiziția de date, gestionarea datelor, gestionarea metadatelor, gestionarea magazinelor de instrumente de dezvoltare . Toate aceste tehnologii suportă funcții precum extracția datelor, transformarea datelor, stocarea datelor, furnizarea de interfețe utilizator pentru accesarea datelor .
Depozitul de date nu este un produs sau un software, este un mediu informațional care oferă informații precum o imagine integrată a unei întreprinderi. Puteți accesa datele actuale și istorice ale întreprinderii, care vă ajută la luarea deciziilor. Susține tranzacțiile efectuate pentru luarea deciziilor fără a afecta sistemele operaționale. Este o resursă flexibilă pentru a obține informații strategice.
Diferențe cheie între data mining și depozitarea datelor
- Există o diferență de bază care separă miningul de date și depozitarea datelor, care este data mining este un proces de extragere a datelor semnificative din baza de date mare sau depozitul de date. Cu toate acestea, depozitul de date oferă un mediu în care datele sunt stocate într-o formă integrată care facilitează extracția datelor pentru a extrage date mai eficient.
Concluzie:
Data Mining se poate face numai atunci când există o bază de date bine integrată, adică un depozit de date. Deci, depozitul de date trebuie să fie finalizat înainte de data mining. Depozitul de date trebuie să aibă informații într-o formă bine integrată, astfel încât extragerea datelor să poată extrage cunoștințele într-un mod eficient.