Data mining hľadá skryté, platné a všetky možné užitočné vzory vo veľkých množinách dát. Data Mining je technika, ktorá vám pomáha objavovať netušené / neobjavené vzťahy medzi dátami pre obchodné zisky.
Pre dolovanie údajov je k dispozícii veľa užitočných nástrojov. Nasleduje vybraný zoznam 25 najlepších softvérov na dolovanie údajov s obľúbenými funkciami a najnovšími odkazmi na stiahnutie. Tento porovnávací zoznam obsahuje open source aj komerčné nástroje.
1) SAS Data mining:
Štatistická analýza je produktom spoločnosti SAS. Bol vyvinutý pre analytiku a správu dát. Ponúka grafické používateľské rozhranie pre nenáročných používateľov.
Vlastnosti:
- Nástroje na dolovanie dát SAS vám pomôžu analyzovať veľké dáta
- Je to ideálny nástroj na dolovanie dát, dolovanie textu a optimalizáciu.
- SAS ponúka architektúru spracovania distribuovanej pamäte, ktorá je vysoko škálovateľná
Odkaz na stiahnutie: https://www.sas.com/en_us/insights/analytics/data-mining.html
2) Teradata:
Teradata je masívne paralelný otvorený systém spracovania pre vývoj rozsiahlych aplikácií pre dátové sklady. Teradata môže bežať na serverovej platforme Unix / Linux / Windows.
Vlastnosti:
- Optimalizátor Teradata dokáže spracovať až 64 spojení v dotaze.
- Dáta spoločnosti Tera majú nízke celkové náklady na vlastníctvo. Je ľahké ho nastaviť, udržiavať a spravovať.
- Podporuje interakciu jazyka SQL s údajmi uloženými v tabuľkách. Poskytuje jeho rozšírenie.
- Pomáha vám automaticky distribuovať údaje na disky bez manuálneho zásahu.
- Teradata poskytuje nástroje na načítanie a vyloženie na presun údajov do / zo systému Teradata.
Odkaz na stiahnutie: https://www.teradata.in/Products/Cloud/IntelliCloud
3) Programovanie R
R je jazyk pre štatistické výpočty a grafiku. Používa sa tiež na analýzu veľkých dát. Poskytuje širokú škálu štatistických testov.
Vlastnosti:
- Efektívne zaobchádzanie s údajmi a ich ukladanie,
- Poskytuje sadu operátorov pre výpočty na poliach, najmä maticiach,
- Poskytuje ucelenú a integrovanú kolekciu nástrojov na big data na analýzu údajov
- Poskytuje grafické vybavenie na analýzu údajov, ktoré sa zobrazujú na obrazovke alebo v tlačenej podobe.
Odkaz na stiahnutie; https://www.r-project.org/
4) DOSKA
Board je Management Intelligence Toolkit. Kombinuje funkcie business inteligencie a riadenia podnikovej výkonnosti. Je navrhnutý tak, aby poskytoval business intelligence a obchodné analýzy v jednom balíku.
Vlastnosti:
- Umožňuje vám analyzovať, simulovať, plánovať a predpovedať pomocou jednej platformy
- Vytvárať analytické a plánovacie aplikácie na mieru.
- Board All-In-One kombinuje BI, správu podnikového výkonu a obchodnú analýzu.
- Poskytuje podnikom oprávnenie vyvíjať a udržiavať sofistikované analytické a plánovacie aplikácie.
- Patentovaná platforma pomáha vytvárať prehľady prístupom k viacerým zdrojom údajov.
Odkaz na stiahnutie: https://www.board.com/en
5) Dundas
Dundas je podnikový nástroj na ťažbu dát, ktorý je možné použiť na vytváranie a prezeranie interaktívnych informačných panelov, správ atď. Dundas BI môžete nasadiť ako centrálny dátový portál pre organizáciu.
Vlastnosti:
- Serverová aplikácia s plnou funkčnosťou produktu
- Integrujte všetky druhy zdrojov údajov a získajte k nim prístup
- Prispôsobiteľné vizualizácie údajov
- Inteligentné nástroje na presúvanie
- Vizualizujte údaje prostredníctvom máp
- Prediktívna a pokročilá analýza dát
Odkaz na stiahnutie: http://www.dundas.com/support/dundas-bi-free-trial
6) Inetsoft
Štýl nástroja Inetsoft na dolovanie dát Intelligence je užitočná platforma na dolovanie a inteligenciu údajov. Umožňuje rýchlu a flexibilnú transformáciu údajov z rôznych zdrojov.
Vlastnosti:
- Pomáha vám získať prístup k štruktúrovaným a pološtruktúrovaným zdrojom, miestnym aplikáciám
- Umožňuje vám optimalizovať aplikácie na spotrebu a aktualizáciu údajov
- Ponuka prispôsobených a bezpečných úrovní prieskumu a vykazovania údajov.
- Škálovateľné pre veľké dátové súbory používateľov pomocou zabudovanej platformy Spark
- Generujte stránkované správy s vloženou obchodnou logikou a parametrizáciou
Odkaz na stiahnutie: https://www.inetsoft.com/products/StyleIntelligence/
7) H30
H3O je ďalší vynikajúci otvorený softvér na získavanie údajov. Používa sa na vykonávanie analýzy údajov na údajoch uchovávaných v aplikačných systémoch cloud computingu.
Vlastnosti:
- H3O vám umožňuje využívať výpočtový výkon distribuovaných systémov a výpočty v pamäti
- Umožňuje rýchle a ľahké nasadenie do výroby pomocou Javy a binárneho formátu.
- Pomáha vám používať programovacie jazyky ako R,
- Python a ďalší, aby vytvorili model v H3O
- Distribuované, spracovanie v pamäti
Odkaz na stiahnutie: https://www.h3o.ai/
8) Qlik
Qlik je nástroj na dolovanie a vizualizáciu údajov. Ponúka tiež informačné panely a podporuje viac zdrojov údajov a typov súborov.
Vlastnosti:
- Rozhrania typu drag-and-drop umožňujú vytvárať flexibilné interaktívne vizualizácie údajov
- Okamžite reagujte na interakcie a zmeny.
- Podporuje viac zdrojov údajov a typov súborov
- Umožňuje ľahké zabezpečenie dát a obsahu na všetkých zariadeniach.
- Umožňuje vám zdieľať príslušné analýzy vrátane aplikácií a príbehov pomocou centralizovaného centra.
Odkaz na stiahnutie: https://www.qlik.com/us/products/qlik-sense
9) RapidMiner:
RapidMiner je bezplatný nástroj na dolovanie dát. Používa sa na prípravu údajov, strojové učenie a nasadenie modelu. Ponúka celý rad produktov na vytváranie nových procesov ťažby údajov a prediktívnu analýzu nastavení.
Vlastnosti:
- Povoliť viac metód správy údajov
- GUI alebo dávkové spracovanie
- Integruje sa s internými databázami
- Interaktívne a zdieľateľné informačné panely
- Prediktívna analýza veľkých dát
- Spracovanie na diaľku
- Filtrovanie údajov, pripájanie, zlučovanie a agregácia
- Budujte, trénujte a overujte prediktívne modely
- Správy a spustené oznámenia
Odkaz na stiahnutie: https://my.rapidminer.com/nexus/account/index.html#downloads
10) Oracle BI
Oracle BI je open source strojové učenie a vizualizácia údajov pre nováčikov aj odborníkov. Pracovné postupy interaktívnej analýzy údajov s veľkým súborom nástrojov.
Vlastnosti:
- Interaktívna vizualizácia údajov.
- Ponúka interaktívny prieskum dát pre rýchlu kvalitatívnu analýzu s čistými vizualizáciami.
- Orange podporuje praktické školenie a vizuálne ilustrácie konceptov z oblasti dátovej vedy.
- Ponúka rozsiahlu škálu doplnkov k dolovaniu údajov z externých zdrojov údajov.
Odkaz na stiahnutie: https://orange.biolab.si/
11) KNIME
KNIME je softvér s otvoreným zdrojovým kódom na vytváranie aplikácií a služieb dátovej vedy. Tento nástroj na dolovanie údajov vám pomáha porozumieť údajom a navrhnúť pracovné postupy v oblasti vedy o údajoch.
Vlastnosti:
- Pomáha vám vytvoriť pracovné postupy koncovej dátovej vedy
- Zmiešajte údaje z ľubovoľného zdroja
- Umožňuje vám agregovať, triediť, filtrovať a spájať údaje buď na vašom lokálnom počítači, v databáze alebo v distribuovaných prostrediach veľkých dát.
- Vytvárajte modely strojového učenia pre klasifikáciu, regresiu a redukciu dimenzií
Odkaz na stiahnutie: https://www.knime.com/software-overview
12) Tanagra
Tangra je bezplatný nástroj na dolovanie dát na študijné a výskumné účely. Ponúka rôzne metódy dolovania dát od štatistického učenia, analýzy dát a strojového učenia.
Vlastnosti:
- Ponúka ľahko použiteľný softvér na ťažbu dát pre výskumných pracovníkov a študentov
- Umožňuje používateľovi pridať svoje metódy dolovania údajov.
Odkaz na stiahnutie: https://eric.univ-lyon2.fr/~ricco/tanagra/en/tanagra.html
13) Riešiteľ:
Riešiteľ XLminer je ľahko použiteľný profesionálny nástroj na dolovanie dát na vizualizáciu údajov, prognózy a dolovanie dát v programe Excel. Ponúka komplexnú sadu funkcií na prípravu údajov na import a čistenie vašich údajov.
Vlastnosti:
- XLMiner ponúka komplexnú sadu analytických funkcií založených na štatistických metódach aj metódach strojového učenia.
- Tento nástroj umožňuje pracovať s veľkými súbormi údajov, ktoré môžu presahovať limity v programe Excel.
- Ponúka vstavané funkcie na prieskum a vizualizáciu údajov.
- Preskúmanie údajov ponúka rýchly prehľad o skrytých vzťahoch v dátach.
Odkaz na stiahnutie: https://www.solver.com/xlminer-data-mining
14) Zmysel
Sisense je ďalší efektívny nástroj na dolovanie dát. Okamžite analyzuje a vizualizuje veľké aj rôznorodé súbory údajov. Je to ideálny nástroj na vytváranie dashboardov so širokou škálou vizualizácií.
Vlastnosti:
- Umožňuje vytvárať interaktívne informačné panely bez technických zručností
- Vytvorte jedinú verziu pravdy s plynulými údajmi
- Zjednoťte nesúvisiace údaje na jednom centralizovanom mieste
- Používateľské rozhranie typu drag-and-drop na východ
- Umožňuje prístup k informačným panelom aj v mobilnom zariadení
- Pútavá vizualizácia
- Identifikuje kritické metriky pomocou filtrovania a výpočtov
- Spracováva údaje veľkého rozsahu na jednom komoditnom serveri
Odkaz na stiahnutie: https://www.sisense.com/
15) Tavenie dát
DataMelt je bezplatne použiteľný nástroj na numerické výpočty, matematiku, analýzu údajov a vizualizáciu údajov. Tento program vám ponúka jednoduchosť skriptovacích jazykov, ako sú Python, Ruby, Groovy, so silou stovky balíkov Java.
Vlastnosti:
- DataMelt ponúka štatistiku, analýzu veľkého objemu dát a vedeckú vizualizáciu.
- Môžete ho použiť v rôznych programovacích jazykoch na rôznych operačných systémoch.
- Umožňuje vám vytvárať vysoko kvalitné vektorové grafické obrázky (EPS, SVG, PDF atď.), Ktoré je možné zahrnúť do LaTeXu a iného textového procesora.
- Data Melt ponúka použitie skriptovacích jazykov, ktoré sú výrazne rýchlejšie ako štandardný Python implementovaný v C.
Odkaz na stiahnutie: https://jwork.org/dmelt/
16) ELKI:
ELKI je nástroj na získavanie údajov z otvoreného zdroja napísaný v prostredí Java. Tento nástroj nám umožňuje skúmať algoritmy s dôrazom na nekontrolované metódy v klastrovej analýze a detekcii odľahlých hodnôt.
Vlastnosti:
- ELKI ponúka rozsiahlu zbierku vysoko parametrizovateľných algoritmov
- Umožňuje ľahké a spravodlivé vyhodnotenie a testovanie algoritmov.
- ELKI poskytuje štruktúry indexov údajov, ako je napríklad strom R *, ktorý zvyšuje proces dolovania údajov
Odkaz na stiahnutie : https://elki-project.github.io/
17) SPMF
SPMF je open-source knižnica na dolovanie dát napísaná v Jave. Distribuuje sa pod licenciou GPL. Umožňuje vám integrovať zdrojový kód s iným softvérom Java.
Vlastnosti:
- Umožňuje ťažbu asociačných pravidiel
- Podporuje sekvenčné vzorkovanie a sekvenčné dolovanie pravidiel
- Ponúka vysoko užitočnú ťažbu vzorov,
- Ťažba časových radov.
- Podpora zložitého procesu klastrovania a klasifikácie
Odkaz na stiahnutie: http://www.philippe-fournier-viger.com/spmf/
18) Alteryx
Alteryx je riešenie podnikovej inteligencie a analýzy pre podnik. Je to špeciálne navrhnutý nástroj pre analytikov údajov a obchodných lídrov.
Vlastnosti:
- Analytics pre stredne veľké podniky
- Umožňuje analýzu ad hoc.
- Ponúka rýchle online analytické spracovanie
- Automatické plánované hlásenie
- Vysoko prispôsobiteľný informačný panel
Odkaz na stiahnutie: https://www.alteryx.com/
19) Enterprise Miner
Enterprise Miner je softvér SAS, ktorý vám ponúka špičkové algoritmy určené na riešenie najdôležitejších výziev a ponúka najlepšie riešenia pre vaše podnikanie.
Vlastnosti:
- Pomáha vám zlepšiť presnosť predpovedí. Zdieľajte spoľahlivé výsledky
- Ľahko použiteľné grafické používateľské rozhranie a dávkové spracovanie
- Pokročilé prediktívne a popisné modelovanie
- Ponúka automatické bodovanie
- Automatizujte nasadenie a skórovanie modelu
Odkaz na stiahnutie: https://www.sas.com/en_us/software/enterprise-miner.html
20) Sledovanie údajov
Datawatch Desktop je riešenie na dolovanie dát a riešenie business intelligence. Umožňuje vám sústrediť sa na vizualizáciu údajov v reálnom čase. Ponúka nástroje na zostavenie a nasadenie ich monitorovacích a analytických systémov bez nutnosti písania jediného riadku kódu.
Vlastnosti:
- Funkcia drag-and-drop umožňuje používateľom vytvoriť si prispôsobené zobrazenie údajov
- Identifikujte obchodné anomálie
- Analyzujte, ako alternatívne scenáre ovplyvnia výkon, pomocou historických údajov
Odkaz na stiahnutie: https://www.datawatch.com/in-action/panopticon-streaming-analytics-platform/
21) Pokročilý baník
Pokročilý baník je užitočný nástroj na spracovanie, analýzu a modelovanie údajov. Jeho užívateľsky prívetivé rozhranie pracovného toku vám umožňuje preskúmať rôzne typy údajov.
Vlastnosti:
- Extrakcia a ukladanie údajov z / do rôznych databázových systémov, súborov a transformácií údajov
- Ponúka rôzne operácie s údajmi, ako je vzorkovanie, spájanie súborov údajov atď.
- Pomáha vám zostavovať štatistické modely, analýzu premenlivej dôležitosti, zhlukovú analýzu atď.
- Ľahká a efektívna integrácia modelov s externými aplikáciami IT
Odkaz na stiahnutie: https://algolytics.com/products/advancedminer/
22) Analytický riešiteľ
Analytický riešiteľ môže bezplatne používať nástroj point-and-click. Umožňuje vám vykonávať analýzu rizík a normatívne analýzy vo vašom prehliadači. Ponúka úlohy na ťažbu dát s plným výkonom.
Vlastnosti:
- Pomáha vám začleniť neistotu a riešenie pomocou optimalizácie simulácie, náhodného programovania a robustnej optimalizácie.
- Umožňuje definovať simulačný model Monte Carlo pomocou vzorcov programu Excel
Odkaz na stiahnutie: https://analyticsolver.com/
23) PolyAnalyst
PolyAnalyst je data mining a analytický nástroj na získavanie použiteľných poznatkov skrytých a aktuálnych štruktúr údajov.
Vlastnosti:
- Pomáha vám získať prístup k údajom z rôznych zdrojov a zlúčiť údaje z rôznych zdrojov
- Môžete si vybrať zo širokej ponuky štatistických algoritmov a algoritmov strojového učenia.
- Ponúka vám možnosť vytvoriť správu o vypchávaní, ktorú je možné zhrnúť a oznámiť váš prehľad
Odkaz na stiahnutie: https://www.megaputer.com/polyanalyst/
24) Civis
Civis vám umožňuje robiť informované rozhodnutia s ohľadom na vedcov v oblasti dát a rozhodovací trh. Umožňuje vášmu tímu efektívne spolupracovať a rýchlejšie hľadať riešenia.
Vlastnosti:
- Ponúka architektúru, produkty a procesy, ktoré vám pomáhajú chrániť vaše dáta
- Môžete konfigurovať pomocou knižnice na príjem údajov a modulov ETL.
- Napíšte kód do skriptu, do pracovného toku ponúknite viac skriptov alebo úloh a definujte pracovný tok, ktorý sa má spustiť podľa plánu.
- Umožňuje vám zmeniť vaše analýzy a modely na aplikácie, ktoré fungujú na flexibilnej infraštruktúre na úrovni výroby
Odkaz na stiahnutie: https://www.civisanalytics.com/civis-platform/
25) Vyhľadanie:
Viscovery je softvérová sada zameraná na pracovný tok. Je založený na samoorganizujúcich sa mapách a viacrozmerných štatistikách pre exploatívnu data mining a prediktívne modelovanie. Systém vyniká intuitívnym navádzaním používateľa a dôkladnou implementáciou.
Vlastnosti:
- Ideálna platforma projektového prostredia pre cieľovo orientovanú prevádzku
- Vyhradené pracovné postupy, ktoré vám umožňujú ponúkať zameranú navigáciu
- Vymazajte kroky pracovného toku s osvedčeným predvoleným nastavením
- Rozvetvenie pracovného toku umožňujúce generovanie modelových variácií
- Funkcie pre integrovanú dokumentáciu a anotáciu
- Viacero manipulačných nástrojov na uľahčenie používania
Odkaz na stiahnutie: https://www.viscovery.net/somine/