1.QUEST
QUEST是IBM公司Almaden研究中心开发的一个多任务数据挖掘系统,目的是为新一代决策支持系统的应用开发提供高效的数据开采基本构件。系统具有如下特点:
提供了专门在大型数据库上进行各种开采的功能:关联规则发现、序列模式发现、时间序列聚类、决策树分类、递增式主动开采等。
各种开采算法具有近似线性(O(n))计算复杂度,可适用于任意大小的数据库。
算法具有找全性,即能将所有满足指定类型的模式全部寻找出来。
为各种发现功能设计了相应的并行算法。
2.MineSet
MineSet是由SGI公司和美国Standford大学联合开发的多任务数据挖掘系统。MineSet集成多种数据挖掘算法和可视化工具,帮助用户直观地、实时地发掘、理解大量数据背后的知识。MineSet有如下特点:
MineSet以先进的可视化显示方法闻名于世。
提供多种 萃诰蚰J健0 ǚ掷嗥鳌⒒毓槟J健⒐亓 嬖颉⒕劾喙椤⑴卸狭兄匾 取?br>
支持多种关系数据库。可以直接从Oracle、Informix、Sybase的表读取数据,也可以通过SQL命令执行查询。
多种数据转换功能。在进行挖掘前,MineSet可以去除不必要的数据项,统计、集合、分组数据,转换数据类型,构造表达式由已有数据项生成新的数据项,对数据采样等。
操作简单、支持国际字符、可以直接发布到Web。
3.DBMiner
DBMiner是加拿大SimonFraser大学开发的一个多任务数据挖掘系统,它的前身是DBLearn。该系统设计的目的是把关系数据库和数据开采集成在一起,以面向属性的多级概念为基础发现各种知识。DBMiner系统具有如下特色:
能完成多种知识的发现:泛化规则、特性规则、关联规则、分类规则、演化知识、偏离知识等。
综合了多种数据开采技术:面向属性的归纳、统计分析、逐级深化发现多级规则、元规则引导发现等方法。
亿信华辰—一站式数据分析平台(ABI)
亿信华辰的一站式数据分析平台(ABI)是一款全能型产品,融合了数据源适配、ETL数据处理、数据建模、数据分析、数据填报、工作流、门户、移动应用等核心功能。采用轻量级SOA架构设计、B/S模式,各模块间无缝集成。使用了新一代的3D引擎技术,大屏展示炫酷。支持广泛的数据源接入。数据整合模块支持可视化的定义ETL过程,完成对数据的清洗、装换、处理。数据集模块支持数据库、文件、接口等多方式的数据建模。数据分析模块支持报表分析、敏捷看板、即席报告、幻灯片、酷屏、数据填报、数据挖掘等多种分析手段对数据进行分析、展现、应用。
神策数据—神策分析
神策分析的产品有完整的使用文档,每个模块都有详细的使用说明以及示例,降低了用户的学习成本。而且支持私有部署、任意维度的交叉分析,并帮助客户搭建专属的数据仓库。目前提供事件分析、漏斗分析、留存分析、数据管理等功能,未来预计会增加用户分群、用户人群分析、推送和异常维度组合挖掘等,工具需要付费使用。
永洪科技—永洪BI
永洪BI是一款可在前端进行多维分析和报表展现的BI软件。支持拖拽操作,数据源格式多样,提供不同级别的查询支持,支持跨库跨源连接。另外永洪提供了一款数据存储、数据处理的软件——MPP数据集市,可与BI打通,使得数据查询,钻取和展示的速度大幅度提高。不过其产品用户体验一般,拖拽过于自由,导致仪表盘布局不好控制;主题样式虽多但是给人感觉样式还是很传统。
1.QUEST QUEST是IBM公司Almaden研究中心开发的一个多任务数据挖掘系统,目的是为新一代决策支持系统的应用开发提供高效的数据开采基本构件。系统具有如下特点: 提供了专门在大型数据库上进行各种开采的功能:关联规则发现、序列模式发现、时间...
数据编程工具有Python、R、SAS等,目前用得多的是Python,如果有语言基础的小伙伴上手很快,语法、函数、面向对象这些都比较简单,没有基础的小伙伴也可以自学,不是很难。
数据可视化不是很难,如果不要求特别美工的话,大家先理解图表,再研究研究仪表板,阿里云的Quich BI及DataV,百度的echarts都不错,主要是展示的业务结构需要规划。
大数据技术:这个相对来说有些难度,不过有专业的工具让我们用,比如第四范式的产品和阿里云的机器学习PAN都是可以直接出结果的工具;
分析&AI:这部分先了解数据分析的基本流程和分析手法;上面的如果都学了,可以到阿里云大学上面去做几个数据分析方面的案例,增加对数据分析的流程理解和相关技术应用,但是要注意的是阿里案例都是用阿里的工具来实现的,比较简单,建议大家自己编程实现,也可以到九道门商业数据分析官网上去看一些案例,自己做做训练。