昨天,我正在与一位同事讨论一种情况,在这种情况下,他使用SSIS(或类似方法)通过SSIS软件包来做一些非常酷的事情,并以“Reginald Williams博士”的名字通过。并且基于某种加权方案,该系统足够智能,可以弄清楚如何对其进行标记并将其存储为“Salutation-名字-Last Name-后缀”。他提出了一些流行语,例如BI,SSIS,ETL和数据挖掘。我确实想要更多信息,但什至不知道从哪里开始询问。

我是.Net开发人员,并且精通C#,Vb.Net,WPF等...,但是我不知道这些技术是什么,如何将其添加到我的技能集中以及是否具有某种意义我真的应该集中精力。任何方向都将是有帮助的。

最佳答案

SSIS == SQL Server集成服务,它是提取转换和加载(ETL)工具,它是SQL7,SQL2K时代的数据转换服务或DTS的高级实现。它是表达工作流过程的好工具,其中数据从点A移动到点B(以及c和d等),并在该过程中经历更改,例如合并到非规范化设计或数据清理。

BI或Business Intelligence在整个技术领域中都是整个类别的代名词,它现在是一个绝佳的地方。 BI技能非常有值(value)且很难获得,原因之一就是很难在实验室中重建真实的BI案例,因此教学几乎总是在现实环境中进行。

从较高的角度来看,BI项目通常涉及报告的终点。通常,作为开发人员,我们习惯于进行交易报告的编写,例如PO的详细信息,但BI可以进入非常广泛的报告,这些报告涵盖了数十年来的产品销售趋势,并处理了数亿条记录。对于此类报告,我们设计应用程序数据库的方式并不理想,因此发明了其他工具和技术,并在BI领域中使用了这些工具和技术。这些是类似于多维数据集的事情,您经常听到这种情况称为OLAP多维数据集。 OLAP多维数据集通常起源于一个只不过是另一个数据库的数据仓库,但是典型的仓库包含的数据来自一个以上的数据库,通常还包含数十个其他应用程序数据库。您的库存应用程序,采购应用程序,HR应用程序以及许多其他应用程序都包含点点滴滴的数据,这些数据可以创建完整的业务图景,BI架构师将使用SSIS之类的东西从所有这些系统中提取数据,并对它们进行处理并将其存储在数据仓库中,该数据仓库采用另一种设计,可以更好地进行报告。将其放入仓库后,他将使用Analysis Services在该数据上创建多维数据集,并使用Reporting Services之类的工具向您显示该数据的报告。

编辑:抱歉,忘记了数据挖掘,它是另一个非特定术语,用于描述和概念或过程,而不是一种工具。在一个简单的示例中,这是一种识别数据模式的系统方法。过去,良好的业务分析会查看数据中的趋势,但是对于现代数据库,您谈论的数据集太大而无法手动梳理-数据挖掘可让您指示计算机梳理这些数据并识别出感兴趣的模式。

希望能有所帮助

10-06 10:41