IBM SPSS数据分析与挖掘实战案例精粹》

   

所谓艺术,就是指如果只靠系统学习既有的知识体系,但自身不具备相当天赋,或者没有经过长期实战操作以积累经验/激发灵感的话就始终难以登堂入室成为大师的那些学科,音乐、舞蹈、绘画等无不如此。而大英百科全书恰恰就把统计学定义为“一门收集数据、分析数据,并根据数据进行推断的艺术和科学”。显然,作为一门应用学科,统计学也是非常强调实战能力的,一名出色的统计师需要通过经历各种各样的实战分析项目来吸取经验教训以持续成长,光靠操作教科书上的那些标准案例,只能成为工匠,不能成为大师。

近年来,随着计算机技术的飞速发展,统计软件工具出现了日新月异的变化,大大提高了统计工具的可用性。而统计学和数据库技术、人工智能技术的融合,更是进一步催生了数据挖掘这个目前炙手可热,也更强调实战能力的领域。具体到SPSS系列产品,随着IBM的并购,原先的SPSS软件已经成为IBM SPSS Statistics,定位于标准的统计分析需求,而更贴近企业用户的数据分析与挖掘需求则由IBM SPSS Modeler来满足。分析工具的高度易用性和实战需求的同步发展,使得各行各业对统计分析和数据挖掘人员的需求呈现爆炸性增长,远远超过了正常培养周期能够提供的数量,而广大统计分析人员希望能够得到一本完全从实战操作的角度出发,而不是单纯以介绍某一种统计软件的角度出发的参考书以迅速帮助自己提升实战能力的愿望,也因之而变得更为迫切。

笔者先后于2000年、2002年和2004年编写过三轮SPSS教程/参考书,均获得了读者的热烈追捧。而作为在数据分析领域从业十余年的统计专业人员,本书的笔者们也深知在漫长的经验积累阶段所需要付出的努力和汗水,也就更能体会到编写一本实战案例集的市场价值。实际上,笔者们几年前就有过编写案例集的考虑,迟迟没有动手的原因在于深知此事不易,因为虽然从业以来经手的分析案例成百上千,但很多优秀案例都因涉及到相应公司的业务机密而无法和读者分享;另一方面,案例的复杂程度和代表性也颇费思量,过于复杂会牵扯太多的具体业务细节,影响案例的可读性,而案例过于简单,则无法展示实战分析中可能遇到的各种情况,参考价值不大。但是在反复讨论之后,笔者最终还是决定编写此书,因为我们认定这件事情有利于推动数据分析行业发展,既然这样,那就应当去做。

本书定位为实战类书籍,共分四个部分,20章,以IBM SPSS Statistics 20IBM SPSS Modeler 14.1为准,完全从实际案例的分析需求出发去讲解各类方法的综合运用和实战操作,具体而言本书的特点是:

1. 实战:以案例集的方式提供医疗、电信、金融、零售、市场研究等各行业的真实案例,完全从实际项目的分析需求出发去讲解各类方法的综合运用,使本书更贴近数据分析实战,更具参考价值。

2. 全面:同样是从实战需求出发,不再拘泥于常规统计方法,也不再拘泥于IBM SPSS Statistics一个软件,而是基于实际应用的需求,随时使用各种SPSS软件中的新功能、新技巧,必要时更进一步引入Modeler来解决各种数据挖掘的具体应用。从而在实际案例的背景下,使读者充分了解IBM SPSS系列产品的强大功能。

3. 易懂:以实用性为唯一标准,结合笔者多年的统计学从教经验和现在的商业应用经验,重点讲解实战分析应用,案例安排顺序从简到繁,将软件操作的讲解自然融入案例分析过程中,使得读者的学习过程更加自然流畅。

4. 重现:本书附带光盘中包含书中涉及的完整案例数据、案例实现程序和Modeler数据流,并提供IBM SPSS StatisticsIBM SPSS Modeler试用软件的下载网址,读者可以在学习时利用试用软件同步完整重现所有的分析过程和结果,彻底避免了纸上谈兵的尴尬。

对于不同的读者群而言,他们各自能从本书得到的帮助是:

1. 入门:对于IBM SPSS StatisticsIBM SPSS Modeler的新用户而言,本书显然是最佳的学习软件操作和实战技能的教科书,本书采用相应软件的最新版本,就统计分析和数据挖掘项目中的一些典型案例进行了深入浅出的全面介绍,用户只需要按照书中的讲解顺序依次操作,就可以真正习得相应的数据分析实战操作能力。

2. 提升:对于已经熟悉相应SPSS系列产品如何使用的老用户而言,本书就是读者们渴望多年的《专家教程》,笔者在案例中真正展示的并非简单的软件操作,而是完整的统计思维和实战分析思路,已有数据分析基础的读者通过对这些案例的学习,必然能更快的跨越从理论到实战的鸿沟,从而使得自身对软件工具的掌握和实战操作能力都得到真正的提升。

3. 领悟:对资深的统计分析和数据挖掘人员而言,其对分析工具的应用早已超越了具体某个公司的产品层面,达到“不滞于物,草木竹石皆可为剑”的地步,但本书仍然具有很高的参考价值,因为软件仅仅是实现工具,其背后的统计思维、统计方法、基本原则等都完全相同,但不同的人在面对相同问题时所采用的分析流程、处理方式等又各有千秋,通过对书中案例的学习、参照和比较,分析人员必然能够收到举一反三的效果,从而真正对实战操作达到“悟”的境地。

本书第1章由张文彤和钟云飞共同编写,第517-20章由钟云飞编写,第416章由王清华编写,其余各章由张文彤编写。

作者新浪微博:@文彤老师@数里寻道@AllanVV

读者交流微群:http://q.weibo.com/749521

软件试用版下载:http://peixun.pinggu.org/SPSSCaseBookDVD.zip

本书案例数据、内容更新下载:http://www.StatStar.com

在本书的写作、出版、发行过程中,我们得到了IBM大中华区业务分析软件总经理缪可延、IBM大中华区业务分析软件技术经理周庆伟、IBM大中华区商业智能及预测分析软件销售经理刘海亮、IBM华西区市场经理邓宏等多位IBM领导与同事的鼓励、帮助与支持,人大经济论坛则为本书提供了试用软件的下载空间,这里一并表示由衷的感谢。

希望本书能够帮助读者更加深入地了解数据分析,从而进一步促进数据分析在国内的普及。也希望广大读者能一如既往的踊跃提出自己使用中的宝贵意见和建议,使得本书再版的时候能够更上一层楼,更完美地满足大家的学习和工作需求。

张文彤  钟云飞

201111