前言
《利用Python进行数据分析》的历史
Python 语言极具吸引力。自从 1991 年诞生以来,Python 如今已经成为最受欢迎的解释型编程语言。
pandas 诞生于2008年。它是由韦斯·迈金尼(Wes McKinney)于2008年开始开发的,最初的目标是为了解决金融数据分析中的一些实际问题。pandas于2009年作为开源项目发布,并逐渐在数据科学和数据分析领域获得了广泛的应用和认可。
如果你想学习如何使用Python进行数据分析,那么这本《利用Python进行数据分析》是必不可少的一本书。而这本书的作者正是Python数据分析核心pandas库的开发者韦斯·迈金尼。现在,这本30w人都在看的Python数据分析畅销书第三版中文版已经上市!
相比于第二版,第三版多了41页内容,pandas升级为1.4.0、Python升级为3.10。第三版最大的变化是紧贴pandas升级,主要是新增了方法和特性的内容。
《利用Python进行数据分析》这本书的成功绝非偶然。这本书的主角是pandas。从技术上讲,pandas负责处理原始数据,将其规整、清洗后成为高质量的结构化数据,再利用数据进行可视化或模型训练。从业务上讲,pandas上承爬虫,下启机器学习,pandas的两个重要的数据结构Series和DataFrame已成为机器学习中重要的基础数据结构。
《利用Python进行数据分析》这本书的写作质量非常高,得益于本书作者也是pandas库的创作者,本书知识点组织清晰、讲解流畅,文字中间穿插代码、注意事项、图片和表格,所以读起来一点也不枯燥。字里行间还能感受到作者对技术和开源的热爱。
掌握pandas,能为许多工作奠定基础,比如商业分析、金融量化、机器学习。另外,pandas对学校和科研单位的研究者也非常有帮助。
作译者简介
作者:Wes McKinney是Voltron Data的联合创始人兼首席技术官、Python数据社区的活跃成员,同时也是在数据分析、金融和统计计算等领域推广使用Python的倡导者。Wes毕业于麻省理工学院,同时也是Apache软件基金会的Apache Arrow和Apache Parquet项目的项目管理委员会成员。
译者:陈松,清华大学技术经济研究所副研究员,技术经济大数据实验室技术负责人,参与多项省部级、地区性课题研究。著有《区块链通识课50讲》,译有《DeFi与金融的未来》,具有 4 项国家发明专利。日常维护名为SeanCheney的博客、GitHub和公众号,阅读量上千万。
主要变动
-
基于Python 3.10和pandas 1.4全面更新代码示例。
-
知识点紧跟Python、NumPy、pandas,以及其他项目的最新版本。
-
新增配套在线开源电子版,便于读者随时查看更新。
-
增加对新特性、新工具及方法的介绍。
-
新增大量实际案例。
导读视频:
为方便初学者阅读,译者陈松老师为本书制作了配套导读视频。视频可在B站“IT阅读排行榜”免费观看!