雷锋网 AI 科技评论按:这是 Karlijn Willems 发布于 Medium 的一篇关于 Python 中数据导入问题的博客。Karlijn Willems 是来自于 DataCamp 的数据科学研究员。她在本文中介绍一份 Python 中数据导入操作的速查表,雷锋网 AI 科技评论对原文进行了编译。
借助这个 Python 速查表,你将拥有一份便捷的数据导入参考指南。该速查表全面涵盖了平面文件(Flat files)、其它软件所定义的原生文件类型以及关系型数据库数据的导入方法。
在你对数据进行清理、可视化等操作之前,我们首先需要实现的事情是使用 Python 导入数据。而众所周知,针对不同的数据文件存在着许多不同的导入方法。
但是,你最经常使用的库可能就是 Pandas 和 Numpy:Pandas 库是最受数据科学家喜爱的软件库之一,他们经常使用 Pandas 对数据进行操作和分析,然后再使用 matplotlib 进行数据可视化。而 Numpy 则是 Python 中进行科学计算的一个基础库,并且 Pandas 也是构建于 Numpy 之上的。
在这份数据导入速查表中,你将看到一些 Numpy 和 Pandas 的函数,以及使用 Python 语言编写的函数,这些都将帮助你更快捷地将数据导入 Python。
这份教程将帮助你快速学习和掌握将数据导入 Python 中的基础操作,以便于你可以对数据开展后续的清理和可视化等操作。
速查表传送门
这份速查表将引导你学习掌握如何将数据导入实验环境的基础:你不仅会学到如何导入诸如文本文件这样的平面文件,也能看到如何读取那些来自于特定软件的文件(比如 Excel、Stata、SAS 和 MATLAB)和关系型数据库。最重要的是,你将获得更多关于如何寻求帮助的指示,如何浏览文件系统以及如何开始探索数据信息。
总而言之,这里有你所需要的所有知识,来帮助你开启基于 Python 的数据科学学习大门。
如果你还想获得更多的知识,那么现在可以免费来学习这门《Python 数据导入课程》或者尝试一下我们的使用 Python 玩转 Excel 教学!
当然,别忘了我们为数据科学而制作的 Python 速查表,并且在我们的社区能获得更多类似的速查表!
备注:速查表传送门
Via Importing Data in Python Cheat Sheet,雷锋网编译