下面是“十分钟教会你用Python处理CSV文件”的完整实例教程。
1. 下载CSV文件
首先我们需要获取一份CSV文件,你可以在网上搜索到各种不同样式的CSV文件,但为了本教程的目的,我们选择从 Kaggle 上下载一份经典的鸢尾花数据集。
你可以访问 这个链接,并下载名为 Iris.csv
的文件。
2. 导入CSV文件
下载完毕之后,我们需要使用 Python 打开和读取 CSV 文件。这部分操作我们可以使用 pandas
这个工具包来完成。
打开 Jupyter Notebook 或者 Python 命令行,输入以下命令(需要你已经安装了 pandas),在当前目录下创建一个名为 iris.csv
的文件,并且导入了该文件的数据:
import pandas as pd
data = pd.read_csv('Iris.csv')
这里,我们使用 read_csv
函数来读取文件,并将结果储存在一个名为 data
的变量中。
3. 查看CSV文件
接下来,我们可以使用 head()
函数来展示前五行数据,也可以使用 shape
来查看数据集大小。
data.head()
输出结果:
Id SepalLengthCm SepalWidthCm PetalLengthCm PetalWidthCm Species
0 1 5.1 3.5 1.4 0.2 Iris-setosa
1 2 4.9 3.0 1.4 0.2 Iris-setosa
2 3 4.7 3.2 1.3 0.2 Iris-setosa
3 4 4.6 3.1 1.5 0.2 Iris-setosa
4 5 5.0 3.6 1.4 0.2 Iris-setosa
data.shape
输出结果:
(150, 6)
4. 修改CSV文件
有了数据集以后,我们可以对其进行修改。比如,我们可以将 SepalLengthCm
数据加上 1,并将结果保存为新的 CSV 文件。
data['SepalLengthCm'] = data['SepalLengthCm'] + 1
data.to_csv('new_iris.csv')
你可以使用同样的方法,读取并查看新的 CSV 文件。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:十分钟教会你用Python处理CSV文件 - Python技术站