Python教程-Python读写CSV文件

前言

本教程学习在Python中使用CSV文件。CSV（逗号分隔值）格式是在电子表格和数据库中使用的非常流行的导入和导出格式。Python语言包含该模块，该模块具有用于读取和写入CSV格式的数据的类。csv

使用csv.reader（）读取CSV文件

该csv.reader()方法返回一个reader对象，该对象将遍历给定CSV文件中的行。
假设我们有以下d:/py/xample1.csv文件，内容

1,2,3,4
11,22,33,44
111,222,333,444

以下python脚本从此CSV文件读取数据。

$title(read-cvs.py)
import csv
f=open('d:/py/example1.csv','r')

with f:
	reader=csv.reader(f)
	for row in reader:
		print(row)

命令执行输出：

在上面的代码示例中，我们打开了d:/py/xample1.csv以读取并使用csv.reader()方法加载数据。

现在，假设CSV文件将使用其他分隔字符。（严格来说，这不是CSV文件，但是这种做法很常见。）例如，我们有以下items.csv文件，其中的元素由竖线字符（|）分隔：

笔|桌子|键盘

以下脚本从items.csv文件读取数据。

import csv
 
f = open('d:/py/items.csv', 'r')
 
with f:
 
    reader = csv.reader(f, delimiter="|")
    for row in reader:
        for e in row:
            print(e)

我们delimiter在csv.reader()方法中使用参数指定新的分隔字符。

使用csv.DictReader读取CSV文件

该csv.DictReader班的运作就像一个普通的读者，但读入字典中的信息映射。
字典的键可以与fieldnames参数一起传递，也可以从CSV文件的第一行推断出来。
我们有以下values.csv文件：

min, avg, max
1, 5.5, 10

第一行代表字典的key，第二行代表value。

mport csv
 
f = open('values.csv', 'r')
 
with f:
 
    reader = csv.DictReader(f)
    for row in reader:
        print(row)

上面的python脚本使用读取values.csv文件中的值csv.DictReader。
这是示例的输出。

{'max'：'10','min'：'1','avg'：'5.5'}

使用csv.writer（）写入CSV文件

该csv.writer()方法返回一个writer对象，该对象负责将用户数据转换为给定文件状对象上的分隔字符。

import csv
 
nms = [[1, 2, 3, 4, 5, 6], [7, 8, 9, 10, 11, 12]]
 
f = open('numbers2.csv', 'w')
 
with f:
 
    writer = csv.writer(f)
    for row in nms:
        writer.writerow(row)

该脚本将数字写入numbers2.csv文件。该writerow()方法将一行数据写入指定的文件。
该脚本将产生以下文件（numbers2.csv）：

1,2,3,4,5,6

7,8,9,10,11,12

一次写入所有数据是可以的。该writerows()方法将所有给定的行写入CSV文件。
下一个代码示例将Python列表写入numbers3.csv文件。该脚本将三行数字写入文件。

import csv
 
nms = [[1, 2, 3], [7, 8, 9], [10, 11, 12]]
 
f = open('numbers3.csv', 'w')
 
with f:
 
    writer = csv.writer(f)
    writer.writerows(nms)

运行上述程序时，以下输出将写入numbers3.csv文件

1,2,3

7,8,9

10,11,12

报价单

可以在CSV文件中引用单词。Python CSV模块中有四种不同的引用模式：

QUOTE_ALL —引用所有字段
QUOTE_MINIMAL-仅引用包含特殊字符的字段
QUOTE_NONNUMERIC —引用所有非数字字段
QUOTE_NONE —不引用字段

在下一个示例中，我们向items2.csv文件写入三行。所有非数字字段均用引号引起来。

import csv
 
f = open('items2.csv', 'w')
 
with f:
 
    writer = csv.writer(f, quoting=csv.QUOTE_NONNUMERIC)
    writer.writerows((["coins", 3], ["pens", 2], ["bottles", 7]))

该程序将创建以下items2.csv文件。引用项目名称，不引用数字表示的数量。

"coins",3
"pens",2
"bottles",7

CSV方言

尽管CSV格式是一种非常简单的格式，但还是有许多差异，例如不同的定界符，换行或引号字符。因此，有不同的CSV方言可用。
下一个代码示例将打印可用的方言及其特征。

import csv
 
names = csv.list_dialects()
 
for name in names:
     
    print(name)
     
    dialect = csv.get_dialect(name)
     
    print(repr(dialect.delimiter), end=" ")
    print(dialect.doublequote, end=" ")
    print(dialect.escapechar, end=" ")
    print(repr(dialect.lineterminator), end=" ")
    print(dialect.quotechar, end=" ")
    print(dialect.quoting, end=" ")
    print(dialect.skipinitialspace, end=" ")
    print(dialect.strict)

在csv.list_dialects()返回方言名称的列表和csv.get_dialect()方法返回与方言名称相关联的方言。

excel
',' 1 None '/r/n' " 0 0 0
excel-tab
'/t' 1 None '/r/n' " 0 0 0
unix
',' 1 None '/n' " 1 0 0

程序将打印此输出。有三个内置的方言excel，excel-tab和unix。

自定义CSV方言

在本教程的最后一个示例中，我们将创建一个自定义方言。使用该csv.register_dialect()方法创建自定义方言。

import csv
 
csv.register_dialect("hashes", delimiter="#") #自定义一个新的方言，方言名称hashes，分隔符 “#”
 
f = open('items3.csv', 'w')
 
with f:
 
    writer = csv.writer(f, dialect="hashes") #指定 新自定义的方言
    writer.writerow(("pencils", 2)) 
    writer.writerow(("plates", 1))
    writer.writerow(("books", 4))

该程序使用（＃）字符作为分隔符。使用方法中的dialect选项指定方言csv.writer()。
该程序将产生以下文件（items3.csv）：

pencils#2
plates#1
books#4

在本教程中，我们探索了Python csv模块，并介绍了一些在python中读写CSV文件的示例。

原创文章，作者：kepupublish，如若转载，请注明出处：https://blog.ytso.com/243742.html