python笔记5-python2写csv文件中文乱码问题

前言

python2最大的坑在于中文编码问题,遇到中文报错首先加u,再各种encode、decode。
当list、tuple、dict里面有中文时,打印出来的是Unicode编码,这个是无解的。
对中文编码纠结的建议尽快换python3吧,python2且用且珍惜!

一、csv中文乱码

1.open打开csv文件,用writer写入带有中文的数据时

- writer写入单行
- writers写入多行

```
# coding:utf-8
import csv

f = open("xieru.csv", 'wb')
writer = csv.writer(f)

# 需要写入的信息
data = ["客户名称", "行业类型", "客户联系人", "职位", "联系方式", "邮箱","地址"]

writer.writerow(data)       # 写入单行
# writer.writerows(datas)    # 写入多行

f.close()
```

2.打开csv文件,发现写入的中文乱码了

二、编码与解码

1.中文乱码问题一直是python2挥之不去的痛,这里先弄清楚乱码原因:

- python2本身内部代码的编码有str和unicode两种编码
- 然而文件写入到windows系统时候,windows上的是gb2312编码

所以就导致了乱码问题

2.先把python里面的中文字符串decode成utf-8,再encode为gbk编码
> data.decode('utf-8').encode('gbk')

3.如果是读取csv文件的话,就反过来:
> data.decode('gbk').encode('utf-8')

三、解决方案

1.方案一:对字符串转换编码(这个太麻烦了,不推荐)
```
# coding:utf-8
import csv

f = open("xieru1.csv", 'wb')
writer = csv.writer(f)

# 需要写入的信息
data = ["客户名称", "行业类型", "客户联系人", "职位", "联系方式", "邮箱","地址"]

a = []
for i in data:
    a.append(i.decode("utf-8").encode("gbk"))

writer.writerow(a)           # 写入单行
# writer.writerows(datas)    # 写入多行

f.close()
```

2.方法二:用codecs提供的open方法来指定打开的文件的语言编码,它会在读取的时候自动转换为内部unicode (推荐)

```
# coding:utf-8
import csv, codecs

import sys
reload(sys)
sys.setdefaultencoding('utf8')

f = codecs.open("xx.csv", 'wb', "gbk")
writer = csv.writer(f)
writer.writerow(["客户名称", "行业类型", "客户联系人", "职位", "联系方式", "邮箱","地址"])

# 多组数据存放list列表里面
datas = [
    ["客户名称", "行业类型", "客户联系人", "职位", "联系方式", "邮箱","地址"],
    ["客户名称", "行业类型", "客户联系人", "职位", "联系方式", "邮箱","地址"],
    ["客户名称", "行业类型", "客户联系人", "职位", "联系方式", "邮箱","地址"],
       ]

writer.writerows(datas)
f.close()
```

(0)

相关推荐

  • 【Python面试】 说说4种常用编码的区别?

    公众号新增加了一个栏目,就是每天给大家解答一道Python常见的面试题,反正每天不贪多,一天一题,正好合适,只希望这个面试栏目,给那些正在准备面试的同学,提供一点点帮助! 小猿会从最基础的面试题开始, ...

  • Python使用csv模块读写csv文件

    csv是逗号分隔值(Comma-Separated Values)的简称. 有时也称为字符分隔值,因为分隔字符也可以不是逗号,其文件以纯文本形式存储表格数据.纯文本意味着该文件是一个字符序列,不含必须 ...

  • 如何解决Python3写入CSV出现 gbk codec cannot encode的错误?

    今天,我在 Windows 上用 Python3 爬取知乎上有关中医的问答,但是在把爬取的内容写进CSV文件的时候,出现了以下异常. UnicodeEncodeError: 'gbk' codec c ...

  • Excel打开csv文件出现乱码的解决方法

    CSV文件是一种数据文件,正常情况下,我们可以直接在excel表格中打开CSV文件,不过有时也会出现乱码,很多人不知道该如何解决.针对此种情况,本文详细介绍了Excel打开csv文件出现乱码的解决方法 ...

  • .Net Core 读取文件中文乱码

    首先,要知道.Net Core和.Net Framework两个环境下很多东西是不同的,接下来要说的这个就是其中一个. Encoding.Default,在  .NET Framework 中,Def ...

  • Excel打开csv文件出现乱码怎么办 一招解决乱码问题

    Excel是常用的表格办公软件,而CSV文件是一种数据文件,通常,使用Excel打开CSV文件都是没有问题的,但是有时候也会出现乱码这样的情况,遇到这样的问题不知道如何去解决.今天小编就来教大家Exc ...

  • eclipse解决properties文件中文乱码(两种方试)

    第一种:大多数网上搜到的情况(不靠谱) 第一步:windows-->properties-->General-->Content Types-->text(如下图) 第二步:p ...

  • Python写的csv文件,如何让 Excel 双击打开不乱码?

    我们常常需要在 Python 中输出 CSV 文件,但你可能会发现,这些输出的 CSV文件,不能双击使用 Excel 打开,否则中文会变成乱码.例如下面这段代码: 登录后复制 import panda ...

  • python笔记4-遍历文件夹目录os.walk()

    前言 如何遍历查找出某个文件夹内所有的子文件呢?并且找出某个后缀的所有文件 一.walk功能简介 1.os.walk() 方法用于通过在目录树种游走输出在目录中的文件名,向上或者向下. 2.walk( ...

  • python笔记19-yaml文件写入(ruamel.yaml)

    前言 yaml作为配置文件是非常友好的一种格式,前面一篇讲了yaml的一些基础语法和读取方法,本篇继续讲yaml文件写入方法 用yaml模块写入字典嵌套字典这种复杂的数据,会出现大括号{ },不是真正 ...

  • python笔记49-yaml文件中变量的使用(锚点& 与 引用*)

    前言 在yaml文件中如何引用变量?当我们在一个yaml文件中写很多测试数据时候,比如一些配置信息像用户名,邮箱,数据库配置等很多地方都会重复用到. 重复的数据,如果不设置变量,后续维护起来就很困难. ...