Python创建数据库

python数据库编码(python3.6cx)

1.python3.6 cx

我说下我遇到的情况

数据库字符集是 ZHS16GBK

错误的情况是

UnicodeDecodeError: 'gbk' codec can't decode byte 0xa7 in position 12: illegal multibyte sequence经过检查,在fetchall()获取记录时,查询到的记录里面有乱码(应该是不包含在数据库现有字符集下的字符)

临时的一个解决办法是

db=cx_Oracle.connect(dblink,encoding='UTF-8')这样可以读取了,读取到的内容为

广州市\ue738同泰路其中 '\ue738'应该是之前不可被读取的字符,希望对各位有帮助

Python连接数据库,Python与数据库,Python创建数据库

2.python3.4 编码有哪些

Python3中的编码问题前,第一个段落对字节、ASCII与Unicode与UTF-8等进行基本介绍,如果不对这几种编码犯头晕,可直接跳过。

ASCII与Unicode与UTF-8与GBK 首先从老大哥说起。跟很多人一样,大学读了这么久,久仰ASCII编码的大名。

要说这个老大哥,我们再先从字节说起。一个字节包括八个比特位,每个比特位表示0或1,一个字节即可表示从00000000到11111111共2^8=256个数字。

一个ASCII编码使用一个字节(除去字节的最高位作为作奇偶校验位),ASCII编码实际使用一个字节中的7个比特位来表示字符,共可表示2^7=128个字符。比如那时写C语言的程序,就经常要背下ASCII编码中的01000001(即十进制的65)表示字符'A',01000001加上32之后的01100001(即十进制的97)表示字符'a'。

现在打开Python,调用chr和ord函数,我们可以看到Python为我们对ASCII编码进行了转换。第一个00000000表示空字符,因此ASCII编码实际上只包括了 字母、标点符号、特殊符号等共127个字符。

因为ASCII是在美国出生的,对于由字母组成单词进而用单词表达的英文来说也是够了。但是中国人、日本人、韩国人等其他语言的人不服了。

中文是一个字一个字,ASCII编码用上了浑身解数256个字符都不够用。因此后来出现了Unicode编码。

Unicode编码通常由两个字节组成,共表示256*256个字符,即所谓的UCS-2。某些偏僻字还会用到四个字节,即所谓的UCS-4。

也就是说Unicode标准也还在发展。但UCS-4出现的比较少,我们先记住:最原始的ASCII编码使用一个字节编码,但由于语言差异字符众多,人们用上了两个字节,出现了统一的、囊括多国语言的Unicode编码。

在Unicode中,原本ASCII中的127个字符只需在前面补一个全零的字节即可,比如前文谈到的字符'a':01100001,在Unicode中变成了00000000 01100001。不久,美国人不开心了,吃上了世界民族之林的大锅饭,原本只需一个字节就能传输的英文现在变成两个字节,非常浪费存储空间和传输速度。

人们再发挥聪明才智,于是出现了UTF-8编码。因为针对的是空间浪费问题,因此这种UTF-8编码是可变长短的,从英文字母的一个字节,到中文的通常的三个字节,再到某些生僻字的六个字节。

解决了空间问题,UTF-8编码还有一个神奇的附加功能,那就是兼容了老大哥的ASCII编码。一些老古董软件现在在UTF-8编码中可以继续工作。

注意除了英文字母相同,汉字在Unicode编码和UTF-8编码中通常是不同的。比如汉字的‘中’字在Unicode中是0100111000101101,而在UTF-8编码中是11100100 1011100010101101。

我们祖国母亲自然也有自己的一套标准。那就是GB2312和GBK。

当然现在挺少看到。通常都是直接使用UTF-8。

记得我唯一一次看到GB编码的网页,是一个成人网站。Python3中的默认编码 Python3中默认是UTF-8,我们通过以下代码:import sys sys.getdefaultencoding() 可查看Python3的默认编码。

Python3中的encode和decode Python3中字符编码经常会使用到decode和encode函数。特别是在抓取网页中,这两个函数用的熟练非常有好处。

我的理解,encode的作用,使我们看到的直观的字符转换成计算机内的字节形式。decode刚好相反,把字节形式的字符转换成我们看的懂的、直观的、“人模人样”的形式。

如下图。\x表示后面是十六进制,\xe4\xb8\xad即是二进制的11100100 1011100010101101。

也就是说汉字‘中’encode成字节形式,是11100100 1011100010101101。同理,我们拿1110010010111000 10101101也就是\xe4\xb8\xad来decode回来,就是汉字‘中’。

完整的应该是b'\xe4\xb8\xad',在Python3中,以字节形式表示的字符串则必须加上前缀b,也就是写成上文的b'xxxx'形式。前文说的Python3的默认编码是UTF-8,所以我们可以看到,Python处理这些字符的时候是以UTF-8来处理的。

因此从上图可以看到,就算我们通过encode('utf-8')特意把字符encode为UTF-8编码,出来的结果还是相同:b'\xe4\xb8\xad'。明白了这一点,同时我们知道UTF-8兼容ASCII,我们可以猜想大学时经常背诵的'A'对应ASCII中的65,在这里是不是也能正确的decode出来呢。

十进制的65转换成十六进制是41,我们尝试下:b'\x41'.decode() 结果如下。果然是字符'A' Python3中的编码转换 据说字符在计算机的内存中统一是以Unicode编码的。

只有在字符要被写进文件、存进硬盘或者从服务器发送至客户端(例如网页前端的代码)时会变成utf-8。但其实我比较关心怎么把这些字符以Unicode的字节形式表现出来,露出它在内存中的庐山正面目的。

这里有个照妖镜:xxxx.encode/decode('unicode-escape') 输出如下 b'\\u4e2d'还是b'\u4e2d,一个斜杠貌似没影响。同时可以发现在shell窗口中,直接输'\u4e2d'和输入b'\u4e2d'.decode('unicode-escape')是相同的,都会打印出汉字‘中’,反而是'\u4e2d'.decode('unicode-escape')会报错。

说明说明Python3不仅支持Unicode,而且一个'\uxxxx'格式的Unicode字符可被辨识且被等价于str类。

编码,数据库,python

3.python3连接MSSQL数据库 中文乱码怎么解决

以前用php连mssqy时也经常出现中文乱码(中文变问号)的问题,那时就明白是编码没设置好导航,现在的Python连mssql数据库也同样出现这问题,问题一样,解决的办法当然也会相似,现在我们来看看解决方法。

python一直对中文支持的不好,最近老遇到编码问题,而且几乎没有通用的方案来解决这个问题,但是对常见的方法都试过之后,发现还是可以解决的,下面总结了常用的支持中文的编码问题(这些方法中可能其中一个就能解决问题,也可能是多个组合)。

(1)、首先,要保证文件的开头要加上编码设置来说明文件的编码

代码如下

复制代码

#encoding=utf-8

(2)、然后,在连接数据的连接参数里加上字符集说明查询出的结果的编码,这个不加的后果可能是查询出的汉字字符都是问号

代码如下

复制代码

conn=pymssql.connect(server='.',user='', password='',database='MyTest',charset='utf8')

(3)、设置python系统的默认编码(对于文件来说,这招几乎屡试不爽,呵呵~~)

代码如下

复制代码

import sys

reload(sys)

sys.setdefaultencoding('utf8')

注意:上述编码是“utf8”,而不是“utf-8”,我也没弄明白,大部分情况下,这个无所谓的,但是这里我试了必须要是“utf8”

一个简单的完整的python连接mssqlserver的例子如下(得安装pymssql包):

代码如下

复制代码

#encoding:utf8

import sys

reload(sys)

sys.setdefaultencoding('utf8')

import pymssql

try:

conn=pymssql.connect(server='.',user='', password='',database='MyTest',charset='utf8')

sql="select * from UserInfo"

cur=conn.cursor()

cur.execute(sql)

data=cur.fetchall()

conn.close()

print data

except Exception,e:

print e

运行结果如下:

代码如下

复制代码

[(u'20093501', u'xb9xf9xbexb8', u'u7537 ', 35, u'xb4xf3xcfxc0'),

(u'20093502', u'xbbxc6xc8xd8', u'u5973 ', 34, u'xc3xc0xc5xae'),

(u'20093503', u'xc1xeexbaxfcxb3xe5', u'u7537 ', 25, u'2Bxc7xe0xc4xea'),

(u'20093504', u'xc8xcexd3xafxd3xaf', u'u5973 ', 24, u'xc6xafxc1xc1')]

[Finished in 0.2s]

虽然摆脱了问号和乱码的困扰,但这仍不是我们想要的结果,但这个确实是正确的,因为结果是utf8编码。这个现象确实诡异,请教了许多高手,得知,最好的结果就是逐个字段查询,才能显示中文,整个查询的话,会以utf8的格式显示出来。

上述代码中第14行data是整个查询的结果,如果指定某个具体的字段,如print data[0][2](表示取查询结果的第一行第三列的字段的值),则会输出中文。

其实不仅仅是mssqlserver数据库,mysql(需下载MySQLdb包)、sqllite(python自带的文件数据库)、mongodb(需下载PyMongo包)等或者是普通文本文件也是类似的解决方案。

python数据库编码

转载请注明出处编程代码网 » Python创建数据库

资讯

python字典的排序

阅读(0)

本文主要为您介绍python字典的排序,内容包括python字典排序,Python字典如何排序啊,给例子谢谢,python对字典排序,代码如下。在Python2。7。x版本中, collections类增加了OrderedDict, 用法如下:pywugw@pywugw-lapt

资讯

python大小比较

阅读(0)

本文主要为您介绍python大小比较,内容包括Python中字符和数字之间是怎么比较大小的,python比较大小,python字符串怎么比较大小。任何两个对象都可以比较相同类型的对象(实例),如果是数字型(int/

资讯

python函数参数

阅读(1)

本文主要为您介绍python函数参数,内容包括Python函数中,参数是传值,还是传引用,python函数的几种参数类型,python函数参数、列表定义。这个问题的答案无外乎这几种说法:传值,传引用,对于可变对象是传引用,不可变对象是传值。 传引用 先看下面这

资讯

pathpython

阅读(1)

本文主要为您介绍pathpython,内容包括python语言中PYTHONPATH是什么,python怎么新建path,怎么在Path中添加Python路径。说明:windows下设置python环境变量,就是把python的安装目录添加到系统path中。2、步骤:1)确定python安装目录

资讯

数据结构与python

阅读(1)

本文主要为您介绍数据结构与python,内容包括学习python数据结构与算法分析前要先去学python吗,python数据结构,数据结构与算法Python语言描述。# -*- coding: <utf-8> -*-#-------------------2017-7-20--------------

资讯

pythonfrom.

阅读(2)

本文主要为您介绍pythonfrom.,内容包括python中fromstring怎么用,python中fromstring怎么用,Python的fromimport和import的区别。*就是通配,就是导入Blender的全部的模块2、用import Blender,下面的函数和数据前面都要加Blender.XXXXXX

资讯

字符串包含python

阅读(2)

本文主要为您介绍字符串包含python,内容包括python3判断是字符串中包含某些特定字符,python,如何提取包含在一个字符串中的列表或字典,python字符串是否包含指定字符。#! /usr/bin/python # -*- coding: utf-8 -*- import re zhPattern = r

资讯

python的json解析

阅读(1)

本文主要为您介绍python的json解析,内容包括如何用Python解析Json文件,python怎么解析json数据,python如何解析json代码分析。1234567importjsons =json.loads({"name":"test", "type":{"name":"seq",

资讯

python参数是函数

阅读(1)

本文主要为您介绍python参数是函数,内容包括Python函数中,参数是传值,还是传引用,如何在python中定义有参数说明的函数,python中,定义的函数中的参数是什么形式的?怎么觉得和C中的静态。这个问题的答案无外乎这几种说法:传值,传引用,对于可变

资讯

python字符化

阅读(1)

本文主要为您介绍python字符化,内容包括python如何用字符串实例化类,关于python的字符串格式化,python怎么将内容转化为字符。在python中也有类似于c中的printf()的格式输出标记。在python中格式化输出字符串使用的是%运算符,通用的形式为格

资讯

mongodbforpython

阅读(1)

本文主要为您介绍mongodbforpython,内容包括python怎么连接mongodb,Python语言怎么实现mongodb的查询操作?,如何安装pythonmongodb。通过pymongo可以很容易的链接到mongodb,下面的代码链接到本地mongodb,数据库为mydb,并检索出mycollectio

资讯

pythonforarcgis

阅读(1)

本文主要为您介绍pythonforarcgis,内容包括python怎么在arcgis里用,python怎么在arcgis里用,arcgis可以用python开发吗。在Pyhton写的一些代码,用户交互不方便,用户体验比较差,不方便重用。在ArcGIS中可以将用写的Python代码导入到ToolBox

资讯

python3python2

阅读(1)

本文主要为您介绍python3python2,内容包括python2和python3区别,Python2和3主要区别,python2和python3关于range的区别。如果你是一个初学者,或者你以前接触过其他的编程语言,你可能不知道,在开始学习python的时候都会遇到一个比较让人很头疼

资讯

python二维

阅读(1)

本文主要为您介绍python二维,内容包括python二维数据怎么绘图,Python二维列表,这是为什么?,如何在python中创建二维列表。Python中创建二维列表/数组,即创建一个list,并且这个list的元素还是list。可以用列表解析的方法实现。创建例子如下:2d_

资讯

pythoninsert()

阅读(1)

本文主要为您介绍pythoninsert(),内容包括python怎么用insert函数插入多个值,python初学者,一个关于的insert和sort的function,python批量insert每1000条插入一次,逻辑怎么写。def insert(lst,v):for index in range(len(lst)-1, -1,-1):if