1.python网络爬虫正则表达式603066,732066,音飞储
123456789101112//还有这等事。
.哈哈import re file = open('xx.htm','r',encoding = 'gbk')allLines = file.readlines()xx = ''.join(allLines).encode('utf8').decode('utf8')a = re.findall(r'?',xx)#print(' '.join(a))for i in a: a = re.findall(r'd [.]?d*?|d{4}-d{2}-d{2}?|[u4e00-u9fa5] ',i) print(' '.join(a))file.close()。
转载请注明出处编程代码网 » python的encode