pycharm爬虫运行后console中文出现xe4\xb8\乱码的解决方法

最新推荐文章于 2024-08-08 17:59:21 发布

转载最新推荐文章于 2024-08-08 17:59:21 发布 · 2.6k 阅读

python 专栏收录该内容

18 篇文章

订阅专栏

本文介绍如何解决Python3爬虫抓取网页时遇到的中文乱码问题。通过使用正确的解码方式，将抓取到的byte字节转换为可读的字符串，确保输出内容正确。

对于Python3爬虫抓取网页中文出现输出乱码

import urllib.request

response = urllib.request.urlopen('http://www.12306.cn/mormhweb/')

html = response.read()
print(html)

上面的代码正常但是运行的时候结果遇到中文会以\xe7\x99\xbe\xe5\xba\xa6\xe4\xb8\x80代替，这是一种byte字节。

python 3输出位串，而不是可读的字符串，需要对其进行转换

使用str(string[, encoding])对数组进行转换

str(response.read(),'utf-8')

import urllib.request
response = urllib.request.urlopen('http://www.12306.cn/mormhweb/')

html =str(response.read(),'utf-8')
print(html)

这样就解决了中文不能输出问题，效果如下

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

autotest00

关注关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Python入门：input获取\xe4\xb8\xad字符正确解码

foryouslgme的博客

02-09

1万+

解决此问题需要理解几个点： python3中默认使用unicode编码，也就是说对中文的支持会更好，输入中文，直接显示中文。但是当在py文件中直接给变量赋值“\xe4\xb8\xad”时，python3就会直接在unicode中找对应的字符了，然后显示ä¸ 2. 当使用input获取到“\xe4\xb8\xad”，其实质在内存中是“\\xe4\\xb8\\xad”，所以展示给我们的才是“

python系列：PyCharm Python Console中文输出乱码问题及解决

weixin_54626591的博客

07-17

2264

PyCharm Python Console中文输出乱码问题及解决

参与评论您还未登录，请先登录后发表或查看评论

python中文编码

weixin_30458043的博客

10-19

324

前面章节中我们已经学会了如何用 Python 输出 "Hello, World!"，英文没有问题，但是如果你输出中文字符"你好，世界"就有可能会碰到中文编码问题。Python 文件中如果未指定编码，在执行过程会出现报错：#!/usr/bin/pythonprint "你好，世界";以上程序执行输出结果为： File "test.py", line 2SyntaxError: Non-ASCII ...

Python字符串乱码：\xe4\xb8\xad或者ordinal not in range(128)

u011412768的博客

09-07

8978

用Python极其不熟练的小白，近两个月被Python中的乱码问题虐得体无完肤，看了一些编码相关的文章，但是还是似懂非懂的，毕竟放到Python的编程环境中，跟纯理论还是不一样的，今天看到一篇比较好的文章，看完终于觉得能解决一些实际编码中遇到的问题了，保存下来以作总结学习。原文地址：https://blog.youkuaiyun.com/u013430189/article/details/4878661...

3种Python爬虫中文乱码的处理方法

Python_00001的博客

08-08

2165

Python爬虫在抓取网页数据时，经常会遇到中文乱码问题。这通常是因为网页的编码格式与Python处理时使用的编码格式不一致导致的。以下是三种常见的处理中文乱码的方法，并附上相应的代码示例。

\xe4\xb8\xad\xe6\x96\x87 phython 字符编码乱码问题

热门推荐

新旧问题集

09-28

5万+

为什么Python使用过程中会出现各式各样的乱码问题，明明是中文字符却显示成“\xe4\xb8\xad\xe6\x96\x87”的形式？为什么会报错“UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not in range(128)”？本文就来研究一下这个问题。字符串

PyCharm运行时跳多个Python Console窗口的解决方法

12-22

最开始安装PyCharm并用于运行程序的时候，发现总是在点击run运行一次程序的时候打开一个新的窗口，如下图显示。同一段程序每运行一次就出现一个新的Python Console窗口，看着很不舒服。二、解决方法：要想在...

解决在pycharm运行代码,调用CMD窗口的命令运行显示乱码问题

09-18

在Python开发过程中，PyCharm 是一款非常流行的集成开发环境（IDE）。然而，有时在使用 PyCharm 运行...通过调整PyCharm的设置，我们可以有效地解决在CMD窗口中运行代码时出现的乱码问题，确保代码的可读性和正确性。

pycharm运行程序时在Python console窗口中运行的方法

12-25

以上这篇pycharm运行程序时在Python console窗口中运行的方法就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持软件开发网。您可能感兴趣的文章:解决pycharm的Python console不能调试...

Empty test suite.(PyCharm程序运行错误的解决方法)

12-25

运行程序test4_4.py时报错，Empty test suite. 查找资料发现原因：默认情况下，PyCharm将检查以test开头的文件，它们是unittest.TestCase的子类，但是你可以控制模式和子类选项。根据您的测试文件名更改模式，它...

python2.7 解决写入.txt时中文显示问题，如 \xe4\xb8\xad\xe6\x96\x87

u010481688的博客

12-10

1835

说明：当读取到一个字符串时，内容包含了中文，如果想要把这个字符串写入window环境内创建的.txt文件内，会出现\xe4\xb8\xad\xe6\x96\x87情况，以下方法可以解决代码： file=open(str(f)+'.txt','w') attributesD = str(attributes[s]) aa=attributesD.decode("string_escape"...

urllib.request.urlopen(url)不能两次.read()?

weixin_44548627的博客

02-04

1289

笔者在初学Python爬虫时，用到 urllib.request.urlopen 获取百度搜索页面 (http://www.baidu.com) 上的信息，发现 urllib.request.urlopen(url) 在第二次调用 .read() 时变为空了，这是因为第一次调用 .read() 已经把所有字节都解读了。

解决pycharm中中文列表输出'\xe5\xa4\xa7\xe8\x92\x9c'之类的字符串

wqy94103的博客

08-09

2万+

#coding=utf-8 member=["贝贝","晶晶","欢欢"] print(member) print("北京欢迎您！") 如上代码块，结果输出为： [‘\xe8\xb4\x9d\xe8\xb4\x9d’, ‘\xe6\x99\xb6\xe6\x99\xb6’, ‘\xe6\xac\xa2\xe6\xac\xa2’] 北京欢迎您！该怎么解决以上pycharm中的中文列表输出的编码问题

汉字十六进制编码转换\xe4\xb8\xad\xe5\x9b\xbd

ITjianghuxiaoxiong的专栏

08-25

2万+

最近用wireshark抓包分析接口是遇到

python urlopen 乱码_Python 2.7.3 urllib2.urlopen 获取网页出现乱码解决方案

weixin_39646831的博客

12-16

678

出现乱码的原因是，网页服务端有bug，它硬性使用使用某种特定的编码方案，而并没有按照客户端的请求头的编码要求来发送编码。解决方案：使用chardet来猜测网页编码。1.去chardet官网下载chardet的py源码包。2.把chardet目录从源码包里解压到项目文件夹内。3.通过 import chardet 来引用它，然后：response = None#尝试下载网页try:response ...

输入中文错误：\xE4\xBB\x8E\xE5\x85\xA5...‘ for column ‘detail‘ at row 1

weixin_39371691的博客

11-03

569

编辑数据库，字符集改成utf-8在重新新建表就可以了。

SyntaxError: Non-UTF-8 code starting with ‘\xb8‘ in file

qq_44417051的博客

09-18

4925

1、python--遇到SyntaxError: Non-UTF-8 code starting with '\xb8' in file 在运行python中因为添加了中文注释，遇到SyntaxError: Non-UTF-8 code starting with '\xb8' in file 经过百度，说是Python的默认编码格式是UTF-8，若指定编码格式则需在开头添加如下代码：...

‘\\xe6\\xad\\xa3\\xe5\\xb8\\xb8‘ 双反斜杠转中文问题 in python

qq_40666620的博客

06-29

1252

python解析xml

pycharm运行报错：SyntaxError: Non-ASCII character '\xe7' in file

Smile

04-13

587

方法一：在Python源文件的最开始的第一行添加： **#coding=UTF-8 或 #coding：UTF-8 或 #-- coding:UTF-8 – 方**法二：pycharm默认添加编码格式： # -- coding: utf-8 -

pycharm爬虫运行时出现乱码