首页/ 填坑/ 文章详情

Python 学习之旅:进击吧,爬虫!

Python 爬虫 中文乱码 utf-8 Requests 发布于 2021-03-02

Python是什么?爬虫,一款强大而实用的爬虫工具语言。初闻时,它已经是业内界大名鼎鼎,大数据的好伙伴,福利界的好帮手,曾一度被说成全世办最好的语言,可见其在程序员心中占有一席之位。

不管白猫黑猫,捉到耗子就是好猫。语言之争由来已久,能否担得起全世界最好的语言,还看应用场景,毕竟需求方才是爸爸。

Python初看极度不习惯,语言太过于简洁。对于最初接触C语言的我,怎么看Python都觉得是异类:

- 无须声名,直接赋值变量
- 无代码结束符,换行以示结束
- 无括号,以缩进符连接作用域

凭借以上3点特性,Python是比Javascript更不守规则的存在,意味着入门容易,精通难。想学好Python,对代码模块需要有一定的了解,不然可预见几万行拥挤的代码大乱炖,想想都可觉得可怕。

在其它语言的基础下,学习Python基础并不难,但架不住Python入门即劝退,差点将自已搞到崩溃。

中文编码报错:

PYprint ("你好,抵到烂")

# 错误提示
  File "test.py", line 1
SyntaxError: Non-ASCII character 'xe4' in file test.py on line 1, but no encoding declarea;  see 
http://python.org/dev/peps/pep-0263/ for details 

文件缺第一行缺少 # coding=utf-8,添加即可。

Print 中文输出乱码:

PY# coding=utf-8
print ("你好,抵到烂")

# 输出显示
浣犲ソ锛屾姷鍒扮儌

输出中文需要转义,输出时添加decode('UTF-8').encode('GBK') 即可。

PY# coding=utf-8
print ("你好,抵到烂").decode('UTF-8').encode('GBK')

# 输出显示
你好,抵到烂

Requests 调用错误:

PY# coding=utf-8

import requests

url = 'http://www.baidu.com'
restlt = requests.get(url)
print restlt.content

# 错误提示
Traceback (most recent call last):
  File "test.py", line 6, in   
    requests.get(url,params=params)
  File "C:python27libsite-packagesrequests-2.22.0-py2.7.eggrequestsapi.py", line 76,in get
    return request('get',url,params=params,**kwargs)
  File "C:python27libsite-packagesrequests-2.22.0-py2.7.eggrequestsapi.py", line 60, in request
    with sessions.Session() as session:  
  File "C:python27libsite-packagesrequests-2.22.0-py2.7.eggrequestssessions.py", line 422, in __init__
    super().__init__()
TypeError: super() takes at least 1 argument(0 given) 

这串代码提示,最初以为是缺少传递requests的参数,后来反复对比,代码参数没问题。接着怀疑requests库没装对,pip install requests 重装几次都没报错,实在无语了,最后发现还是错误出自于requests 版本库的问题。

PY# 指定 requests 版本库安装
pip install requests==2.5.3

学习一门新的语言,总会跌跌撞撞,习惯之后就好了。

相关文献:

Python才是世界上最好的语言 

文章评论0 records

最新 最早

0

最新评论Latest comments

凡心的仙人凡心的仙人 03-18 14:35
谢谢你了!
rantrismrantrism 2023-04-03 11:27
您好~我是腾讯云开发者社区运营,关注了您分享的技术文章,觉得内容很棒,我们诚挚邀请您加入腾讯云自媒体分享计划。完整福利和申请地址请见:https://cloud.tencent.com/developer/support-plan 作者申
唐牛才是食神唐牛才是食神 2022-06-15 10:51
(*°▽°*)八(*°▽°*)♪,解决了
唐牛才是食神唐牛才是食神 2022-06-15 10:49
发现不得了的东西,今晚回去好好研究下...
胖螺胖螺 2022-02-04 00:58
( ゜- ゜)つロ 在写了在写了。看到也有些感慨。因为站长前年在我原博客的留言,让我毅然选择去深造,选择读研,曾经我想过挺多东西的,还是自己本专业的适合我自己。在这先表达感谢。新年快乐!