MENU

分类 技巧 下的文章

GB2312, GBK, GB18030区别

背景

在做爬取学校正方教务系统,存储中文名字的的时候发现对于少见的文字都会以?代替,
这就很奇怪,明明教务系统上都可以正常显示,为什么爬取下来出问题?明明都是gb2312编码。我猜肯定是数据库用的是utf8格式,不然也会出问题啊。

阅读全文

爬取gbk乱码问题

前言

最近在爬学校图书馆借阅信息,laravel中采用的是HtmlParser扩展包,这个扩展包博主一直用来爬取教务系统,学校教务系统是正方gb2312编码,所以通过mb_convert_encoding转成utf8就解决问题。而这次爬取图书馆系统出现大问题,mb_convert_encoding转成utf8仍然是乱码。

  • 大致爬下来的样子
    58-1

阅读全文

api接口返回状态码

200 :正常响应 标准成功代码和默认选项。
201 :创建对象。 适用于存储行为。
204 :没有内容。 当一个动作成功执行,但没有任何内容可以返回。
206 :部分内容。 当您必须返回分页的资源列表时很有用。
400 :请求不正确 无法通过验证的请求的标准选项。
401 :未经授权 用户需要进行身份验证。
403 :禁止 用户已通过身份验证,但没有执行操作的权限。
404 :找不到资源自动返回。
500 :内部服务器错误。 理想情况下,您不会明确地返回此消息,但是如果发生意外中断,这是您的用户将会收到的。
503 :服务不可用 相当自我解释,还有一个不会被应用程序显式返回的代码。

阅读全文