MENU

标签 爬虫 下的文章

爬取gbk乱码问题

前言

最近在爬学校图书馆借阅信息,laravel中采用的是HtmlParser扩展包,这个扩展包博主一直用来爬取教务系统,学校教务系统是正方gb2312编码,所以通过mb_convert_encoding转成utf8就解决问题。而这次爬取图书馆系统出现大问题,mb_convert_encoding转成utf8仍然是乱码。

  • 大致爬下来的样子
    58-1

阅读全文