爬取gbk乱码问题
2018-06-23 •
评论
前言
最近在爬学校图书馆借阅信息,laravel中采用的是HtmlParser扩展包,这个扩展包博主一直用来爬取教务系统,学校教务系统是正方gb2312编码,所以通过mb_convert_encoding
转成utf8就解决问题。而这次爬取图书馆系统出现大问题,mb_convert_encoding
转成utf8仍然是乱码。
- 大致爬下来的样子
最近在爬学校图书馆借阅信息,laravel中采用的是HtmlParser扩展包,这个扩展包博主一直用来爬取教务系统,学校教务系统是正方gb2312编码,所以通过mb_convert_encoding
转成utf8就解决问题。而这次爬取图书馆系统出现大问题,mb_convert_encoding
转成utf8仍然是乱码。