爬取gbk乱码问题
前言
最近在爬学校图书馆借阅信息,laravel中采用的是HtmlParser扩展包,这个扩展包博主一直用来爬取教务系统,学校教务系统是正方gb2312编码,所以通过mb_convert_encoding
转成utf8就解决问题。而这次爬取图书馆系统出现大问题,mb_convert_encoding
转成utf8仍然是乱码。
- 大致爬下来的样子
博主在Mac下做PHP开发用的是MAMP集成开发环境,最近在下载horizon
composer包是出现PHP不支持pcntl扩展,查下谷歌发现MAMP的集成环境是没有这个扩展包的,需要手动编译安装这个包。好吧下面说下做法哈!
之前博主一直用bash,后来该用zsh,结果安装laravel项目指定安装版本时出现zsh: no matches found
。