node request 数据采集
发布于 10 年前 作者 yuyunliuhen 5779 次预览 最后一次回复是 10 年前 来自 问答
一个网站有的网页能正确转化中文 有的不能 可能原因是什么?字符集是gb2312,比如一个页面的分页1是OK的,2就是乱码 部分代码:
var url = require('url').parse('http://jbk.39.net/jiancha/search/F_p2'); //可以采集
var url = require('url').parse('http://jbk.39.net/jiancha/search/F_p1');//乱码
var iconv = require('iconv-lite');
var BufferHelper = require('bufferhelper');
http.get(url,function(res){
var bufferHelper = new BufferHelper();
res.on('data', function (chunk) {
bufferHelper.concat(chunk);
});
res.on('end',function(){
console.log(iconv.decode(bufferHelper.toBuffer(),'gb2312'));
});
})
~
2 回复
https://cnodejs.org/topic/532269f4d7ede09c72000a88 这个解决了问题。
楼主看一下 Markdown 语法, 帮你标记了