最近用node在做爬虫开发,遇到的网站一堆table嵌套,还是深层的,没有id没有class,真不知道怎么做数据分析,请有经验的人指点下,而且抓来 的数据中文部分变成了★ 请之类的,也不知道怎么转回中文,求指点啊
没有 id 没有 class 说明这个网站的 css 也是用数组索引在定位啊。。就从了它吧。 cheerio 解析之后,用 [0] [1] 去取出来。 中文的问题,难道源站不是 utf-8?用 iconv-lite https://github.com/ashtuchkin/iconv-lite 转码。
CNode 社区为国内最专业的 Node.js 开源技术社区,致力于 Node.js 的技术研究。
没有 id 没有 class 说明这个网站的 css 也是用数组索引在定位啊。。就从了它吧。 cheerio 解析之后,用 [0] [1] 去取出来。 中文的问题,难道源站不是 utf-8?用 iconv-lite https://github.com/ashtuchkin/iconv-lite 转码。