案例:使用node.js写一个爬虫

npm中右一个crawler模块是专门用来爬取数据的,可以将爬取的数据保存在数据库中,代码使用过程如下:

// 导入模块 mysql
const mysql=require('mysql');
// 导入模块 Crawler
const Crawler=require('Crawler');
//创建数据库连接
var connection = mysql.createConnection({
    host     : 'localhost',
    user     : 'root',
    password : 'root',
    database : 'cong'
  });
   
//实例化爬虫对象
var c = new Crawler({
    maxConnections : 10,
    // This will be called for each crawled page
    callback : function (error, res, done) {
        if(error){
            console.log(error);
        }else{
            var $ = res.$;
            // $ is Cheerio by default
            $('#feed-main-list li').each((index,element)=>{
            // 标题
            let title=$(element).find('.z-feed-title a').text();
            let content=$(element).find('.z-feed-img img').attr('src');
            
            var post  = {title,content};
            connection.query('INSERT INTO text SET ?', post, function (error, results, fields) {
            if (error) throw error;
            console.log(results);
  });
            })
  
   

        }
        done();
    }
});


 // 爬取数据
// Queue just one URL, with default callback

for(let i=0;i<5000;i++){
c.queue('https://post.smzdm.com/p'+i);
}

效果图: 案例:使用node.js写一个爬虫

案例:使用node.js写一个爬虫

相关推荐