最佳答案:写爬虫你一定要关注以下5个方面:1.如何抽象整个互联网抽象为一个无向图,网页为节点,网页中的链接为有向边。2.抓取算法采用优先队列调度,区别于单纯的BFS,对于每个网页设定一定的抓取权重,优先抓取权重