百度站长平台里面的外链分析功能,能够让我们非常清晰的看到我们网站的有效外链,对于垃圾外链也提供了拒绝功能。但是如果外链数据成千上万条的时候,我们不可能再去一条条的查看。当然,一般的企业站和个人站正常情况下,外链是不会有这么多的。但是有一种情况就是,如果你在一些资讯平台投稿或者视频网站发了外链,然后被一些垃圾站大量采集、重复采集,这个时候,你会发现你的外链增长是呈90度增长的。那么当外链数量非常庞大的时候,我们怎么快速的进行筛选呢?本文就和大家分享一个小编自己的方法,如果大家有更好的办法也可以交流下!
1、大家看一下,我的网站外链增长信息,我自己是不可能发这么多外链的,大多都是站群采集我的外链内容。
2、下载外链数据表格,我们可以看到外链的详细情况。
3、在表格当中选择“链接到您网站的url”这一列,复制到一个txt文件当中,然后用excel打开这个txt文件会看到:
用这种方法,我们可以得到一个以“/”为分隔符的表格,也就是说我们可以得到链接到你网站的URL的二级域名或者是一级域名。
接着,大家选择A列,利用excel表格的去重复功能,去除重复的表格。然后大家把这些剩下的A列当中的网址复制以下,利用“奏鸣工具”里面的“百度收录排名查询 ”功能就可以批量检测出来这些url的标题,然后下载表格,看到标题是涉及黄赌毒的就复制到另外的表格当中,这样能够很快筛选出来垃圾外链!
筛选出来之后,大家可以选择批量拒绝外链,每次可以添加1000条,类别可以选择“站点”!如果想要选择“主域”,那么大家可以用excel替换功能,把“www.”替换掉就行了!
不知道大家有没有什么特别好的方法。另外还有一个问题就是,百度站长平台的外链数据,每隔一段时间就会更新一次的,这个时候我们又需要进行筛选垃圾外链,怎么做呢?如果上面介绍的方法大家都熟悉了就简单了!
大家把最新更新的外链数据表格和已经拒绝的外链表格下载下来,然后根据上面说到的方法,得到一级域名或者二级域名,分别放在excel里面A列和B列,然后全选A列和B列,选择excel当中的“数据-重复项-高亮显示重复值”,这样的话就可以把A和B当中相同的url显示成另外一个颜色。
我们假设在A列当中,我们放的是最新的外链数据,那么这个时候,A和B里面,相同的已经显示出来了,我们只需要查看A列当中不相同的那些URL是不是垃圾外链就行了。我们选中A列,点击“自动筛选”然后选择“颜色筛选”,如果大家选择筛选白颜色,那么就能够把A列当中那些没有和B列当中重复的URL筛选出来,下面的步骤就是把这些url批量放在奏鸣工具当中查询一下!
看似是有些麻烦,不过这个是我摸索出来相对来说简单点的方法了,起码比一个个的查看会快很快,大家如果有更好的方法,交流下,这个活儿很苦逼的!