客户网站被搜索引擎**,根据客户的要求,对网站日志进行清洗,并找到**的原因。
1、此次数据位某网站的日志数据,日志条数位50多万条
2、每条数据中包含访问者IP、访问URL、访问时间、状态码、访客UA等十几个维度
3、此次数据清理工作主要分成两个步骤:第一将所有数据每个字段分隔开来,**出核心需要的内容,过滤掉不需要的内容;第二通过Excel公式分析出百度123.开头的蜘蛛访问情况,以及220开头的蜘蛛访问情况,并进行对比访问频次和占比,同时找到关键URL,从而帮助客户分析最大可能导致网站**的原因。
项目经历时长3天,并找到概率最高的原因为导航条的改版导致。客户将导航条样式恢复成历史版本的样式后,9天权重恢复。
为维护客户隐私,以下仅为示例图片,已除去IP等隐私数据
内容声明 :猪八戒网为第三方交易平台及互联网信息服务提供者,猪八戒网(含网站、客户端等)所展示的商品/服务的标题、价格、详情等信息内容系由店铺经营者发布,其真实性、准确性和合法性均由店铺经营者负责。猪八戒网提醒用户购买商品/服务前注意谨慎核实。如用户对商品/服务的标题、价格、详情等任何信息有任何疑问的,请在购买前与店铺经营者沟通确认;猪八戒存在海量店铺,如用户发现店铺内有任何违法/侵权信息,请立即向猪八戒网举报并提供有效线索。