网站目标分解如何让google找到本站如果要被google收录,首先需要让google找到本站,google有三种办法找到本站:a.安装了google工具条的人访问本站,如果本站尚未被google收录过,那么google就会从工具条返回的中了解本站的受用户欢迎程度,并对本站进行网页抓取。b.其他网站对本站的,当其他网站的页面已经被google收录,上面有本站,google就能通过超链分析找到本站。c.当有用户以site语句查询本站时,也能让google主动收录本站。提升本站在搜索结果中的排名Google对搜索结果的排名因素:a.着名的PageRank技术,也就是本站的网页的重要程度,其实,从经验看,这个技术所起的作用越来越小。b.全站被收录页数,同样一个网页,放在被收录页数只有几百页的网站里和被收录页数达到几十万的网站里时,被搜索引擎命中的可能性相差十分悬殊,在持续一个多月的测试里,一个内容比较偏色情的网页,在只被搜索引擎几百页的网站里被搜索引擎用户命中的次数平均每天不到一次,而被搜索引擎几十万页的另一个网站里被搜索引擎用户命中数平均每天一百次上下,而且比较稳定。c.被用户访问情况,google做了这样的用户行为假定,如果一个网页重要程度还不足以让用户收藏,但是用户有回访的兴趣时,就有很大可能性去通过搜索引擎找回这个网页,所以,根据用户搜索结果的投票可以判断一个网页的受欢迎程度,这个方法甚至比pagerank更符合用户需求。针对排名因素做文章a.提升网页的PageRank,其实,只要做到受用户欢迎,就可以提升pagerank,举例来说,某个站点的热门内容排行页面,没有什么外部,站内也只有一个,但是由于内容很受欢迎,所以PageRank值能达到5,前面也说了,这个值现在看是越来越不重要了,所以……b.提升被收录网页数,不要以为网站放到网上就会被搜索引擎,SNS以及博客站点,站点与站点之间如果没有桥梁,很容易断链,而且并不是说有就可以被收录,做超链分析时很多是要跳过的。1)网页之间不要有断链,博客之类网站设计时很容易留下断链,长时间不更新的用户,从首页是怎么都点不过去的,人点不过去,搜索引擎也就爬不过去,一个解决办法是象黄页网站一样加用户名索引页。2)google处理网页的办法,由起始网页收集三次(不含起始网页)的全部网页,集中处理这些网页的所有,静态页的相对不加次,但是跳转和重写都要计成两次(如果A到B时B经过了一次跳转,那么这次跳转要消耗掉一次,这次路径只再走一步),设为首页所有网页排序,按起始网页重要程度分配线程进行处理,如果处理能力不足,跳步处理(按他们自己说法,是按一个哈希表做跳步)。跳步处理把对应网页写到一起处理,把每对body视为一个网页计数。知道google处理网页的办法,我们就找到了很多网页没被收集的原因,需要重算(不含静态相对地址)的地址因为被计了两次,所以难以与互链网页形成回路,被收集的次数很小了,当线程分配不足时,可能就在跳步的时候跳过去了,另外,在排序的时候,问号由于被程序当做宏,可能会导致含问号的处理错误,如果希望被到A页(A页已被google收录)的B页一定被收录,那么从A页开始的三次里要有多一些路可以指向B页才行,这是门页技术吗?不是的,我们可以看看怎么实现:A——B(一次到达),A——B——A——B(两网页互链),A——B——B(B页有指向自身的,比如回到顶部之类),A——B——C——B(B页和C页有互链),主要就是这几类,那么多一些路是很容易的,尤其页内(博客的日志页一般都能达到,因为日志页里通常有近几篇日志的)。其实这基本上就可以看出来为什么动网的页数被收集少了,格式是大问题,而没有形成有效回路导致塔中数不足,也是大问题。其实可以通过修改发贴人“文集”指向来改善这个问题的,但一定要在生成页面的时候就把生成直接地址,需要跳转会导致收录不进去。由于google把每对body视为一个页面,所以,象oblog这样的日志系统页面是很容易被计算很多次的,虽然有内容的页面数少,但是前面说过,总页数多会导致网页更容易被命中,所以选择合适的系统肯定是有助于提升搜索引擎到访的。3)前面说了google价值观,其实也是提升搜索引擎到访量的最核心所在,提供对用户有帮助的内容,当用户没有记住网址而通过搜索引擎找回来,并且了本站,那么,就相当于给本站投票了,从目前的经验看,搜索引擎找回投票权重大于安装google工具栏访问本站,网页反倒是对搜索结果影响最小的,偏色情内容吸引流量特别有用(这类网址一般不会被收藏,但是用户有通过搜索引擎找回的愿望)。其实,一些内容网站如果象日志那样,设为首页把内容用日历扁平化串起来(网站结构就成了频道首页——日历页——当日内容列表页——内容页,历史内容不会被推到很难收录的深度),也会使网页更容易被搜索引擎。根据以往经验,被google收录页数在百万量级的网站,社会新闻类的内容页能吸引的搜索引擎到访量大约为10:1,频道被收录20万页时,每天通过搜索引擎到访的IP大约为2万,结构优化大约三个月后能达到稳定,用户原创内容20:1到30:1,比如博客或者,主要是回复的权值太低。前期如果使用一些工具进行热门内容数据采集,编辑适当进行加工整理,可以达到很好的效果。