大家都知道,网站收录的越多对自己的网站越好,其实,单页面的网站也可以获得很好的排名,尤其是百度排名。 的确,想用一个单独的页面去参加google排名,这的确有点困难,可是,单页面做百度排名,是肯定可行的,因为好多活生生的例子摆在眼前。百度,对页面收录多少参与的计算并不是很在意,只要你一个页面元素配置的好,完全可以赢的理想的排
baidu分词算法分析之三
上面说过,经过分析得出百度的分词系统采用双向最大匹配分词,但是后来发现推理过程中存在一个漏洞,而且推导出来的百度分词算法步骤还是过于繁琐,所以进一步进行分析,看看是否前面的推导有错误.
那 么以前的分析有什么漏洞呢?我们推导百度分词有反向最大匹配的依据是百度将"北京华烟云"分词为<北,京华烟云>,从这里看好像采用了反向最 大匹配,因为正向最大匹配的结果应该是<北京,华,烟云>,但是由此就推论说百度采用了双向最大匹配还是太仓促了,前面文章我们也讲过,百度 有两个词典,一个普通词典,一个专有词典,而且是专有词典的词汇先切分,然后将剩余片断交给普通词典去切分.所以上面的"北京华烟云"之所以被切分成 <北,京华烟云>,另外一个可能是:京华烟云这个词汇是在专有词典里面存储的,所以先分析,这样得出"京华烟云",剩下"北",没什么好切分 的,所以输出<北,京华烟云>.
Tags: 分词系统 匹配分词 反向最大匹配
2008年10月21日 | 发布:笑傲江湖 | 分类:百度排名 | 评论:0 | 引用:0 | 浏览:
baidu分词算法分析之二
Spelling Checker拼写检查错误提示(以及拼音提示功能)
拼写检查错误提示是搜索引擎都具备的一个功能,也就是说用户提交查询 给搜索引擎,搜索引擎检查看是否用户输入的拼写有错误,对于中文用户来说一般造成的错误是输入法造成的错误.那么我们就来分析看看百度是 怎么实现这一功能的.
我们分析拼写检查系统关注以下几个问题:
(1)系统如何判断用户的输入是有可能发生错误的查询呢?
(2)如果判断是可能错误的查询输入,如何提示正确的词汇呢?
Tags: 拼音提示 检索词汇
2008年10月21日 | 发布:笑傲江湖 | 分类:百度排名 | 评论:0 | 引用:0 | 浏览:
baidu分词算法分析之一
查询处理以及分词技术
随着搜索经济的崛起,人们开始越加关注全球各大搜索引擎的性能、技术和日流量。作为企业,会根据搜索引擎的知名度以及日流量来选择是否要投放广告等;
作为普通网民,会根据搜索引擎的性能和技术来选择自己喜欢的引擎查找资料;作为技术人员,会把有代表性的搜索引擎作为研究对象. 搜索引擎经济的崛起,又一次向人们证明了网络所蕴藏的巨大商机。网络离开了搜索将只剩下空洞杂乱的数据,以及大量等待去费力挖掘的金矿。
但是,如何设计一个高效的搜索引擎?我们可以以百度所采取的技术手段来探讨如何设计一个实用的搜索引擎.搜索引擎涉及到许多技术点,比如查询处理,排序算法,页面抓取算法,CACHE机制,ANTI-SPAM等等.这些技术细节,作为商业公司的搜索引擎服
Tags: baidu分词
2008年10月21日 | 发布:笑傲江湖 | 分类:百度排名 | 评论:0 | 引用:0 | 浏览:
关于百度收录和排名的时间规律报告
百度收录是有时间规律的,你掌握了他的更新规律,你就能避免很多无用功。
周一,早上起来看一下排名.或许有些很小的变化.不用在意.最好在这一天的时候.换点链接,加点文章.这一天应该说是更新文章最好的时间.因为如果好点的文章.两天收录足够了.
周二,没更新文章的.尽快更新一下.别让蜘蛛来了没的吃.因为明天百度会有点小更新.上升或者下降很难说.但是一般情况下收录多了.排名也容易上升一点.
Tags: 百度收录 更新规律 一周大概更新时间
2008年10月21日 | 发布:笑傲江湖 | 分类:百度排名 | 评论:0 | 引用:0 | 浏览:
百度对网页收录问题
如何让我的网站(独立网站或者blog)被百度收录?
...
Tags: 百度收录 Robots协议
2008年10月18日 | 发布:笑傲江湖 | 分类:百度排名 | 评论:0 | 引用:0 | 浏览:
Search
Tags
- google排名 (14)
- Google (8)
- seo (7)
- 关键词 (6)
- 网站优化 (5)
- Google左侧排名 (4)
- 百度 (3)
- SEO服务 (3)
- 相关性 (3)
- 外链 (3)
- 蜘蛛 (3)
- 网络广告 (2)
- url (2)
- 外部链接 (2)
- 关键字 (2)
- 链接 (2)
- 整站优化 (2)
- 排名 (2)
- 地图 (2)
- 百度收录 (2)
- 检索 (2)
- 布尔模型 (2)
- 全文检索 (2)
- 新站 (2)
- PR (2)
- 长尾关键词 (2)
- 笑傲江湖 (1)
- 收录减少 (1)
- 封杀 (1)
- 网站排名 (1)
- 百度拔毛 (1)
- 联系我们 (1)
- google AdSense (1)
- 网上营销 (1)
- 网站品质 (1)
- 无聊 (1)
- Google-style (1)
- LOGO事件 (1)
- zblog (1)
- 爬虫 (1)
- 软文 (1)
- 爬行器 (1)
- 术语 (1)
- 百度洗牌 (1)
- 优化过度 (1)
- 因素 (1)
- 价值 (1)
- 病毒性营销 (1)
- 搜索引擎推广 (1)
- 资源合作 (1)