欢迎来到非尔思科技
咨询,就免费赠送域名与服务器,咨询热线:18670727589当前位置: seo优化公司 > seo优化 > seo算法 >
联系我们
电话咨询:13760252015
邮箱:service@ec-8.cn
公司地址:深圳市宝安区松岗街道办佳裕大厦15楼1501-1502

关于百度算法中的“TF-IDF”算法详解

来源:百度算法知识 日期:2019-01-18 14:27 作者:非尔思科技
    前段时间我在小峰seo博客也写过一篇关于“TF-IDF”算法介绍,今天我在搜狐网中又看到了一篇关于这个百度算法的一些说明,我觉得是很值得借鉴,我也希望把这段话,给大家一起来探究seo优化公司是如何利用TF-IDF”算法来做关键词排名,接下来我们就一起来看看。
 
TF词频的概念与SEO建议
 
TF词频的概念与SEO建议
TF是指词频,查询的关键词在文档中出现的次数统计。相关文档是这样介绍的,假设查询关键词在同一个文档中出现的次数越多,代表这个关键词越重要,越能代表文档的主题意思,文章主题与关键词意思越接近,那么做SEO如何运用这个知识点呢?
 
假设有一篇文章的标题是:“SEO服务外包”,从字面上理解,文章主要是以SEO服务为核心,“外包”为拓展词。假设文章内容里SEO服务出现20次,服务出现25次,外包出现10次,按照TF词频的规则,那么SEO服务是文章主题,这个很好理解。
 
实际上有些时候写文章时,在意思很明确的情况下,会省略主词。比如SEO服务外包价格、SEO服务外包流程、SEO服务外包公司介绍,会缩写成:外包价格、外包流程、外包公司介绍。这样会导致外包出现的次数大于服务,TF词频则会认为外包是主题,出现错误的判断。
 
那既然是这样,做SEO关键词布局的时候,应该要适当考虑主关键词的出现频率大于副词。当然搜索引擎判断网页主题有很多维度,这里只是单从TF词频的角度考虑,个人认为这样做会缩短搜索引擎判断网页主题的时间,对SEO来说是有利的。
 
“IDF逆文档频率”介绍
 
“IDF逆文档频率”介绍
个概念如果看文档的话有点难理解,当初笔者看百度百科好几次才明白。涉及到复杂的公式在这里就不讲,结合TF一起来理解,TF-IDF的意思是,一篇文章中某关键词出现的次数越多,且在搜索引擎的资料库中包含该关键词文档数越少,则说明这个关键词越能代表此网页的主题。
 
举个例子来说明,假设有一篇文章,有两个关键词:“SEO优化”和“SEO服务”,在文章中,这两个关键词出现的资料都是20次,但是在百度的资料库中,包含SEO优化的文档总共有一千万个,包含SEO服务的文档有五百万个,那么则说明,SEO服务越能代表这文章的意思。或者搜索引擎资料库中包含关键词的文档数量一样,文章中出现次数越多的关键词越能代表网页主题。
 
seo优化公司总结:我们需要利用好关于“TF-IDF”算法,我需要真正的了解它的一些意思和它的应用过程,希望以上的内容可以给大家对于百度算法更加的了解,以上就是seo优化公司的全部介绍,希望可以帮助大家。