对于大多数网站而言,快速获得Google SEO的好处是,在缺少它们的标题标签中加入排名靠前的关键字。
如果某个页面已经在某个关键字上排名,并且该关键字的title标题中没有该关键字,那么如果我们以自然的方式添加该字词,则该页面的排名可能会更高
如果我们还将关键字添加到meta描述中,也可以在搜索结果中将其以粗体突出显示。
使用深度学习自动进行标题标签优化
现在,如果您在一个拥有数百,数千或数百万个页面的站点上工作,那么手动执行此操作将变得非常耗时且成本过高!
也许这是我们可以教一台机器为我们做的事情。
它最终可能比数据输入团队做得更好,更快。
让我们找出答案。
重新引入Uber的路德维希和Google的T5
我们将结合前几节中介绍的几种技术:
优步的路德维希
Google的T5(文本到文本传输转换器)
在我的《使用深度学习进行自动意图分类》一文中,我首先介绍了路德维希。
总之,这是一个开放源代码的“自动ML”工具,可让您无需编写任何代码即可训练**进的模型。
我首先在文章如何自动生成标题和元描述中介绍了T5 。
使用深度学习自动进行标题标签优化
Google将T5描述为BERT样式模型的高级版本。
如果您还记得我有关意图分类的文章,那么BERT非常适合完成此任务,因为我们的目标输出/预测是类/标签(意图)。
相比之下,T5可以进行总结(就像我在有关元标记生成的文章中所展示的那样),翻译,回答问题,分类(例如BERT)等。
这是一个非常强大的模型。
现在,据我所知,T5尚未经过标题标签优化的培训。
也许我们可以做到!
我们会需要:
训练数据集,其示例包括:
没有目标关键字的原始标题标签
我们的目标关键字
使用我们的目标关键字优化标题标签
T5微调代码和后续教程
一组未优化的标题,可用于测试模型
我们将从我已经从HootSuite提取的SEMrush数据中汇总的数据集开始。我将分享有关如何一起编译这样的数据集的说明。
T5的作者慷慨地整理了一个详细的Google Colab笔记本,您可以使用它来微调T5。
如果您运行它,则可以使用它来回答任意琐事问题。我实际上是在7月份的SEJ eSummit演讲中做到的。
使用深度学习自动进行标题标签优化
它们还包括一个部分,说明如何针对新任务对其进行微调。但是,当您查看所需的代码更改和数据准备时,要弄清楚我们的想法是否切实可行,似乎需要进行大量工作。
也许有一个更简单的方法!
幸运的是,Uber在几个月前发布了Ludwig版本0.3。
0.3版随附:
一种超参数优化机制,可从模型中压缩其他性能。
与Hugging Face的Transformers资源库进行了无代码集成,使用户可以访问**进的预训练模型,例如GPT-2,T5,Electra和DistilBERT,以进行自然语言处理任务,包括文本分类,情感分析,命名实体识别,问题解答等等。
基于TensorFlow 2的新的,更快的,模块化的和可扩展的后端。
支持许多新的数据格式,包括TSV,Apache Parquet,JSON和JSONL。
开箱即用的K折交叉验证功能。
与权重和偏差的集成,用于监视和管理多个模型训练过程。
一种新的矢量数据类型,支持带噪标签以进行弱监管。
该版本包含了新功能,但我最喜欢的功能是与Hugging Face的Transformers库的集成。
本文由上海上弦发布,不代表上海上弦立场,转载联系作者并注明出处:使用深度学习自动进行标题标签优化 https://www.sun.sh.cn/title-tag-optimization-using-deep-learning/