首页 » 图像替代文本

图像替代文本

我们从使用 WooRank 的爬虫生成的 CSV 开始(在这里您可以调整代码并使用任何可以帮助您检测站点上缺少 MD 的位置以及在何处添加它们会很有用的 CSV);代码中提供的文件已在 Google Drive 上提供(这样我们就可以随时在运行脚本之前查看数据)。
我们分析来自爬虫的数据并使用 Pandas 构建数据框。
然后,我们会选择更关键的 URL:在提供的代码中,我主要负责分析 wordlift.io 网站,并只关注来自已有排名的英文博客的内容。您可以随意使用Pandas 过滤器,并将您自己的 SEO 知识和经验融入到脚本中。

然后我们抓取每个页面(在这里您可能需要定义网站在 HTML 中使用的 CSS 类来检测文章正文 – 从而阻止您分析页面上的菜单和其他不必要的元素)。
我们要求 BERT(具有可以微调的原始配置)为每个页面生成摘要并将其写入 CSV 文件。
使用生成的 CSV,我们可以回到我们心爱的 CMS 并找到导入数据的最佳方式(您可能希望在实际使用 BERT 之前整理其建议 – 再次强调 – 大多数情况下我们可以比机器做得更好)。
超级简单,计算量不太大,而且……环保

最后的想法和未来的工作

自动化和代理 SEO 的魅力在于,正如我喜欢 电报数据库 所说的那样,它让你在获得超能力的同时,仍然完全掌控整个流程。人工智能远非魔法,也远非(至少在这种情况下)取代内容作者和 SEO 人员,而是一个可以增强我们工作的智能助手。

提取式文本摘要存在一些明显的局限性,这与我们处理的是句子有关。如果网页中有长句,最终得到的摘要会过长,无法构成完美的元描述。我计划继续努力微调参数,以在表达力和长度方面获得最佳效果,但……目前为止,只有 10-15% 的摘要足够好,不需要我们的自然智能进行任何额外的更新。绝大多数摘要看起来不错,内容也很充实,但仍然超出了 160 个字符的限制。

当然,除了生成用于 SEO 的元描述之外,这些摘要还有很多潜力——例如,我们可以创建“精选摘要”类型的体验,为读者提供相关的摘要。此外,如果文章的语气足够对话化,摘要也可能变成一个可朗读的段落,我们可以用它来在语音设备上介绍 他们为什么排名在那里 容(例如,“WordLift 的最新文章是关于什么的?”)。所以,虽然我们不能让机器真正独自完成这项工作,但使用 BERT 进行摘要具有切实的价值。

当您读完这篇长文时

是时候提醒我们所有人,如果没有许多人和开明组织的努力,这一切都不可能实现,他们致力于开源技术,并且支持和鼓励世界各地的从业者让(嗯,希望如此)网络变得更好!

也感谢像Paul Shapiro和Hamlet这样具有数 电话号码 据驱动思维的特立独行者和 SEO ,让我对这个话题产生了兴趣并准备尝试新的工具!

在 Google Colab 上试用代码并通过 Twitter 或 LinkedIn 向我发送任何评论或建议!

想要使用 Woorank 和 WordLift SEO 管理服务来扩大您的营销力度吗?我迫不及待地想了解更多您所面临的挑战!

滚动至顶部