AI 复兴 RSS ? - 少数派

Omnivore

Read on Omnivore Read Original

根据维基百科的定义,**RSS 的全称是 RDF Site Summary(RDF 站点摘要) 或 Really Simple Syndication(简易信息聚合),**RSS 是一种消息来源的格式规范,用来同步网站更新的内容并自动通知给订阅者

今天 RSS 上是一个非常复古的词汇。

RSS 出现的背景,是在 web 1.0 时代,人们用来解决信分散的一种协议。

当时,互联网的网站越来越繁多,为了获取不同的信息,人们不得不打开各种各样的网站。RSS 的出现,让用户可以在不打开网站的情况下,通过 RSS 链接获取到 RSS 更新的内容。

RSS 将多个网站的内容进行整合,以摘要的形式呈现,有助于订阅者快速获取重要信息,并选择性地点开阅读。

对于我这样的互联网内容阅读者来说,是一个非常好用的信息同步方式。我几乎每天每周都会使用 RSS 功能。

将我喜欢的网站、个人博客、推特、即刻等网站的动态,生成 RSS 订阅链接后,在 RSS 阅读器中接受最新的内容并阅读。享受在自己的 RSS 订阅的信息中发现好内容,是我每天必要的冲浪时刻。

如图,我订阅了很多 RSS 链接后,在 Inoreader 中查看。(最近开始切换到 Readwise Reader)

RSS_AI_01

RSS_AI_02

既然 RSS 这么好用,为什么 RSS 并没有普及呢?

这是一个很好的问题。

我会先讲讲商业公司的故事,再用我的理解来解释。

订阅制的衰落,算法推荐的兴起

在 Web 1.0 时代,RSS 出现是人们用来解决信息管道化的一种协议。

当时,互联网的网站越来越繁多,为了获取不同的信息,人们不得不打开各种各样的网站。也正是在此时,RSS 的出现,让用户可以在不打开网站的情况下,通过 RSS 链接获取到 RSS 更新的内容。RSS 将多个网站的内容进行整合,以摘要的形式呈现,有助于订阅者快速获取重要信息,并选择性地点开阅读。

但随着进入了 Web 2.0 甚至 3.0 时代,RSS 并没有推广开来,而是慢慢没落了。

Google Reader 的关停

实际上,大厂们也关注过 RSS。

曾几何时,Google 做的 Google Reader 也是最好用的 RSS 阅读器。

但在 2013 年,Google 宣布,计划关闭其运营了 7 年的,受欢迎的 RSS 阅读器服务 Google Reader。

在这篇公告中,Google 表示

谷歌表示,它之所以要关闭谷歌阅读器,是因为 “谷歌阅读器的使用率已经下降,作为一家公司,我们正在将所有精力投入到更少的产品上”。作为目前最流行的 RSS 聚合器之一,谷歌阅读器的消亡可能意味着 RSS 协议本身的灭亡,因为自从社交分享服务兴起以来,RSS 协议的受欢迎程度已经逐渐减弱。

无论如何,RSS 也只是内容分发方式的其中一种 —— 订阅。随着通过搜索获得信息,通过社交软件的推荐获得信息逐步成为主流,订阅制度的信息获取渠道,RSS 订阅一步一步变得衰落。

Google Reader 关停: https://www.theverge.com/2013/3/13/4101144/google-shuts-down-reader-rss-aggregation-service

字节开始跳动的时候

而张一鸣也在 2013 年发布了文章《为佩奇关闭Google Reader的魄力叫好!》,现在文章的原链接已经无法访问,我们通过网页快照,找到了这篇文章。

RSS_AI_03

我发现,要成为Google Reader常用用户必须具备两个特点:

一、信息组织能力强,明确知道自己想要的信息在哪。

二、自制力强,有规律的整理并能控制好RSS源的数量。

显然,能达到这两个条件的用户并不多。这也是为什么愤慨的Google Reader用户多是媒体从业人员。一款本该面对大众的产品却只能满足的是很小的一部分用户的需求,那就注定不会走得长远。

文章中,张一鸣的核心观点是:RSS 这种“用户自订阅”的模式,对用户的要求太高了。RSS 订阅的模式,要求用户有较强的信息获取能力、工具使用能力和自制力。

而即便这样,用户在使用 RSS 的过程中也会发现,随着 RSS 订阅的内容越来越多,信息的噪声会变得很大。RSS 阅读器中往往充满了低质量或无关的文章。

而要解决这个办法,无疑只能提供更强大的信息筛选能力。其中一个方向就是——“个性化推荐系统”

也正是在这样的背景下,张一鸣开始了他关于个性化推荐系统的尝试,慢慢孕育出了今天的今日头条、抖音等产品。才有了今天的字节跳动,这家心脏和字节只有一个能跳动的公司(属于调侃,勿当真)。

张一鸣的原文链接:http://m.techweb.com.cn/article/2013-03-14/1283033.shtml

内容分发之争

在这些宏大商业叙事的背后,我想想真正的原因是内容的分发方式。

实际上,整个互联网产业,都在信息在线化后的基础上,围绕信息的生产和分发,在做商业。

例如电商,不过是将过去线下实物的信息在线化以后,通过图片和各种参数信息,让用户可以直接在网络上寻找内容。

所以,所有的互联网行业,本质上都是关于“信息”的事情。

那么让我们来看看今天互联网上的内容:

首先,所有的内容最终都来源于人,也就是创作者们。

创作者们创作了内容后,内容是怎么分发到内容消费者手里的呢?

按照我的理解,有以下几种方式:

  • 搜索分发:使用搜索引擎搜索内容
  • 订阅分发:订阅某个信息源的内容
  • 专家推荐:听取专家/网站的推荐
  • 社交推荐:听取朋友的推荐
  • 算法推荐:推荐算法推荐内容

每个内容分发方式都有其自身的利弊

在四种内容分发的排序上,我有一些小心机。也就是,从第一到第四,用户的主动性是在逐步往下降的。主动搜索内容,主动性最强。而后是各个推荐。

实际上整个互联网行业,就是一个巨大的内容分发场地。

  • 代表着搜索分发的 Google 和百度;
  • 代表着订阅分发的公众号和 RSS;
  • 代表着专家推荐,如少数派的小编,知乎的大V,微博的 KOL 等等;
  • 代表着社交推荐的微信,Facebook;
  • 代表着算法推荐的今日头条,抖音等;

各个内容分发方式,用着适合他们的方式。

各种分发方式适合分发不一样的内容,也造就了不同的商业

搜索

搜索是非常长尾的,几乎所有的内容都可以搜索。

但同样的也会有人针对搜索引擎做优化,也就是我们常说的 SEO,前段时间,豆包就利用模型生成各种内容,后针对性地做 SEO,得到了很高搜索权重排名。但那些内容不一定是用户所需要的。

Google 因为发明了关键词广告,也让搜索引擎走上了使用体验和商业模式的巅峰。

订阅制

本质上是跟踪一个信息源。可想而知,通过订阅制跟踪的信息源,往往作者都是在持续生产优质内容。就好像我的公众号(王婆卖瓜),是值得你订阅的信息源。但是订阅制的盘子非常小的,如张一鸣所说,其对用户的要求太高,只能服务于小众用户的群体。

专家推荐

很普遍的一种推荐方式,不管是直播电商的主播们,还是少数派的创作者,亦或是微博的大 V,还是小红书的博主,甚至是微信里的一个微商,只要是一个 KOL,往往都可以在其擅长的领域内推荐内容。但这需要你选择专家,选择适合你的 KOL。

社交推荐

也就是朋友之间的推荐内容。

有趣的是,张小龙在开始做视频号的第一年曾经说,基于社交关系的推荐,更适合推荐一些中长的内容。

这也是为什么公众号可以在微信中做起来订阅制本来是个很小的盘子,但有了社交推荐的加持,就会有很多十万加。也是为什么视频号的内容,普遍会比抖音长,毕竟只有高质量的内容, 你才更愿意分享给你的朋友。当然,最近两年,微信也陆续上线了“看一看”和“内容推荐”等,加上了个性化推荐的部分。

算法推荐

从商业的利益上讲,算法推荐是非常成功的。张一鸣正是因为坚信算法推荐的价值,才创造了今日头条和抖音两款产品,取得了商业上的巨大成功。但是从个人使用的角度来讲,算法推荐仅仅能在娱乐上取的高效。学习是反人性的。

人性使然,即便今日头条和抖音上不缺乏高质量的能内容,但算法工程师们,为了更好的商业利益,更倾向于给大众推荐人性里更喜欢的娱乐内容。字节跳动显然也是在高端内容推荐上实践过,在基于算法推荐高质量内容 APP 上屡有尝试,但最终都以失败告终。

所以,RSS 的衰落,本质上是随着互联网上的信息越来越多,搜索引擎,SNS,社交软件,算法等新的方式出现以后,对原本的订阅制度的争夺。

而互联网中的大多变革的产品都随着相应的技术变革应用所产生,而背后又都伴随了商业模式的彻底升级革新而兴起主导了一个网络时代。算法推荐、搜索系统、社交推荐等,想让是更符合商业模式的设计。也加剧了 RSS 的衰落。

IS RSS DEAD?

如果你在 Google 中搜索 “IS RSS DEAD” ,你会发现很多搜索结果。

这也是 RSS 神奇的地方,RSS 作为一个前朝遗老,Web 1.0 的产品,没有被淘汰,也没有变化,而是保持着小众,一直活到了今天。

image-20240611020519713

在 Google Reader 关停后若干年里,RSS 并没有消亡。

Feedly,Inoreader,Reeder 等阅读器相继出现,快速补全了 Google Reader 带来的或空缺。

这几个产品,今天来看做得最好的是 Inoreader,Inoreaer 给出了很多关于「噪声」的解决方案,例如提供了完善的“规则过滤”功能,再例如,给端内的 RSS 订阅源提供了热度标签,帮助用户筛选内容。

RSS_AI_04

同样地,在 RSS 没落以后,同时也是出于商业利益的考虑,越来越少网站提供 RSS 订阅源。

就出现了像 RSSHub 这样帮助用户更好地订阅网站的服务,完全免费开源,是非常好的产品。现在无法用 RSS 订阅的网站,我都尝试在 RSSHub 中找到解决方案,大部分网站可以找到解决方案,是非常好用的产品。

RSS_AI_05

今天,说起 RSS,会是一个很小众的那批,对内容有要求的用户们。

而这批用户中,大部分都是拥有开发能力的人,所以即便大厂们不再追逐 RSS,这个小众群体也不断在用自己的方式延续 RSS。

没办法,谁让 RSS 是真的好用。

这是 RSS 的现状。

AI + RSS = ?

接着,我也想讨论一下

在 AI 时代到来以后,能否给 RSS 带来一些变化呢?

先说结论,AI 可以帮助 RSS 解决小众的问题吗?恐怕不行,毕竟学习是反人性的。只能顺从人性,无法改变人性。

但是 AI ,可以帮助小众用户们,更好地使用 RSS。

在使用 RSS 进行订阅的过程中,目前在我自己的使用过程中的痛点,是RSS 订阅的内容太多了,噪声太大,每天从 RSS 中寻找自己感兴趣的内容,消耗了大量的时间。

利用标签——更好地筛选内容

虽然,RSS 用户们优先订阅的是优质的信息源。

但是因为优质信息,对每一个人的标准是不一样的。每个人的兴趣不同,层次不同,优质信息当然也不同。一位大学教授,在看到非常优质的科普类视频的时候,也无法得到新的认识。

所以,无可避免的,信息越多了以后,RSS 的噪声还是会增加。订阅的用户可能偶尔会发一些日常的信息,与你的兴趣点无关,需要过滤。

使用 AI,可以尝试性地解决这个问题。

基于大语言模型,可以对信息进行打标签。

例如使用 prompt 处理内容时,会得到其标签值

# 角色
你是一个内容分类大师
 
# 任务
我会给你提供一段内容,你的任务是阅读内容并给出 3 个以上内容的所属的标签
 
## 标签的释义
标签通常是领域、学科或专有名词。
 
## 思考过程
让我们一步一步思考
1. 阅读内容
2. 思考内容与什么标签有关
 
# 受众
标签的受众是将要阅读这份内容的人,标签可以帮助他快速了解内容所属的领域,涉及的内容等
 
# 输出格式
{
"tags":["tag1","tag2",...]
}

当然很多用户可能本来已经有了自己的标签体系,AI 打出来的标签并不能完美地融入到已有的标签体系中。但如果 AI 生成的标签体系单独地成为标签体系,还是可以帮助用户更好地分辨内容。

RSS_AI-06

在 RSS 协议中提供 AI 摘要

第二是可以对 RSS 进行简单地摘要,这是我在《基于 Kimi Chat 的 AI 渐进式阅读法》中已经提到过的方法。

使用大语言模型,对 RSS 的全文内容进行一次「一句话总结」或是「起一个标题」可以更好地帮助分辨是否是我们需要的内容。

RSS_AI_07

例如上图,我利用 Readwise Reader 的 Ghostreader,也就是 AI 功能,对信息源进行一次总结后,我在不需要点开全文的情况,就可以知道链接内容, 帮助我更好地做判断。

这也更符合 RSS 的另一个定义:RDF Site Summary,将摘要同步给订阅者,帮助订阅者更好地分辨内容。

更符合商业化的方案

同时,这也是一个更加符合订阅者的商业利益的选择。

过去支持全文 RSS 的网站,网站会将全部内容同步给用户,用户虽然可以直接在 RSS 阅读器中阅读内容,但是网站却失去了用户的访问和点击。会减少网站的 SEO 排名等。网站中的广告页无法曝光,网站失去了商业利益。

这也是越来越少的网站支持 RSS 的原因,RSS 是一个对用户有利,但是对平台不利的协议。例如少数派这个网站,就曾经表达过 RSS 让平台失去了很多点击。

如果可以使用新的模式,网站将全文的元数据,摘要,大纲等信息同步给订阅者,而订阅者根据这些信息判断是否要阅读全文,当需要阅读时,进入原文网站进行阅读。

这或许是更符合商业利益的模式。

过去 RSS 协议支持字段中,每一个 item 包括标题(Title)、描述(description)、发布时间、原文链接等。刚好可以在描述中提供原文的原信息、总结和大纲。所以这是一个可行的方案。

<item>
<title>
<![CDATA[ 发布了: 今天在研究 RSSHub 服务自建的事情,阅读了 RSSHub 的文档。 https://docs.rsshub.app/guide/parameters 才知道 RSSHub 比我想象中更强大。 原来一直认... ]]>
</title>
<description>
<![CDATA[ 今天在研究 RSSHub 服务自建的事情,阅读了 RSSHub 的文档。<br>https://docs.rsshub.app/guide/parameters <br><br>才知道 RSSHub 比我想象中更强大。<br>原来一直认为 RSSHub 就是个快速发现和生成 RSS 链接的插件。<br>好家伙原来 RSSHub 在底层上就支持了很多功能,如<br>—内容过滤:支持针对字段过滤,正则表达式过滤<br>—内容排序<br>—全文访问:强行获取全文内容<br>—GPT总结:GPT 总结内容<br><br>再加上 RSSHub 最近正在开发的 RSS 阅读器,有点期待。<br>https://github.com/RSSNext/follow ]]>
</description>
<pubDate>Tue, 28 May 2024 10:47:25 GMT</pubDate>
<guid isPermaLink="false">https://m.okjike.com/originalPosts/6655b63d946a0b411d43e050</guid>
<link>https://m.okjike.com/originalPosts/6655b63d946a0b411d43e050</link>
</item>

但是使用 AI 对文章总结的 token 消耗费用,应该由谁来承担呢?

从经济效益的角度来讲,如果由 RSS 订阅源提供者来提供总结,而非每一个用户自行总结,是一个成本更低的选择。

平台可以思考,提供 RSS 订阅,是否可以给网站带来更多的点击量,这样的点击量能否覆盖用于总结的 token 费用,如果可以,应当由平台来提供。如果不可以,平台也可以讲这样的功能作为一个付费功能。

当然,也可以由一个更加开放的平台来承担这一功能。例如 RSSHub,如果 RSSHub 提供了这样的总结服务,用户向 RSSHub 付费,也是可以的。这样的商业模式很值得探索,总有一种合理的方式。

类比来说,做播客总结服务的 Podwise,就是用 AI 处理同一份内容后,将同一份内容提供给不同的会员,一次生产,服务多名用户,是比较合理的商业模式。

RSS 的解决方案是个性化推荐?

前面两种方案,虽然通过 AI 来提效,帮助用户更好地使用 RSS。

但始终还是需要付出人力成本。

那么有没有什么办法让 RSS 来推荐内容,而非人工去筛选呢?

往这个方向思考,前面已经讲到了每个人,因为兴趣不同,层次不同,对于优质信息的定义是非常个性化的。如果往这个方向思考,或许解决方案就是算法的【个性化推荐】

想到这里还是有点感慨,会不会在十多年前的某一天,张一鸣也是因为在使用 RSS 的过程中有了这种想法,而想到了个性化推荐呢?

确实,个性化推荐是解决 RSS 阅读问题的解决方案。

但最终却用个性化推荐的方式,使用推荐算法,成就了一个娱乐内容为主的抖音,想来也是神奇。

基于语义的排序方式

讲讲我自己的想法。

我目前只是有一些脑海中的方案,还没有实践过。描述出来给大家。这部分内容可能比较偏技术,了解自然语言处理或是大语言模型的朋友可以看看。

在做阅读的时候,实际上我是会有自己关注的领域、以及感兴趣的问题。

所以有没有可能,在我设置了自己感兴趣的领域,例如 AI 效率 商业 互联网… 等等后,结合前文见到的 AI 打的标签,将标签与标签之间进行向量化的匹配,相似度较高的内容,会得到更好的分数,并按照这个分数来排名,让我可以优先读到我感兴趣的内容。

向量化,简单地说就是利用大语言模型(Elmo)将文本转化为一个向量,向量中保留着文本中的大部分信息。在过去,做

同样的,我设置的感兴趣的问题,例如”如何用 AI 处理零散的信息?””如何更好地做只是管理?”等等,将这些问题与第二部中的 RSS 的内容摘要,都进行向量化,匹配最相似的内容后,再使用 ReRankder 模型进行重排序,是不是也可以得到我想要阅读的内容呢?

这两个方向,后续有机会我会实践。再给大家分享结果。如果是做 RSS 阅读器相关的朋友,也可以关注关注这两个思路。

愿景

希望真的有一天,我不再每天清理我的 RSS 订阅,而只需要筛选部分自己最感兴趣的内容。

剩下的内容,抛给 AI 总结就好。真正将 RSS 文章,作为一个信息库,他可以缓慢增长,当我再次需要时,还是可以找回他们。而不是每天都必须清理完 RSS 订阅的文章。

RSS 阅读器

RSS 非常小众,但依旧有很多开发者们,在关注这个领域。为了让这批小众的群体更好地使用 RSS。

今年以来,我就关注到 4 款 RSS 阅读器产品,理念上有创新,推荐大家关注。

Readwise Reader 的 RSS feed 功能

Readwise 是我已经夸了不止一次的阅读器应用。

在最近更新的功能中,Readwise Reader 增加了 RSS 的订阅源管理功能,结合原来已经有的 Ghostreader AI 摘要和打标签的功能,可以一定程度上,实现上文中我说道的第一第二点优化方案。

并且 RSS 订阅的文章,可以很方便地 Readwise 的 Inbox(稍后阅读)中,流程很顺畅。

虽然目前仍旧不完美,但也讲究能用,所以也是目前我正在使用的 RSS 阅读器。

RSS_AI_08

Follow - RSSHub 开发的 RSS 阅读器

RSSHub 的开发者 @DIYGod 正在开发一款新的 RSS 阅读器应用,并且他在 Twitter 中分享了开发经过,目前预计 7 月份会上线。

从他分享的视频来看,目前已经支持了规则过滤,信息流等功能。我很期待这款产品

DIYGod 的推特主页:https://x.com/DIYgod

follow 的推特主页:https://x.com/follow_app_

RSS_AI_09

Feeeed - Arc 浏览器团队出的 RSS 阅读器

Feeeed 是目前很火的 Arc 浏览器团队出的 RSS 阅读器。

Arc 的出品,产品的交互和界面当然没的说。我将我的 RSS 订阅源添加到应用中后,效果如图。并且 Feeeed 团队对于 RSS 阅读器的内容排序功能似乎也有自己的解法。提供了 Best Var iety(最佳种类) 和 Chronological(按时间) 两种排序方式。虽然不知道 Feeeed 的 Best Variety 背后的算法如何?比较可能是按照原文链接在 Arc 阅读器中的访问排名来排序,但这或许也是 Feeeed 团队自己的解法。

比较可惜的是,Feeeed 目前只有 iOS 客户端,因为我习惯在电脑中阅读 RSS 内容,所以还没使用起来。

Feeeed 官网:https://feeeed.nateparrott.com/

RSS_AI_10

Readary 阅牍 - 独立开发者的作品

在即刻看到了 @开发者山石 开发了这款应用。

Readary 阅牍,山石因为同样是一个 RSS 受众,但苦于市面上并没有符合他期望的 RSS 阅读器,所以自己花了一年的时间开发了 Readary。

支持独立开发者,我自己也付费体验了一下,产品目前还处于打磨阶段,基本的阅读和规则过滤等规则已经具备。但仍有较多打磨空间。

RSS_AI_11

比较可惜的是,Readary 目前只有 iOS 客户端和 Mac 版应用,还没有 Web 端,所以我并没有作为首选阅读器。感兴趣的朋友也可以关注官网看看。

Readary 阅牍的官网:https://readary.top/

在这个小众的市场里,依旧坚持做开发,并不容易。

大厂不愿意进来,因为商业利益不厚。同时也正是小团队、独立开发者的机会。

希望这些产品做得越来越好。

结语

这篇文章从我的视角讲了 RSS 的过去,现在,及未来。

作为一个每天都使用 RSS 的用户,我每天都在享受的 RSS 带来的订阅信息的便利,同时也不得不花出时间去处理。从我的视角,讲述了 RSS 的阅读器还有很多值得期待的地方。

最后也推荐了几款,目前我正在关注的,让我觉得“有点意思”的 RSS 阅读器。RSS 订阅,也只有搭配好的阅读器,使用起来才畅快。

对每一个对内容有要求的人,RSS 都是一剂良药,也是真的好用。这就是这篇文章存在的原因。

okay

希望这篇文章,能对你有帮助,让你认识到了 RSS?或是让你看到了真实的 RSS 使用者的声音?或是产生了一点共鸣。

**如果有的话,请给我的文章点赞,在看,或是转发给你觉得需要的朋友。**现在微信中的公众号,上新了内容推荐算法,对创作者的文章阅读和转发比例有了更大的要求,希望可以多帮点点转发,感谢。

潦草学者的朋友们

我正在计划组建一个读者交流群。

作为潦草学者的朋友们,可以在群里交流 AI、效率工具、时间管理、知识管理、互联网商业等等话题。如果你对群聊感兴趣的话,可以添加我的微信 liaocaoxuezhe,说明自己喜欢和擅长的领域,就可以进入到群聊中。也可以打赏本文,交个朋友~欢迎多交流讨论。

image-20240611014800305