如何对知乎的回答,按照点赞量排序
文章目录
1. 为什么要对知乎的答案,按点赞量排序
知乎是一个质量挺高的问题平台,里面不乏很多有趣的、有用的回答。
经常用知乎的人,会发现一个问题:
知乎问题上的答案,不能按照 点赞量 排序。
这可能是知乎为了给其它普通的答案曝光的机会,避免高赞问题垄断答案吧。
如果答案比较少,还好处理,一会儿就看完了。
但是,如果遇到这种,有上万个答案的帖子,找到优质的内容就有点难了。 要是一个一个读下去,效率太低。 (这个问题有1万9千条回答)

2.如何对知乎的答案按点赞量排序
开始,想着可能有相关的插件,试了2款插件,效果都不好。
原因是知乎自己没有开放按点赞量排序的权限。

最后想了一个办法:
用免费的、傻瓜式的数据采集器–后羿采集器,采集知乎的答案和点赞数量,然后再用excel进行排序。 最后达到对点赞排序的效果。
写了个简单的教程
3.极简教程
3.1 安装后羿采集器
(这是一款基本功能免费的软件。一半我们用它的基本功能就够用了)
下载后,安装即可。

3.2 开始采集
打开刚刚安装好的后羿采集器,粘贴需要采集的问题
这里,我们以这个回答有1万9千个的问题:“男朋友家里只有20万存款,我该和他结婚吗?” 为例:
问题网址:https://www.zhihu.com/question/417546164
(备注:刚开始练习采集的时候,不要选取有这么多答案的问题,采集时间会过长。 建议选择有40~50个回答的问题,既能提现批量性的优势,又不会时间太久)

采集前,会跳出一个界面,登录知乎

只留下标题链接和点赞量两列,其余的都删除。 然后点击“开始采集”

4.数据处理
采集好的数据,打开后是这样的:

4.1. 按点赞量排序
为了给答案按点赞量排序,需要把excel表的最后一列,修改为可以排序的数字格式。
方法:选择最后一列,点击“分列”,按照空格分列。分列出点赞量(数字),然后那一列的单元格类型选择为“数值”,最后对这一列进行排序。
(涉及到的一些excel知识:如果不太明白,搜索关键字 “excel 分列”)




选择“点赞量”这一列,然后按照降序排列。

这就得到了一张按照点赞量排列的清单

4.2. 用批量网址打开工具,打开网址
http://www.openurls.com.cn/ (关键字:批量 打开 链接)
批量打开后,就可以慢慢地欣赏高点赞的帖子了。

5.结语
这套方法看起来挺复杂,实际上操作不难。
后羿采集器,在很多情况下,需要采集数据时,都能用到。 如果数据量大的时候,可能需要一段时间,才能采集完。中途出现暂停的情况,再次点击”开始“就会继续采集。
《男朋友家里只有20万存款,我该和他结婚吗?》这个帖子答案太多了。 我最后只采集了4000条,花了约4个小时。
刚兴趣的朋友,可以点击下方城通网盘的链接,看看这个按照点赞量排序的excel文件:
城通网盘链接: 男朋友家里只有20万存款,我该和他结婚吗? https://url64.ctfile.com/f/22676564-738975762-18cf17?p=2018 (访问密码: 2018)
注释:
- 测试过油猴的知乎排序脚本:
- 网址批量打开工具: http://www.openurls.com.cn/
- 后羿采集器网址: https://www.houyicaiji.com/
- 如何把excel表格中的文本链接变成可点击打开的网址链接(超链接)? https://www.html.cn/topic/excel/11212544047625.html
- 男朋友家里只有20万存款,我该和他结婚吗? https://www.zhihu.com/question/417546164
发表评论