前往小程序,Get更优阅读体验!
立即前往
发布
社区首页 >专栏 >可拷,很刑!一种基于ChatGPT的高效吃瓜方式的探索和研究。

可拷,很刑!一种基于ChatGPT的高效吃瓜方式的探索和研究。

作者头像
why技术
发布2023-08-23 12:44:48
发布2023-08-23 12:44:48
2670
举报
文章被收录于专栏:why技术why技术

你好呀,我是歪歪。

最近掌握了一个新的吃瓜方式,我觉得还行,给大家简单分享一下。

事情说来就话长了,还得从最近的一次“工业革命”开始,也就是从超导材料说起。

8 月 1 日的时候 B 站这个视频引爆网络:

随后“常温常压下的超导材料”直接霸占了各个新闻媒体的头条,引爆了话题,点燃了股市。

当时我虽然不懂“超导材料”,但是我懂流量啊。

所以当天晚上我硬是蹭了一波,花了半小时,写了这篇文章《牛逼,室温超导材料!》

蹭到了 6k 多阅读,是我平时技术文章的三倍。

而我平时写一篇技术文章是按照一周的时间来准备的。

你算算这个投入产出比,你就懂为什么“蹭流量”且蹭成功的感觉是多么的爽了。

有一说一,写那篇文章的时候,我都没带脑子的,各种信息往里面塞就完事了。

写的时候,我在不断的刷 B 站视频下的评论,试图提炼出一些有用的消息。

但是评论太多了,上万条,而我又没有那么多时间去约定并提炼消息。

所以,有一个念头在我脑海里面一闪而过:我完全可以把评论扒下来,然后喂给 ChatGPT,让它来帮我提炼一波,不就行了吗?

但是这个念头真的就是一闪而过,因为如果我按照这一套下来,当天晚上肯定写不完,毕竟为了“蹭热度”熬夜,就有点不值当了。

现在热点过去了,随着最近各种官方的实验结论公布,第四次工业革命“超温超压超导时代”已经结束了。

但是那个一闪而过的念头这两天又冒出了。

怎么办呢?

既然它在脑海里面这么调皮,那就办了它吧。

找接口

既然要把评论扒下来,肯定是要找对应接口的嘛。

凭借我多年的冲浪经验,通过不断下拉评论区触发“正在加载”接口:

啪的一下,很快啊,我就找到了这样的接口:

然而很奇怪的是,这个接口,不管我拉多少次,它的入参是一模一样的:

但是每次请求返回的内容,也就是这个部分确实又是不一样的:

按理来说,这种一般都会采取偏移量分页的方式和后端交互,即每次请求的时候把当前请求获取到的最大的 ID 返回给后端,让后端从这个 ID 开始进行 limit 查询。

在 B 站的接口里面,我没有看到这样的相关信息,我能看到的是每次请求都一模一样。

反正就是很纳闷,左思右想没搞明白怎么回事。

于是我在网上搜素了一番,没有找到原因,但是找到了“过来人”之前使用过的另外一个接口:

https://api.bilibili.com/x/v2/reply/main?jsonp=jsonp&type=1&oid=" + videoId + "&mode=3&plat=1&next=" + i

其中 oid 是视频的 oldId,next 代表翻页。

关于为什么有一个 oid ,作为 B 站的老用户,我必须得多哔哔几句,显摆一下。

B 站早期的视频编号是av+数字,后来才改为了现在的bv+字母数字的组合。

但是这两个地址,其实指向的是同一个视频:

这可是老用户才知道的小秘密。

那么我是怎么拿到这个视频的 oid 呢?

很简单嘛,前面已经出现过了:

所以,当我对这个链接发起请求的时候,就能拿到对应视频下的评论:

https://api.bilibili.com/x/v2/reply/main?jsonp=jsonp&type=1&oid=956733745&mode=3&plat=1&next=1

通过一个 for 循环,不断的变化 next 进行翻页,就能拿到这个视频下的评论。

写代码

接口搞定了,接下来就是写代码了。

什么,你不会以为我会直接把代码给你吧?

你这想法可真刑啊,代码写的越来越有判头了。

我只是给你推荐一个你可能会用到的小工具,用起来还是比较巴适的。

前面通过接口返回的数据,我们知道这个接口返回的是 json 数据。

当然,我们可以直接操作 json,但是一般来说我更习惯把 json 转对象。

然而,这个 json 字符串一层又一层的,格式化之后能有 2w 多行,处理起来特别麻烦:

巧了,我刚好知道一个网站干这个事情特别的厉害。

https://www.bejson.com/json2javapojo/new/

我直接把整个 json 串扔进去,它就帮我生成了对应的 Java 类实体对象。

好家伙,55 个对象,这代码提交量蹭蹭上涨啊。

反正我只是用了我需要的三个类:Replies、Member、Content。

把 Json 转化为对象之后,就看你自己关注的是什么信息了。

比如我就关注这几个信息,在代码编写完成之后,发起调用,在控制台就能输出这些信息:

System.out.println("用户名称:" + repliesObj.getMember().getUname() + ",回复内容:" + repliesObj.getContent().getMessage() + ",点赞数:" + repliesObj.getLike() + ",评论数:" + repliesObj.getRcount() + ",评论时间:" + new Date(Long.parseLong(repliesObj.getCtime() + "000")));

但是这个时候出现了一个很奇怪的点,数据不知道怎么的,就跑到了我的数据库里面。

反正就特别神奇吧,甚至还按照点赞数给我排好了序。

有了数据,接下来的事情,我们为什么不问问神奇的 ChatGPT 呢?

开始你的表演

当我兴致勃勃的按照点赞数排序,把前 100 的评论都喂给 ChatGPT 之后:

它说,我的话太多了,拒绝回答我的问题:

这玩意你就想难住歪师傅?天真。

于是,我先喂给了它这段话:

然后,分了四段喂给它了评论,并让它开始给我分析:

一眼望去,感觉还行,至少是结合了材料在进行回答,没有胡言乱语,试图糊弄歪师傅。

于是,我又让它站在“超导专家”的角度对这些评论进行了分析,回复的内容也还说的过去:

它的最后一段话,甚至还真的和这次事件挺吻合:

总体来说,作为超导专家,我会强调科学研究的严谨性、准确性和透明性。超导领域的成果对科学、技术和社会都具有重要意义,因此在任何宣称超导成果的情况下,都应该遵循科学方法和伦理准则,确保准确性和可靠性。同时,科学传播也应该平衡信息的准确性和公众的期望,以避免误导和不必要的炒作。

然后,我定点分析了点赞最高的前几名评论。

首先从数据上来看,点赞数最高的是这个评论:

于是我问它怎么看待这个评论:

在我给它简述了陈睿和 B 站的关系之后,它给出了这样的回答:

接着,我分析了点赞数第二的评论:

看到这个回答的事情,其实我是有一丝丝的震惊的。

因为我甚至都没看懂这个隐喻:

评论者使用了隐喻,将超导材料比作一片脆弱的蝴蝶翅膀,通过这种比喻,强调了超导材料的微弱和脆弱性质

我之前看到这个评论的时候只是想起了蝴蝶效应,但是经过它这么一提醒,好家伙,确实是一个隐喻。

接着,我还让它给我分析了这个评论:

最后,我还发出了一个灵魂疑问:

当它吐出这个回答的时候,我确信我在评论区是没有注意到这个评论的。

于是在数据库里面找了一下,找到了。

确实,它没有乱说,这个评论是我喂给它的:

因为只有 94 个点赞,所以可能分页比较靠后,我在页面没有翻到。

呃呃呃~

这个评论,确实好笑。

回忆杀

你猜我这里为什么要把 videoId 作为一个参数传递进来呢?

因为通过分析 B 站超导视频的评论区,我成功地赋能了自己的能力。现在,只需要在不同视频中更换那串神秘的视频 ID,我就能够运用我的抓手,轻松地对标不同评论区的特点,将精华沉淀下来,实现信息的对齐与拉通。

这不仅是一种小步快跑的策略,更是一种颗粒度的操作,通过组合拳的方式,倒逼自己不断强化认知,实现价值的转化。

通过这个黑科技,在这个快节奏的互联网世界里,我能够快速响应各种信息,将其转化为有意义的洞察力。

不论是在哪个领域的视频,我都能够以小步快跑的方式,将信息的精髓抓取,实现对价值的转化。

现在我把这套组合拳教给你,希望你能活学活用。

比如,我给你举个例子。

这是小破站的“入站必刷”视频:

https://www.bilibili.com/v/popular/history

前两个视频,一个是才浅的“黄金面具”,一个是何同学的“苹果电脑”,巧了,我都看过。

黄金面具的 oid 是 715024588。

苹果电脑的 oid 是 797663148。

在才浅,黄金面具的评论区,按照点赞数排序,是这样的:

又看到了一个我们熟悉的 ID,一个类似的评论内容:

石锤了,小陈四处水经验。

在何同学,苹果电脑的评论区,按照点赞数排序,是这样的:

排名第一的,是何同学自己的求三连评论。

排名第二的,看起来像是一个乱码,我不知道为什么,于是我去评论区实地考察了一下:

看到这个评论的瞬间,我就心领神会了。

这个笑脸,何同学在这个视频快结束的时候说了一句:

如果你使用的是支持面容识别的iPhone,那么每当你打开面容ID及密码,就会看到一个笑脸,那是一个来自1984年的微笑

这文案,是真的吊,一句话把人文情怀拉满了。

好吧,那我就还是给你粘出来,让你直接“现原形”:

在必刷视频里面,我还看到了这个视频,瞬间思绪被拉回了青春躁动的学生时代:

它的 oid 是 902007,很短,代表它有点历史了。

可能很多朋友都不明白为什么我会被这个视频的封面给抓住眼球,没关系,每代人有每代人的回忆。

我去扒了一下这个视频评论,点赞最高的评论有近 10w:

我仔细的阅读了一下这个评论,突然就有点笑不出来了:

视频是 2014 年发的,这个评论是 2017 年写的。

2017 年,梁逸峰同学,大学一年级,因为这个视频带来的相关恶搞信息,被校园欺凌了很长一段时间。

当然,除了上面这些视频之外,还有何同学的入坑之作:

我又重温了一遍。

再次看到这个画面的时候,虽然这是 2019 年的视频,虽然已经过去了 4 年有余的时间,虽然我已经使用上了 5G 网络,切身体会到了视频里面的速度,但是我还是按捺不住的震撼,正如我当年第一次看到这个视频一样的震撼。

同样的,我把评论区喂给了 ChatGPT,让它选出了最有意思的一条评论:

我们只有借助“后视镜”的方法,把自己置身于未来的可能性之中,才能理解技术对当下的意义。

在这个视频里面,何同学在探索“5G 有什么用”这个问题的时候,苦苦不得其道。

于是突发奇想,为什么不站在 2019 年,查询一下当年人们对于 4G 的看法呢?

于是,就有了这个关于“后视镜”的评论。

推荐👍改良版的雪花算法,是你的了。

推荐👍面试官:一个 SpringBoot 项目能处理多少请求?(小心有坑)

推荐👍兄弟,不要试图在业务代码中炫技。

推荐👍这个源码肯定是有BUG的!

推荐👍一个普通程序员磕磕绊绊,又闪闪发光的十年。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-08-13,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 why技术 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 找接口
  • 写代码
  • 开始你的表演
  • 回忆杀
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档